![]()
哈嘍,大家好,今天給大家拆解 AI 創(chuàng)作圈的顛覆性工具 ,港大開源的 ViMax 框架,輸入一句話就能讓 AI 自編自導(dǎo)自演完整短劇,1.4k + 星標(biāo)背后,普通人當(dāng)導(dǎo)演真的要成真了?
當(dāng) Sora、Runway 還在為 10 秒片段的視覺效果內(nèi)卷時(shí),香港大學(xué)黃超教授團(tuán)隊(duì)開源的 ViMax 框架,直接將 AI 視頻創(chuàng)作推向了 “全流程自動(dòng)化” 時(shí)代。
這款在 GitHub 迅速斬獲 1.4k + 星標(biāo)的工具,通過多智能體協(xié)同架構(gòu),讓 “輸入一句話,產(chǎn)出一部劇” 從想象落地。
![]()
![]()
多智能體打造 “AI 全能劇組”
ViMax 的革命性在于將影視制作的復(fù)雜流程,拆解為五個(gè)專業(yè)智能體的協(xié)同作戰(zhàn),徹底打破了 “專業(yè)工具 = 高門檻” 的魔咒.
支持 “想法→小說→劇本” 三種輸入模式,哪怕是 “太空貓咪宇航員” 這樣的模糊創(chuàng)意,也能自動(dòng)補(bǔ)全三幕式結(jié)構(gòu)劇本,包含場(chǎng)景描述、角色對(duì)話和節(jié)奏安排,平均處理時(shí)間僅 2-3 分鐘。
運(yùn)用專業(yè)電影理論,為每個(gè)場(chǎng)景設(shè)計(jì)鏡頭語言,從攝像機(jī)運(yùn)動(dòng)軌跡到光影布局,甚至精確到每個(gè)鏡頭。
![]()
采用 “先圖后視頻” 策略,先鎖定角色造型、場(chǎng)景風(fēng)格等核心元素,再生成動(dòng)態(tài)片段,避免跨鏡頭 “變臉” 問題,視覺一致性比普通工具高 80%。
通過視覺語言模型對(duì)多版本候選內(nèi)容評(píng)分,未達(dá)標(biāo)則自動(dòng)調(diào)優(yōu)參數(shù)重生成,確保輸出符合專業(yè)標(biāo)準(zhǔn)。
全程統(tǒng)籌協(xié)調(diào),維護(hù)全流程風(fēng)格統(tǒng)一,同步各智能體信息,堪稱 “AI 劇組總指揮”。
![]()
更驚喜的是,ViMax 還內(nèi)置音效自動(dòng)匹配功能,能根據(jù)場(chǎng)景智能添加背景音、對(duì)話音效,成品感直接拉滿,無需額外剪輯配樂。
![]()
破解長(zhǎng)視頻兩大核心瓶頸
此前 Sora、Runway 等主流工具卡在長(zhǎng)視頻生成的兩個(gè)關(guān)鍵點(diǎn),而 ViMax 給出了突破性解決方案:
采用 “事件 - 場(chǎng)景 - 鏡頭” 三層遞歸分解策略,將復(fù)雜故事拆解為可執(zhí)行的模塊,再通過 RAG 檢索增強(qiáng)技術(shù)構(gòu)建全局知識(shí)庫,確保角色性格、情節(jié)邏輯不跑偏。
比如改編長(zhǎng)篇小說時(shí),能自動(dòng)提煉核心劇情,拆分成分集視頻,保留人物關(guān)系和關(guān)鍵轉(zhuǎn)折。
![]()
通過圖網(wǎng)絡(luò)追蹤視覺元素,構(gòu)建角色、場(chǎng)景、道具的依賴關(guān)系圖,后續(xù)鏡頭生成時(shí)以先驗(yàn)內(nèi)容為基準(zhǔn),而非從零創(chuàng)作。
針對(duì)多視角場(chǎng)景,還會(huì)生成過渡視頻校準(zhǔn)空間幾何,避免 3D 布局沖突,讓正反打鏡頭的空間關(guān)系完美契合。
對(duì)比來看Sora最長(zhǎng)僅能生成 20 秒視頻,Runway 更是局限于 4 秒片段,而 ViMax 已能穩(wěn)定輸出 5 分鐘內(nèi)的連貫短劇,且視覺一致性達(dá)標(biāo)率超 85%。
![]()
![]()
普通人的創(chuàng)作效率革命
GitHub 上已有大量用戶實(shí)測(cè),ViMax 讓創(chuàng)作門檻大幅降低,兒童科普博主輸入 “兔子幫小鳥找鳥巢” 的想法,1 小時(shí)就獲得 1 分 30 秒的吉卜力風(fēng)格視頻,包含完整劇本、分鏡圖和配音,更新頻率從每周 1 更提升到 3 更。
將短篇科幻小說《太空貓日記》導(dǎo)入系統(tǒng),3 小時(shí)生成 3 集系列視頻,自動(dòng)拆分 “出發(fā) - 遇險(xiǎn) - 返航” 劇情,鎖定主角特征,關(guān)鍵情節(jié)無一遺漏。
![]()
操作也極為簡(jiǎn)單,只需克隆項(xiàng)目、配置 API 密鑰、輸入創(chuàng)意需求,運(yùn)行腳本即可等待成品,新手 10 分鐘就能上手,無需任何編程或剪輯基礎(chǔ)。
打破商業(yè)工具壟斷
ViMax 采用 MIT 協(xié)議開源,核心代碼完全公開,開發(fā)者可自定義風(fēng)格模板(如賽博朋克、宮崎駿風(fēng))和鏡頭參數(shù),無生成次數(shù)限制和付費(fèi)壁壘。
![]()
這與 Sora 的高價(jià)訂閱、Runway 的功能閹割形成鮮明對(duì)比,讓個(gè)人和小團(tuán)隊(duì)無需承擔(dān)幾千元年費(fèi),就能用上專業(yè)級(jí)工具。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.