Claude Skills 最近在社交媒體上刷屏。它讓 AI 從會聊天變成會干活。把專業(yè)能力打包成模塊,用戶只用斜杠 / 一下就能選擇對應(yīng)的 Skills。
想做數(shù)據(jù)分析?/DataAnalyst。想寫代碼?/Coding Expert。AI 不再是猜我們想要什么的黑盒,變成了一個(gè)按需加載的工具箱。這個(gè)模塊化的思路,現(xiàn)在也來到了 AI 視頻生成領(lǐng)域。
Vidu 新上線的主體社區(qū),把運(yùn)鏡、特效、氛圍、表演、構(gòu)圖、敘事、風(fēng)格、場景、招式等等,這八大類型打包成「主體庫」,我們只需要在輸入框里 @ 一下,就能調(diào)用。
![]()
▲在參考生視頻中,輸入 @,會自動彈出選擇框,我們可以直接找到需要的主體
想要推鏡頭?@鏡頭庫。想要賽博朋克氛圍?@氛圍庫。想要粒子特效?@特效庫。
我們甚至可以像 Claude Skills 那樣疊加使用:@鏡頭 + @氛圍 + @特效 + 角色圖,一次性搞定導(dǎo)演、攝影師、特效師、美術(shù)指導(dǎo)的活兒。
![]()
以前都說 AI 要搶走好萊塢演員的飯碗,現(xiàn)在 Vidu 直接給每個(gè)創(chuàng)作者配了一個(gè) AI 好萊塢制片廠。演員、導(dǎo)演、攝像全部都是 AI,只要我們 @ 一下。
這也是全球第一個(gè) AI 視頻主體社區(qū),一個(gè)可分享、可交易、可互動的主體社區(qū)。
![]()
體驗(yàn)地址:https://www.vidu.cn |Vidu API:http://platform.vidu.cn/
APPSO 第一時(shí)間拿到了 Vidu 主體社區(qū)的測試資格,把里面的 8 大主體類型都體驗(yàn)了一遍,我們一起來看看它的實(shí)際表現(xiàn)如何。
還有給大家也準(zhǔn)備了福利,登錄 vidu.cn,輸入邀請碼:APPSON,注冊即送 500 積分,快一起來體驗(yàn)吧
AI 終于學(xué)會了「演戲」
在傳統(tǒng) AI 視頻中,最難描述的就是畫面感。稍微多寫幾個(gè)形容詞,AI 就容易產(chǎn)生幻覺。尤其是人物表情的僵硬,簡直就是 AI 視頻的硬傷。
Vidu 主體社區(qū)的表演和表情庫,把這些復(fù)雜的情緒描述和動作設(shè)計(jì),都做到了標(biāo)準(zhǔn)化。現(xiàn)在包括癲狂大笑、驚恐、悲傷、歡快等表演和表情主體,能夠直接生成對應(yīng)角色的表情和情緒狀態(tài);還有雙人對打、群像對峙、浪漫依戀等招式主體,更是把角色的具體動作都安排好了。
一鍵@表情,我們甚至不需要用多余的提示詞,就能完美復(fù)刻主體社區(qū)里面各種表情。同時(shí),還能兼顧到視頻的完整統(tǒng)一性。
我們輸入一張小丑的圖片,使用癲狂大笑這一主體,既讓小丑有更豐富的表情和動作,同時(shí)小丑的模樣也沒有被改變,整體畫面的氣氛也保持在恐怖驚悚中。

▲組合公式:@雷暴不止的@城市廢墟,@圖1站在街道上,正對著鏡頭作出@癲狂大笑,結(jié)合劇烈的@急搖鏡頭,營造出強(qiáng)烈的@恐怖驚悚氛圍
能笑,當(dāng)然也能哭,使用@夸張大眼哭哭這個(gè)主體,就可以直接讓畫面里的角色,哭得撕心裂肺。這些表情和表演主體,能真的讓 AI 視頻里的角色「活」過來。

▲ 組合公式:@圖1站在鏡子前,鏡子里顯示著她展現(xiàn)出@夸張大眼哭哭的表情,結(jié)合強(qiáng)烈的@悲傷氛圍,她的哭泣越來越悲痛,同時(shí)使用@側(cè)逆光,顯示她的輪廓和鏡子中清晰的哭泣表情。
不只表情控制準(zhǔn)確,動作上,有了主體庫的預(yù)設(shè),我們可以輕輕松松地就讓角色放大招。不只是角色的動作,就連視頻特效,我們也是直接@主體社區(qū) 里面的對應(yīng)主體,就自動添加上。
我們先在招式里面,選了一個(gè)@百花繚亂的分身。

▲組合公式:@角色3使用@百花繚亂分身
效果還是很不錯(cuò)的,即使是比較復(fù)雜的@冰雨術(shù)、鎖鏈等招式,Vidu 也基本上都能駕馭得很好。

▲組合公式:@劍圣使用@冰雨術(shù)攻擊@蒼玄,冰雨快要掉到@蒼玄身上時(shí),@蒼玄快速使用@金鐘罩來抵抗攻擊
這些招式和特效,對于短劇漫劇創(chuàng)作者來說,簡直是最佳利器。
不同的主體也能多個(gè)疊加組合,Vidu 就能給我一個(gè)精彩的玄幻武打大片。

▲組合公式:@星野仙尊面向@鬼怪打出@降龍十八掌,場景是@戰(zhàn)場,@智能運(yùn)鏡
近距離的雙人對打,行云流水的動作也能復(fù)刻黑客帝國了。
![]()

@ 幾下就能出片,我也能做百萬運(yùn)鏡了
解決了人物的表情和動作,接著就是畫面的設(shè)計(jì)。
能控制視角,掌握觀眾的眼睛的鏡頭,是視頻內(nèi)容呈現(xiàn)當(dāng)之無愧的重要部分。其中的運(yùn)鏡和構(gòu)圖,運(yùn)鏡能決定攝影機(jī)的運(yùn)動方式,向來就是電影鏡頭語言的基礎(chǔ);而構(gòu)圖更是決定了畫面的景別和視角。
在 Vidu 主體社區(qū),景別包括特寫、全景、鳥瞰、360 度展示等,構(gòu)圖也有群像對峙、三分構(gòu)圖、荷蘭角構(gòu)圖等,鏡頭則更加豐富,包含推鏡頭、搖鏡頭、環(huán)繞鏡頭、探針鏡頭等多種運(yùn)鏡方式。
我們先是從主體庫里,按照人物+風(fēng)格+場景+氛圍+運(yùn)鏡的方式,隨機(jī)選擇了一組提示詞,中間甚至沒有太多的連接詞,用來把這些主體連起來。最后一次性呈現(xiàn)出來的效果,也很有好萊塢大片的風(fēng)格。

▲組合公式:@緊張壓抑氛圍,@小李子站在@停車場,鏡頭先@360度展示,再拉遠(yuǎn)到@全景展示空蕩蕩的停車場
其中小李子就是我們自己創(chuàng)建的主體,上傳 1-3 張圖片,選擇對應(yīng)的聲音,然后確定風(fēng)格和提示詞,就能得到一個(gè)可以重復(fù)使用的人物主體。
![]()
配合 @360度展示的環(huán)繞,進(jìn)一步凸顯緊張壓抑的氛圍,到鏡頭拉遠(yuǎn),使用@全景展示,把這種視覺沖擊力做到更強(qiáng);短短五秒,充滿了戲劇張力。
除了在這種封閉空間的運(yùn)鏡,Vidu 主體社區(qū)的鏡頭配置方案,在露天的無限空間里,表現(xiàn)同樣優(yōu)秀。

▲組合公式:@背后視角@活力少女坐在摩天大樓邊緣,@無人機(jī)拉遠(yuǎn),@全景展現(xiàn)@南京城市天際線和@敬畏崇高氛圍
此外,Vidu 主體社區(qū)還提供了像@探針鏡頭這樣的特殊鏡頭軌跡,很難用自然語言描述清楚攝像機(jī)的運(yùn)動路徑,現(xiàn)在直接直接調(diào)用主體就能幫我們快速實(shí)現(xiàn)微距穿梭。

▲組合公式:@鄭開開@科幻風(fēng)格@太空艙場景@科技感氛圍@探針鏡頭
很多 AI 視頻往往畫質(zhì)很美,動起來很假。Vidu 主體社區(qū)新增的豐富運(yùn)鏡,確實(shí)比以往我們輸入提示詞,告訴 AI 攝像機(jī)如何運(yùn)動,角色如何運(yùn)動,要可控和容易得多。它對那些專業(yè)鏡頭語言的理解,還是比較準(zhǔn)確。
繼續(xù)測試它對運(yùn)鏡和景別的理解能力。推鏡頭是最基礎(chǔ)的電影鏡頭之一,從遠(yuǎn)景緩慢推進(jìn)到近景,制造情緒遞進(jìn)感。我們先用傳統(tǒng)方式寫提示詞,「Elean 在醫(yī)院對面,天在下雨,鏡頭推進(jìn)到她的臉部,然后鏡頭拉遠(yuǎn),從空中鳥瞰」。
先不說這個(gè)用提示詞實(shí)現(xiàn)的運(yùn)鏡如何,沒有參考主體的純文生視頻有諸多不可控,例如畫面的風(fēng)格是否過于超現(xiàn)實(shí),主體的展示是否符合情境等,我們生成了好幾次,單純用提示詞的效果,幾乎都把握不好這個(gè)推進(jìn)到鳥瞰的速度和效果。

▲提示詞版本,鳥瞰運(yùn)鏡下,人物都消失了,不能保持在畫面中心
使用 Vidu 主體庫,我們還可以直接選擇主體社區(qū)中,已經(jīng)有的人物形象,來生成視頻。同時(shí)@鏡頭庫選擇「鏡頭推進(jìn)」,加上簡單的場景描述。第一次生成就出片了,從推進(jìn)到拉遠(yuǎn),再到鳥瞰鏡頭,自然過渡。

▲組合公式:@Elean在@醫(yī)院對面,天在下雨,@鏡頭推進(jìn)到她的臉部,然后再@鏡頭拉遠(yuǎn)的@鳥瞰運(yùn)鏡
這個(gè)對比很能說明問題,傳統(tǒng) AI 視頻生成的「理解力」是飄忽的,同一個(gè)提示詞每次生成都像開盲盒。而主體庫相當(dāng)于把這些專業(yè)概念做了標(biāo)準(zhǔn)化封裝,模型不用再去猜我們想要什么效果。
不只是好看,讓故事更有「代入感」
除此之外,在主體庫中里面的氛圍、風(fēng)格和場景,決定了整個(gè)視頻的味道。
具體來說,場景能決定視頻的空間環(huán)境,風(fēng)格決定視頻的整體美術(shù)風(fēng)格,氛圍則是給畫面的情感色彩帶來了新的故事。Vidu 主體社區(qū)也提供了包括太空艙、醫(yī)院、森林、咖啡店、豪華宴會廳等場景,科幻、懸疑、賽博朋克、古風(fēng)等風(fēng)格,以及緊張壓抑、歡快、悲傷、浪漫依戀、科技感等氛圍。
我們直接把一個(gè)豪華的高級宴會廳,變成一出陰森恐怖的驚悚片,配合左右搖晃的運(yùn)鏡,營造出從人物視角觀察環(huán)境的效果,增強(qiáng)身臨其境感。
▲組合公式:@豪華宴會廳變成@恐怖驚悚的氛圍,采用@左右搖晃的運(yùn)鏡,整體是@懸疑電影風(fēng)格
能通過環(huán)境的燈光來展現(xiàn)氛圍變化,Vidu 主體社區(qū)的其他氛圍,還能結(jié)合人物表情來呈現(xiàn)。
還能讓 @小李子 和 @夢露,加一個(gè)@浪漫依戀氛圍。Vidu 最后生成的視頻光影效果很好,當(dāng)全景的時(shí)候,是用比較暗的下雨天氛圍,而自動推進(jìn)到兩個(gè)人臉部時(shí),畫面又自動提亮了。

▲測試公式:@群像對峙@小李子和@夢露@浪漫依戀氛圍,背景是@咖啡店
通過對這些不同分類的主體進(jìn)行測試,讓我確認(rèn)了一件事,多主體組合不是簡單的「功能堆疊」,Vidu 在底層做了某種協(xié)調(diào)機(jī)制,讓不同主體之間能互相配合。
這種協(xié)同感,是傳統(tǒng) AI 視頻生成最缺少的。我們在提示詞里寫再多細(xì)節(jié),模型也很難同時(shí)從里面理解到,鏡頭、氛圍、特效的平衡。
更驚喜的是,我們不僅能直接引用主體庫,來生成視頻;Vidu 這次還把這些主體,做成了一個(gè)可以分享、互動和交易的社區(qū)。
![]()
▲用戶可以上傳自己設(shè)計(jì)的主體
我們每個(gè)人都可以設(shè)計(jì)和上傳自己的主體,同時(shí)使用其他的主體,在創(chuàng)作和使用的過程中,Vidu 設(shè)置了資產(chǎn)變現(xiàn)模式,每一個(gè)主體都是可交易的。
配合前兩天剛剛更新的 Vidu Agent 1.0 和 Vidu Q2 參考生 Pro 模型,一方面有更自動化的工作流,開箱即用,實(shí)現(xiàn)一鍵成片,靈活性與便捷性完美平衡的 Agent;全新升級后的功能,支持上傳背景音樂、刪減旁白、Storyboard 編輯,內(nèi)置多語言,多音色,多模特,多場景的海量素材庫等。
另一方面則是更強(qiáng)大的基座模型,能直接復(fù)刻不同視頻效果的 Q2 參考生 Pro。
AI 視頻生成這條路,Vidu 算是越走越明白了。
從「抽卡」到「搭樂高」
這一圈實(shí)測下來,我對 Vidu 主體社區(qū)也有了一個(gè)更清晰的判斷,它除了是一個(gè)更好的工具,能幫助我們更好地生成 AI 視頻,它更想要改變整個(gè)生成的工作模式。
傳統(tǒng) AI 視頻生成是「抽卡模式」,我們寫一堆提示詞,祈禱模型能理解,然后賭概率。運(yùn)氣好抽到 SSR,運(yùn)氣不好全是垃圾。這種模式的問題是,創(chuàng)作過程不可控,專業(yè)門檻以另一種形式(說的就是提示詞工程)依然存在。
而 Vidu 主體社區(qū)是「樂高模式」,把專業(yè)元素拆解成標(biāo)準(zhǔn)化的模塊,我們只需要選擇、組合,然后生成。這種模式的核心優(yōu)勢是可控性,在選擇主體時(shí),我們就大體上知道會有什么效果,而不是單純碰運(yùn)氣。
這個(gè)轉(zhuǎn)變對誰最有價(jià)值?自媒體、短劇漫劇創(chuàng)作者、電商營銷團(tuán)隊(duì)、中小企業(yè)主,他們需要批量產(chǎn)出有質(zhì)感的視頻內(nèi)容,但沒有專業(yè)團(tuán)隊(duì)和高昂預(yù)算。主體庫對他們來說,相當(dāng)于花小錢雇了一個(gè)「虛擬劇組」。
![]()
▲復(fù)雜的視頻制作流程
那些獨(dú)立創(chuàng)作者、設(shè)計(jì)師、廣告從業(yè)者也會受益。主體庫可以補(bǔ)齊他們的短板,不用從零學(xué) AE 就能搞定酷炫的鏡頭和特效。
放到更大的行業(yè)背景下看,Vidu 主體社區(qū)讓 AI 視頻生成進(jìn)入了「工業(yè)化階段」的一個(gè)標(biāo)志。
過去一年,AI 視頻生成的主戰(zhàn)場是誰的模型更強(qiáng)——可靈、Runway、Sora、Veo 都在比拼畫面質(zhì)量、時(shí)長、一致性。但技術(shù)到了一定階段,競爭維度會轉(zhuǎn)向「怎么生成」,也就是工作流、可控性、復(fù)用性。
這種轉(zhuǎn)變,其實(shí)和 Claude Skills 的邏輯是如出一轍的。Skills 的價(jià)值不在于讓 Claude 變得更聰明,而在于讓它的能力變得可預(yù)期、可調(diào)用、可組合。用戶不再需要猜測「這次它會不會理解我的意思」,而是明確知道「我調(diào)用了這個(gè) Skill,它就會按這個(gè)方式工作」。
![]()
▲Claude 提供的 Skills 選擇,不同的 Skill 能直接解決對應(yīng)的問題
Vidu 主體庫做的也是同樣的事情。它把視頻生成從「抽卡游戲」變成了「精準(zhǔn)指令」。這種確定性,才是真正降低門檻的關(guān)鍵。
對于真正有想法、有審美、有敘事能力的創(chuàng)作者來說,這其實(shí)是好事。他們終于不用被技術(shù)門檻卡住,可以把精力集中在真正重要的部分。
換句話說,Vidu 全新的主體社區(qū),它能幫我們實(shí)現(xiàn)一個(gè)完美的推鏡頭,但不能幫我們決定這個(gè)推鏡頭,應(yīng)該出現(xiàn)在故事的哪個(gè)節(jié)點(diǎn)、推進(jìn)速度應(yīng)該配合什么樣的情緒節(jié)奏、這個(gè)鏡頭和前后鏡頭如何形成敘事張力。
![]()
▲主體社區(qū)包含的部分主體
這些決策,依然需要我們?nèi)祟悇?chuàng)作者的判斷力和審美。
當(dāng)然,它現(xiàn)在還有一些可以進(jìn)步的空間,8 秒限制、主體庫覆蓋度,但這些都是可以迭代優(yōu)化的。更重要的是,Vidu 主體社區(qū)開了一個(gè)頭,證明了「標(biāo)準(zhǔn)化 + 可組合」這條路是走得通的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.