AI 視頻生成也有 Skills了，@ 一下就能調(diào)用整個(gè)好萊塢劇組

2026-01-29 19:05:27　來源: 愛范兒

廣東舉報(bào)

分享至

Claude Skills 最近在社交媒體上刷屏。它讓 AI 從會聊天變成會干活。把專業(yè)能力打包成模塊，用戶只用斜杠 / 一下就能選擇對應(yīng)的 Skills。

想做數(shù)據(jù)分析？/DataAnalyst。想寫代碼？/Coding Expert。AI 不再是猜我們想要什么的黑盒，變成了一個(gè)按需加載的工具箱。這個(gè)模塊化的思路，現(xiàn)在也來到了 AI 視頻生成領(lǐng)域。

Vidu 新上線的主體社區(qū)，把運(yùn)鏡、特效、氛圍、表演、構(gòu)圖、敘事、風(fēng)格、場景、招式等等，這八大類型打包成「主體庫」，我們只需要在輸入框里 @ 一下，就能調(diào)用。

▲在參考生視頻中，輸入 @，會自動彈出選擇框，我們可以直接找到需要的主體

想要推鏡頭？@鏡頭庫。想要賽博朋克氛圍？@氛圍庫。想要粒子特效？@特效庫。

我們甚至可以像 Claude Skills 那樣疊加使用：@鏡頭 + @氛圍 + @特效 + 角色圖，一次性搞定導(dǎo)演、攝影師、特效師、美術(shù)指導(dǎo)的活兒。

以前都說 AI 要搶走好萊塢演員的飯碗，現(xiàn)在 Vidu 直接給每個(gè)創(chuàng)作者配了一個(gè) AI 好萊塢制片廠。演員、導(dǎo)演、攝像全部都是 AI，只要我們 @ 一下。

這也是全球第一個(gè) AI 視頻主體社區(qū)，一個(gè)可分享、可交易、可互動的主體社區(qū)。

體驗(yàn)地址：https://www.vidu.cn ｜Vidu API：http://platform.vidu.cn/

APPSO 第一時(shí)間拿到了 Vidu 主體社區(qū)的測試資格，把里面的 8 大主體類型都體驗(yàn)了一遍，我們一起來看看它的實(shí)際表現(xiàn)如何。

還有給大家也準(zhǔn)備了福利，登錄 vidu.cn，輸入邀請碼：APPSON，注冊即送 500 積分，快一起來體驗(yàn)吧

AI 終于學(xué)會了「演戲」

在傳統(tǒng) AI 視頻中，最難描述的就是畫面感。稍微多寫幾個(gè)形容詞，AI 就容易產(chǎn)生幻覺。尤其是人物表情的僵硬，簡直就是 AI 視頻的硬傷。

Vidu 主體社區(qū)的表演和表情庫，把這些復(fù)雜的情緒描述和動作設(shè)計(jì)，都做到了標(biāo)準(zhǔn)化。現(xiàn)在包括癲狂大笑、驚恐、悲傷、歡快等表演和表情主體，能夠直接生成對應(yīng)角色的表情和情緒狀態(tài)；還有雙人對打、群像對峙、浪漫依戀等招式主體，更是把角色的具體動作都安排好了。

一鍵@表情，我們甚至不需要用多余的提示詞，就能完美復(fù)刻主體社區(qū)里面各種表情。同時(shí)，還能兼顧到視頻的完整統(tǒng)一性。

我們輸入一張小丑的圖片，使用癲狂大笑這一主體，既讓小丑有更豐富的表情和動作，同時(shí)小丑的模樣也沒有被改變，整體畫面的氣氛也保持在恐怖驚悚中。

▲組合公式：@雷暴不止的@城市廢墟，@圖1站在街道上，正對著鏡頭作出@癲狂大笑，結(jié)合劇烈的@急搖鏡頭，營造出強(qiáng)烈的@恐怖驚悚氛圍

能笑，當(dāng)然也能哭，使用@夸張大眼哭哭這個(gè)主體，就可以直接讓畫面里的角色，哭得撕心裂肺。這些表情和表演主體，能真的讓 AI 視頻里的角色「活」過來。

▲ 組合公式：@圖1站在鏡子前，鏡子里顯示著她展現(xiàn)出@夸張大眼哭哭的表情，結(jié)合強(qiáng)烈的@悲傷氛圍，她的哭泣越來越悲痛，同時(shí)使用@側(cè)逆光，顯示她的輪廓和鏡子中清晰的哭泣表情。

不只表情控制準(zhǔn)確，動作上，有了主體庫的預(yù)設(shè)，我們可以輕輕松松地就讓角色放大招。不只是角色的動作，就連視頻特效，我們也是直接@主體社區(qū) 里面的對應(yīng)主體，就自動添加上。

我們先在招式里面，選了一個(gè)@百花繚亂的分身。

▲組合公式：@角色3使用@百花繚亂分身

效果還是很不錯(cuò)的，即使是比較復(fù)雜的@冰雨術(shù)、鎖鏈等招式，Vidu 也基本上都能駕馭得很好。

▲組合公式：@劍圣使用@冰雨術(shù)攻擊@蒼玄，冰雨快要掉到@蒼玄身上時(shí)，@蒼玄快速使用@金鐘罩來抵抗攻擊

這些招式和特效，對于短劇漫劇創(chuàng)作者來說，簡直是最佳利器。

不同的主體也能多個(gè)疊加組合，Vidu 就能給我一個(gè)精彩的玄幻武打大片。

▲組合公式：@星野仙尊面向@鬼怪打出@降龍十八掌，場景是@戰(zhàn)場，@智能運(yùn)鏡

近距離的雙人對打，行云流水的動作也能復(fù)刻黑客帝國了。

@ 幾下就能出片，我也能做百萬運(yùn)鏡了

解決了人物的表情和動作，接著就是畫面的設(shè)計(jì)。

能控制視角，掌握觀眾的眼睛的鏡頭，是視頻內(nèi)容呈現(xiàn)當(dāng)之無愧的重要部分。其中的運(yùn)鏡和構(gòu)圖，運(yùn)鏡能決定攝影機(jī)的運(yùn)動方式，向來就是電影鏡頭語言的基礎(chǔ)；而構(gòu)圖更是決定了畫面的景別和視角。

在 Vidu 主體社區(qū)，景別包括特寫、全景、鳥瞰、360 度展示等，構(gòu)圖也有群像對峙、三分構(gòu)圖、荷蘭角構(gòu)圖等，鏡頭則更加豐富，包含推鏡頭、搖鏡頭、環(huán)繞鏡頭、探針鏡頭等多種運(yùn)鏡方式。

我們先是從主體庫里，按照人物+風(fēng)格+場景+氛圍+運(yùn)鏡的方式，隨機(jī)選擇了一組提示詞，中間甚至沒有太多的連接詞，用來把這些主體連起來。最后一次性呈現(xiàn)出來的效果，也很有好萊塢大片的風(fēng)格。

▲組合公式：@緊張壓抑氛圍，@小李子站在@停車場，鏡頭先@360度展示，再拉遠(yuǎn)到@全景展示空蕩蕩的停車場

其中小李子就是我們自己創(chuàng)建的主體，上傳 1-3 張圖片，選擇對應(yīng)的聲音，然后確定風(fēng)格和提示詞，就能得到一個(gè)可以重復(fù)使用的人物主體。

配合 @360度展示的環(huán)繞，進(jìn)一步凸顯緊張壓抑的氛圍，到鏡頭拉遠(yuǎn)，使用@全景展示，把這種視覺沖擊力做到更強(qiáng)；短短五秒，充滿了戲劇張力。

除了在這種封閉空間的運(yùn)鏡，Vidu 主體社區(qū)的鏡頭配置方案，在露天的無限空間里，表現(xiàn)同樣優(yōu)秀。

▲組合公式：@背后視角@活力少女坐在摩天大樓邊緣，@無人機(jī)拉遠(yuǎn)，@全景展現(xiàn)@南京城市天際線和@敬畏崇高氛圍

此外，Vidu 主體社區(qū)還提供了像@探針鏡頭這樣的特殊鏡頭軌跡，很難用自然語言描述清楚攝像機(jī)的運(yùn)動路徑，現(xiàn)在直接直接調(diào)用主體就能幫我們快速實(shí)現(xiàn)微距穿梭。

▲組合公式：@鄭開開@科幻風(fēng)格@太空艙場景@科技感氛圍@探針鏡頭

很多 AI 視頻往往畫質(zhì)很美，動起來很假。Vidu 主體社區(qū)新增的豐富運(yùn)鏡，確實(shí)比以往我們輸入提示詞，告訴 AI 攝像機(jī)如何運(yùn)動，角色如何運(yùn)動，要可控和容易得多。它對那些專業(yè)鏡頭語言的理解，還是比較準(zhǔn)確。

繼續(xù)測試它對運(yùn)鏡和景別的理解能力。推鏡頭是最基礎(chǔ)的電影鏡頭之一，從遠(yuǎn)景緩慢推進(jìn)到近景，制造情緒遞進(jìn)感。我們先用傳統(tǒng)方式寫提示詞，「Elean 在醫(yī)院對面，天在下雨，鏡頭推進(jìn)到她的臉部，然后鏡頭拉遠(yuǎn)，從空中鳥瞰」。

先不說這個(gè)用提示詞實(shí)現(xiàn)的運(yùn)鏡如何，沒有參考主體的純文生視頻有諸多不可控，例如畫面的風(fēng)格是否過于超現(xiàn)實(shí)，主體的展示是否符合情境等，我們生成了好幾次，單純用提示詞的效果，幾乎都把握不好這個(gè)推進(jìn)到鳥瞰的速度和效果。

▲提示詞版本，鳥瞰運(yùn)鏡下，人物都消失了，不能保持在畫面中心

使用 Vidu 主體庫，我們還可以直接選擇主體社區(qū)中，已經(jīng)有的人物形象，來生成視頻。同時(shí)@鏡頭庫選擇「鏡頭推進(jìn)」，加上簡單的場景描述。第一次生成就出片了，從推進(jìn)到拉遠(yuǎn)，再到鳥瞰鏡頭，自然過渡。

▲組合公式：@Elean在@醫(yī)院對面，天在下雨，@鏡頭推進(jìn)到她的臉部，然后再@鏡頭拉遠(yuǎn)的@鳥瞰運(yùn)鏡

這個(gè)對比很能說明問題，傳統(tǒng) AI 視頻生成的「理解力」是飄忽的，同一個(gè)提示詞每次生成都像開盲盒。而主體庫相當(dāng)于把這些專業(yè)概念做了標(biāo)準(zhǔn)化封裝，模型不用再去猜我們想要什么效果。

不只是好看，讓故事更有「代入感」

除此之外，在主體庫中里面的氛圍、風(fēng)格和場景，決定了整個(gè)視頻的味道。

具體來說，場景能決定視頻的空間環(huán)境，風(fēng)格決定視頻的整體美術(shù)風(fēng)格，氛圍則是給畫面的情感色彩帶來了新的故事。Vidu 主體社區(qū)也提供了包括太空艙、醫(yī)院、森林、咖啡店、豪華宴會廳等場景，科幻、懸疑、賽博朋克、古風(fēng)等風(fēng)格，以及緊張壓抑、歡快、悲傷、浪漫依戀、科技感等氛圍。

我們直接把一個(gè)豪華的高級宴會廳，變成一出陰森恐怖的驚悚片，配合左右搖晃的運(yùn)鏡，營造出從人物視角觀察環(huán)境的效果，增強(qiáng)身臨其境感。

▲組合公式：@豪華宴會廳變成@恐怖驚悚的氛圍，采用@左右搖晃的運(yùn)鏡，整體是@懸疑電影風(fēng)格

能通過環(huán)境的燈光來展現(xiàn)氛圍變化，Vidu 主體社區(qū)的其他氛圍，還能結(jié)合人物表情來呈現(xiàn)。

還能讓 @小李子 和 @夢露，加一個(gè)@浪漫依戀氛圍。Vidu 最后生成的視頻光影效果很好，當(dāng)全景的時(shí)候，是用比較暗的下雨天氛圍，而自動推進(jìn)到兩個(gè)人臉部時(shí)，畫面又自動提亮了。

▲測試公式：@群像對峙@小李子和@夢露@浪漫依戀氛圍，背景是@咖啡店

通過對這些不同分類的主體進(jìn)行測試，讓我確認(rèn)了一件事，多主體組合不是簡單的「功能堆疊」，Vidu 在底層做了某種協(xié)調(diào)機(jī)制，讓不同主體之間能互相配合。

這種協(xié)同感，是傳統(tǒng) AI 視頻生成最缺少的。我們在提示詞里寫再多細(xì)節(jié)，模型也很難同時(shí)從里面理解到，鏡頭、氛圍、特效的平衡。

更驚喜的是，我們不僅能直接引用主體庫，來生成視頻；Vidu 這次還把這些主體，做成了一個(gè)可以分享、互動和交易的社區(qū)。

▲用戶可以上傳自己設(shè)計(jì)的主體

我們每個(gè)人都可以設(shè)計(jì)和上傳自己的主體，同時(shí)使用其他的主體，在創(chuàng)作和使用的過程中，Vidu 設(shè)置了資產(chǎn)變現(xiàn)模式，每一個(gè)主體都是可交易的。

配合前兩天剛剛更新的 Vidu Agent 1.0 和 Vidu Q2 參考生 Pro 模型，一方面有更自動化的工作流，開箱即用，實(shí)現(xiàn)一鍵成片，靈活性與便捷性完美平衡的 Agent；全新升級后的功能，支持上傳背景音樂、刪減旁白、Storyboard 編輯，內(nèi)置多語言，多音色，多模特，多場景的海量素材庫等。

另一方面則是更強(qiáng)大的基座模型，能直接復(fù)刻不同視頻效果的 Q2 參考生 Pro。

AI 視頻生成這條路，Vidu 算是越走越明白了。

從「抽卡」到「搭樂高」

這一圈實(shí)測下來，我對 Vidu 主體社區(qū)也有了一個(gè)更清晰的判斷，它除了是一個(gè)更好的工具，能幫助我們更好地生成 AI 視頻，它更想要改變整個(gè)生成的工作模式。

傳統(tǒng) AI 視頻生成是「抽卡模式」，我們寫一堆提示詞，祈禱模型能理解，然后賭概率。運(yùn)氣好抽到 SSR，運(yùn)氣不好全是垃圾。這種模式的問題是，創(chuàng)作過程不可控，專業(yè)門檻以另一種形式（說的就是提示詞工程）依然存在。

而 Vidu 主體社區(qū)是「樂高模式」，把專業(yè)元素拆解成標(biāo)準(zhǔn)化的模塊，我們只需要選擇、組合，然后生成。這種模式的核心優(yōu)勢是可控性，在選擇主體時(shí)，我們就大體上知道會有什么效果，而不是單純碰運(yùn)氣。

這個(gè)轉(zhuǎn)變對誰最有價(jià)值?自媒體、短劇漫劇創(chuàng)作者、電商營銷團(tuán)隊(duì)、中小企業(yè)主，他們需要批量產(chǎn)出有質(zhì)感的視頻內(nèi)容，但沒有專業(yè)團(tuán)隊(duì)和高昂預(yù)算。主體庫對他們來說，相當(dāng)于花小錢雇了一個(gè)「虛擬劇組」。

▲復(fù)雜的視頻制作流程

那些獨(dú)立創(chuàng)作者、設(shè)計(jì)師、廣告從業(yè)者也會受益。主體庫可以補(bǔ)齊他們的短板，不用從零學(xué) AE 就能搞定酷炫的鏡頭和特效。

放到更大的行業(yè)背景下看，Vidu 主體社區(qū)讓 AI 視頻生成進(jìn)入了「工業(yè)化階段」的一個(gè)標(biāo)志。

過去一年，AI 視頻生成的主戰(zhàn)場是誰的模型更強(qiáng)——可靈、Runway、Sora、Veo 都在比拼畫面質(zhì)量、時(shí)長、一致性。但技術(shù)到了一定階段，競爭維度會轉(zhuǎn)向「怎么生成」，也就是工作流、可控性、復(fù)用性。

這種轉(zhuǎn)變，其實(shí)和 Claude Skills 的邏輯是如出一轍的。Skills 的價(jià)值不在于讓 Claude 變得更聰明，而在于讓它的能力變得可預(yù)期、可調(diào)用、可組合。用戶不再需要猜測「這次它會不會理解我的意思」，而是明確知道「我調(diào)用了這個(gè) Skill，它就會按這個(gè)方式工作」。

▲Claude 提供的 Skills 選擇，不同的 Skill 能直接解決對應(yīng)的問題

Vidu 主體庫做的也是同樣的事情。它把視頻生成從「抽卡游戲」變成了「精準(zhǔn)指令」。這種確定性，才是真正降低門檻的關(guān)鍵。

對于真正有想法、有審美、有敘事能力的創(chuàng)作者來說，這其實(shí)是好事。他們終于不用被技術(shù)門檻卡住，可以把精力集中在真正重要的部分。

換句話說，Vidu 全新的主體社區(qū)，它能幫我們實(shí)現(xiàn)一個(gè)完美的推鏡頭，但不能幫我們決定這個(gè)推鏡頭，應(yīng)該出現(xiàn)在故事的哪個(gè)節(jié)點(diǎn)、推進(jìn)速度應(yīng)該配合什么樣的情緒節(jié)奏、這個(gè)鏡頭和前后鏡頭如何形成敘事張力。

▲主體社區(qū)包含的部分主體

這些決策，依然需要我們?nèi)祟悇?chuàng)作者的判斷力和審美。

當(dāng)然，它現(xiàn)在還有一些可以進(jìn)步的空間，8 秒限制、主體庫覆蓋度，但這些都是可以迭代優(yōu)化的。更重要的是，Vidu 主體社區(qū)開了一個(gè)頭，證明了「標(biāo)準(zhǔn)化 + 可組合」這條路是走得通的。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.