又來一個頂著Veo3.1和Sora2出山的壓力怪,
阿里剛上線的Wan2.6已經可以做到單次生成的嚴格一致性和多鏡頭敘事了,
也可以很輕松的一次生成創意產品展示,
除了視頻質感的提升,這把還更新了幾個新功能,可以指定??演出,支持多鏡頭智能調度,音畫同步生成。
來看看他們的宣傳片,從切換鏡頭到角色一致到開口唱歌,整體來說完成度極高,我當然要來測試一把。
長話短說,
內測了兩天的使用感受是,一致性比我想象中的強,有種Sora2剛上線時候的既視感,提示語遵循能力比上一代強很多,能完成多鏡頭的生成。
老規矩啊,提示語和生成視頻也打包好了,公眾號回復“wan2.6”就行
先來看看角色扮演功能,上傳一段2-5秒的視頻,
![]()
我的建議是使用正臉無遮擋的視頻來制定角色,
![]()
當然,這個角色不只局限于寫實的人物,卡通、寵物、道具等等都可以,

來到視頻生成頁面,目前一次最多可以生成10s的視頻,可以調用兩個角色進行合拍。
比如我這里用我的角色和我家小貓做了一個平時的日常,選擇角色扮演模式,提示語直接通過@角色的方式去寫就可以。
![]()
每次鏡頭切到我自己的時候根本就忍不住笑,
我要做100條我和小貓的日常,有人想看嗎?
我還做了一個小貓說話了的版本,貓咪嘴部的動作也很自然。而且這次碰到杯子的物理接觸也更加真實了。
目前萬相2.6對于單一角色的參考是非常穩定的,能夠高清還原人物角色的細節,比如做日常拍攝經常會遇到的單人的不同景別切換,
現在一條提示語就能搞定,
鏡頭一,中景描繪 @卡爾 背對鏡頭, @卡爾 站在巴黎公寓的落地窗前俯瞰著夜晚的埃菲爾鐵塔;鏡頭二,轉為手部特寫, @卡爾 的手拿起一把吉他;鏡頭三,人物的表情特寫, @卡爾 坐在巴黎公寓的落地窗抱著吉他做出深情的表情
景別切換自然,人物的動作和環境整體沒有bug,清晰度也夠高。人臉的一致性延續是很難做的,尤其要做到復刻自己,以前一次性生成真人風格的鏡頭恐怖谷效應特別嚴重,眼睛都是完全無神的。
但這次我覺得萬相2.6做出來的角色人臉和我是超級像,至少我有感覺是我自己的樣子,眼神是有感情在里面的。
PS,現在sora2限制真人的圖生視頻,wan2.6就沒這煩惱。
雙人對話的互動場景穩定的也很高,還能做出不同的音色,我就實現了和大圣一邊烤串一邊聊天,
@卡爾 和 @大圣 坐在燒烤店里一邊吃燒烤一邊聊天, @卡爾 說:“猴哥,最近怎么樣,工作還那么忙嗎?” @大圣 說:“別提了,天天跑展子,這周去了仨了,都說我cos的太真了。”
從角色扮演的功能中就已經展示了萬相2.6在使用角色扮演的同時就能夠實現多鏡頭切換和音畫同步的效果了,
除了真人效果的生成之外,我還測試了萬相2.6其他方面的質量,比如,這個煎荷包蛋的效果,從黃油放進鍋中,到打雞蛋下鍋,再到蛋慢慢煎熟,就最后一個鏡頭這個蛋清煎熟的過程,我夢回veo3剛出做真實物理的場景。
晚上想吃夜宵了可以做這樣一條消磨時間,說不定就不想吃了(才怪)
除了寫實之外,萬相2.6做風格化的視頻效果也很不錯,比如這個粘土風格的小人效果,人物動作,畫面風格和音效都挺統一的,看不出什么違和感。
又或者我可以只告訴萬相2.6一句,
制作一個有趣的“Wan”炸雞廣告和表情包版本的廣告,帶有對話,其中有一個擬人小貓角色
它也能做到制作一個完整的15秒廣告視頻,分鏡和臺詞都自動給我匹配好,小貓的動作絲毫不崩,這效果我說實話不輸sora2,清晰度還更好。
我還可以指定角色出演指定產品廣告,
比如讓我給這瓶wan可樂拍個廣告,全程我和產品都保持著一致性,wan2.6自己也有很強的廣告思維,設計的臺詞和分鏡都符合廣告的特點。
如果我是品牌方想要保持我的短視頻帳號日更,還真可以用這個了,成本又低,劇情又有意思,每天roll幾個視頻發一發保持粉絲黏度,爽爽爽
最后的最后,
目前在百煉和萬相官網上都可以使用啦,地址我就貼這了。
bailian.console.aliyun.com/?tab=model#/model-market/all?providers=wan
tongyi.aliyun.com/wan/
不知道大家有沒有感受到,
現在AI視頻都朝著多鏡頭,多參考角色,音畫同步這三個方向集體補課。
我用下來會覺得這三條進化方向,
本質上都在解決同一個問題,
就是把視頻生成從能出片推進到能交付。
因為做AI做單個鏡頭的天花板已經很高了,
而在真正的影視行業中,
真實內容的最小單位是鏡頭組,不是鏡頭,
短視頻,廣告,短劇,MV,產品演示,
本質上是剪輯語言的表達,
遠景交代空間、中景推進動作、特寫傳遞情緒,再用轉場把節奏打出來。
以前AI只會生成一個鏡頭的結果就是,
我們還是要回到剪輯軟件里把故事拼起來,
交付鏈路會斷在最后一步。
所以,大家可能會感覺到能做出好作品的,
還是之前懂影視知識,會動手剪輯的那一波人。
但現在,
多鏡頭+參考角色+音畫同步,
這三條線糅合在一起后,
生成模型更像是一個導演系統了,
這就是在無限縮小普通人和技術人之間的差距,
人人都能做1分鐘導演,
這牛已經不需要吹了。
@ 作者 / 阿湯 & 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論
如果想要第一時間收到推送,不妨給我個星標
如果你有更有趣的玩法,歡迎在評論區和我聊聊
更多的內容正在不斷填坑中……
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.