Hi,我是唐大業(yè),盡說大實(shí)話!
前幾天在網(wǎng)上刷到一張“美國(guó)的AI大戰(zhàn)”與“中國(guó)的AI大戰(zhàn)”的對(duì)比圖。
![]()
不得不說,這張圖確實(shí)把諷刺拉滿了。
圖片左邊是OpenAI創(chuàng)始人薩姆·奧爾特曼介紹GPT-5.3-Codex和Claude官方賬號(hào)宣布隆重推出Claude Opus 4.6,表示其最智能的型號(hào)迎來了升級(jí)。
圖片右邊則是騰訊元寶和阿里千問紅包大戰(zhàn)的新聞截圖,上面還顯示馬化騰希望重現(xiàn)當(dāng)年微信紅包盛況。
很明顯,這張圖想諷刺中美AI發(fā)展路徑的迥異。
意思是美國(guó)AI聚焦技術(shù)代際躍升,而中國(guó)AI卻陷入營(yíng)銷內(nèi)卷的紅包大戰(zhàn),忽視了底層創(chuàng)新能力,凸顯出商業(yè)的浮躁本質(zhì)。
這不禁讓人回想起兩年前“中美兩大AI巨頭”的對(duì)比圖,左邊是薩姆·奧爾特曼,右邊則是賣AI課程割韭菜被全網(wǎng)封殺的“AI教父”李一舟。
看到這種圖確實(shí)很氣人,也很無奈。畢竟AI領(lǐng)域漂亮國(guó)跑得確實(shí)比我們快,而國(guó)內(nèi)市場(chǎng)實(shí)在太卷也確實(shí)有一些亂象,幾大巨頭更是喜歡在營(yíng)銷上做文章。
然而隨著近日字節(jié)跳動(dòng)旗下大模型Seedance 2.0的上線,身為國(guó)人真的可以驕傲地說一句攻守易形了。
01
Seedance2.0顛覆認(rèn)知,全民做短視頻的時(shí)代來了!
大概從2月9日開始,網(wǎng)上又掀起了一輪AI生成視頻的熱潮。
![]()
在這些視頻中,我們看到了此前因倫理和法律問題被Sora2禁掉的“牢大”科比,再一次賽博復(fù)生,竟然大戰(zhàn)起了奧特曼。
![]()
還看到了趙本山強(qiáng)突暴扣勒布朗詹姆斯,大胃袋良子后仰跳投、美少女戰(zhàn)士大戰(zhàn)海綿寶寶等一個(gè)個(gè)離譜畫面。如果沒有AI這個(gè)東西,相信大部分人都會(huì)信以為真。
對(duì)此不少網(wǎng)友在評(píng)論區(qū)疑惑地表示,怎么一夜之間這類視頻又如雨后春筍般集中爆發(fā),而且視頻明顯比此前Sora2等大模型生成的視頻場(chǎng)景更真實(shí)、運(yùn)鏡更自然,而且很多人物扭曲的BUG也不見了,是不是又有新的大模型了?
沒錯(cuò),確實(shí)又有新的大模型了,而且是國(guó)產(chǎn)的。
2月7日,字節(jié)跳動(dòng)低調(diào)推出新一代AI視頻生成模型Seedance 2.0,官網(wǎng)將其定位為“可導(dǎo)演的電影級(jí)全流程生成引擎”。
它能理解復(fù)雜的自然語言指令,將文本或圖像直接轉(zhuǎn)化為電影級(jí)水準(zhǔn)的視頻內(nèi)容,區(qū)別于早期AI視頻工具僅能生成碎片化片段的局限。
![]()
Seedance 2.0采用雙分支擴(kuò)散變換器架構(gòu),可同步生成視頻與音頻,只需輸入提示詞或上傳參考圖,就能在60秒內(nèi)產(chǎn)出帶完整原生音軌的多鏡頭視頻,大幅降低專業(yè)創(chuàng)作的門檻與成本。
其最具突破性的能力,在于“單指令生成連貫多場(chǎng)景”。AI可自動(dòng)解析敘事邏輯,生成環(huán)環(huán)相扣的鏡頭序列,并在角色、光影、風(fēng)格與氛圍上保持高度統(tǒng)一,實(shí)現(xiàn)近乎“零后期”的成片效果。
也就是說,過去的AI視頻就像游戲氪金抽卡,完全就是抽盲盒,可用率大概只有20%。
比如你用Sora2,為了做出一個(gè)比較滿意且沒有明顯BUG的鏡頭,可能得反復(fù)生成幾十次。
而Seedance 2.0能同時(shí)參考你給的圖片、視頻、音頻,生成出來的視頻人物不換臉、鏡頭不亂切、聲音對(duì)得上口型,可用率據(jù)說高達(dá)90%。
![]()
這可真不是什么夸張的說法,上面這張由Seedance 2.0生成的視頻截圖,如果不看這只巨大的橘貓,只看大樓、汽車和行人,真的到了現(xiàn)實(shí)和虛擬傻傻分不清楚的地步。
這也意味著,字節(jié)將全民做短視頻這件事基本初步實(shí)現(xiàn)了,下一步很可能就是全民做短劇,甚至拍出微電影,簡(jiǎn)直細(xì)思極恐。
02
碾壓Sora2,比賽結(jié)束了!
如果普通人還是對(duì)Seedance 2.0所帶來的顛覆沒有什么直觀感受的話,不妨聽聽相關(guān)行業(yè)人士的看法。
![]()
“學(xué)了7年數(shù)字電影制作,現(xiàn)在感覺90%都白學(xué)了。”
就在Seedance 2.0上線后不久,AI影視創(chuàng)意內(nèi)容領(lǐng)域最為活躍的創(chuàng)作者之一“el.cine”,突然在社交平臺(tái)“X”上發(fā)出了如此令人哭笑不得的哀嚎。
原因也很簡(jiǎn)單,在試用了Seedance 2.0后,他徹底被震撼了。
![]()
而讓他破防的是一條用Seedance 2.0生成的60秒視頻。
![]()
鏡頭里,男子狂奔撞翻水果攤,橙子四散飛落的物理細(xì)節(jié)、慢鏡頭的情緒張力、警察追逐的多機(jī)位切換,整個(gè)片段運(yùn)鏡流暢、光影統(tǒng)一、音效同步。不管誰看了,都會(huì)在虛擬與現(xiàn)實(shí)的夾縫里恍惚。
![]()
隨后幾天,el.cine又用這款大模型測(cè)試了漫畫分鏡直接轉(zhuǎn)電影場(chǎng)景、多鏡頭武打戲、科幻大片等各種高難度需求,結(jié)果每一次都被震撼得沒脾氣。
他最后不得不苦笑承認(rèn):這是目前唯一讓他產(chǎn)生“強(qiáng)烈危機(jī)感”的AI模型,因?yàn)槟阒灰蟼鲃”荆湍苤苯由赏暾麍?chǎng)景,自帶特效、配音、剪輯,電影行業(yè)里的每一份工作。包括導(dǎo)演和剪輯師,可能都不再需要了”。
美國(guó)導(dǎo)演查爾斯·柯倫則用Seedance 2.0制作了《光環(huán)》電影版的預(yù)告片,并激動(dòng)地表示,這款A(yù)I視頻軟件將顛覆好萊塢。
《三體》中曾說“物理學(xué)不存在了”,可現(xiàn)實(shí)中物理學(xué)沒消失,多位美國(guó)導(dǎo)演卻表示“好萊塢要完蛋了”,這又何嘗不是一件同樣很魔幻的事。
![]()
更令人感到意外的是,老外為了體驗(yàn)這款強(qiáng)大的AI產(chǎn)品,開始研究如何獲取中國(guó)手機(jī)號(hào)和注冊(cè)APP Store中國(guó)區(qū)的ID,這一幕是不是像極了以前的我們。
如此看來,時(shí)代真的變了!
從DeepSeek的橫空出世到Seedance 2.0的驚艷上線,中國(guó)AI產(chǎn)業(yè)已經(jīng)完成從“單點(diǎn)突圍”到“系統(tǒng)化反超”的兩次關(guān)鍵戰(zhàn)略卡位。
DeepSeek以開源模式和算法架構(gòu)創(chuàng)新,從底層推翻了OpenAI與谷歌憑借算力壟斷塑造的“堆算力”技術(shù)神話。將訓(xùn)練成本降低至行業(yè)極值,迫使全球資本市場(chǎng)對(duì)中國(guó)科技重新估值,標(biāo)志著中國(guó)AI從追趕真正轉(zhuǎn)向?yàn)榉闯?/p>
而時(shí)隔一年上線的Seedance 2.0,則在高擬真多模態(tài)視頻生成這一美國(guó)長(zhǎng)期保持優(yōu)勢(shì)的領(lǐng)域,憑借極高的完成度碾壓Sora2,直接殺死了比賽。
03
用戶是字節(jié)最恐怖的護(hù)城河!
Seedance 2.0到底有多厲害?在國(guó)內(nèi)這邊,影視颶風(fēng)創(chuàng)始人的一番話,更是能代表影視從業(yè)人員的普遍感受,聽了直讓人起雞皮疙瘩。
在最新一期的節(jié)目里,Tim做了一個(gè)測(cè)試。他在Seedance 2.0里上傳了一張自己的照片,也沒有任何音頻輸入。結(jié)果生成的視頻中,“數(shù)字 Tim”不僅長(zhǎng)相100%復(fù)刻,說話聲音更是和真人一模一樣。
![]()
Tim驚嘆道:“在沒有給任何提示,任何詞語,任何信息的情況下,我也沒有給我的聲音文件,只是把我的臉傳上去,這個(gè)AI居然知道這張臉的聲音。”
此外Tim還表示,自己個(gè)人并沒有給過官方授權(quán),也沒有收過錢,這讓他感到恐怖。
一邊是對(duì)Seedance 2.0能力的驚嘆,一邊是版權(quán)、肖像權(quán)乃至倫理道德、法律邊界的擔(dān)憂,這已充分表明,AI影響的不僅是影視以及其他專業(yè)領(lǐng)域的從業(yè)人員,更是已逐漸深入到每一個(gè)普通人的生活中。
![]()
好在字節(jié)并沒有任由AI野蠻生長(zhǎng),在真人素材引發(fā)多方爭(zhēng)議后,他們很快暫停了真人素材參考能力。而AI的倫理和法律邊界,必須要擺上討論的日程了。
這件事也從側(cè)面說明,或許能阻擋字節(jié)AI產(chǎn)品飛速發(fā)展的,也只有版權(quán)、倫理和監(jiān)管了。
而筆者對(duì)于Seedance 2.0的現(xiàn)象級(jí)爆火,佩服的不僅僅是字節(jié)的技術(shù)力,還有背后可怕的用戶數(shù)據(jù)。
試想一下,既然影視颶風(fēng)創(chuàng)始人TIM都能在未上傳任何音頻文件的情況下,生成一個(gè)近乎完美的數(shù)字版自己,這就代表著他的長(zhǎng)相、聲紋這些生物特征早已經(jīng)被喂進(jìn)模型了。
這也意味著很多類似TIM的明星、名人、企業(yè)家和網(wǎng)紅,或許早就是這個(gè)大模型的一部分。而這些正是基于抖音、TikTok全球幾十億的龐大用戶數(shù)據(jù)。
換句話講,決定AI發(fā)展速度的,可能從來都不是芯片的算力和技術(shù),能讓AI變得越來越像個(gè)人的,永遠(yuǎn)都是技術(shù)和算力后面的數(shù)據(jù)。
而數(shù)據(jù),恰恰是字節(jié)最為恐怖的護(hù)城河,這或許也是TikTok被瘋狂打壓和爭(zhēng)搶的根本原因。
從DeepSeek到Seedance 2.0,中國(guó)AI用實(shí)打?qū)嵉倪M(jìn)步把“攻守易形”這四個(gè)字狠狠地拍在了老外的臉上。技術(shù)可以封鎖,算力可以限制,但數(shù)據(jù)在自家互聯(lián)網(wǎng)生態(tài)里,誰也搶不走。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.