![]()
作者 | 駱軼航和他建立在 Claude 的寫作 Skill
視頻 | 駱軼航和 剪映(with 地表最強(qiáng)大的 Seedance 2.0)
這兩天,我一直在玩剪映。在這之前,我一個(gè)完整的視頻也沒動(dòng)手剪過,甚至沒寫過任何視頻的分鏡頭腳本,不是因?yàn)閼校且驗(yàn)椴粫?huì)。
然而就在昨天,我花了兩個(gè)多小時(shí),導(dǎo)演并創(chuàng)作了一部發(fā)生在我們硅星人內(nèi)部的兩分鐘短劇大片——足夠震撼,也足夠炸裂。炸裂到我們沒有一個(gè)同事愿意轉(zhuǎn)。有的人說,都不敢點(diǎn)進(jìn)去看。
劇情中的五個(gè)角色,除了我本人,托馬斯,硅星人創(chuàng)始人和CEO,還有硅星人合伙人王兆洋、副總裁魏男、司機(jī)兼行政助理小范,以及老四,我的狗。王兆洋、魏男和小范都拒絕為本片的真實(shí)性負(fù)責(zé),老四沒有表態(tài)。
魏男在公司大群里說:“沒想到2026年第一撥 AI 受害者是我們自己,我覺得我演技已經(jīng)比黃曉明還要好了”。
這鍋我不背,我本來連視頻都不會(huì)剪,就別說拍短劇了。這得怪 Seedance 2.0,字節(jié)跳動(dòng)新的視頻模型。它是不是中國人工智能的另一個(gè)“DeepSeek 時(shí)刻”我不知道,反正它成就了我的抽象時(shí)刻。
哦,還得算上剪映。因?yàn)?Seedance 2.0 單一生成的視頻長度最多也就10秒(至少爆6塊錢人民幣的金幣),如果沒有剪映的 AI 自動(dòng)剪片模板和工具,我也剪不出這兩分鐘來。
反正,這是我的處女作,各位湊合著看吧。感謝字節(jié)跳動(dòng),感謝 Seedance,感謝剪映,讓我在視頻闖作這條路上不再是一個(gè) virgin,從此放飛自我,一條路走到黑,不撞南墻不回頭。
1
從 Sora 2 到 Veo 3.1 到 Seedance 2.0,什么變了?
好了,我要嚴(yán)肅認(rèn)真地思考一些問題了。
過去半年,全球最頂尖的兩家 AI 公司,先后發(fā)布了他們認(rèn)為會(huì)改變視頻行業(yè)的產(chǎn)品。
OpenAI 在2025年10月1日發(fā)布了 Sora 2,五天下載量破百萬,超過 ChatGPT 當(dāng)年同期成績。兩周后,Google 發(fā)布了 Veo 3.1,也實(shí)現(xiàn)了原生音視頻同步,物理渲染達(dá)到電影級水準(zhǔn)。兩個(gè)產(chǎn)品都足夠驚艷,都引發(fā)了行業(yè)震動(dòng)。
2026 年春節(jié)前,字節(jié)跳動(dòng)把 Seedance 2.0 悄悄發(fā)布了。過程很低調(diào)——消息是從一份飛書文檔流出來的。而接入它的字節(jié)系入口,除了豆包、小云雀和即夢,還有剪映,一個(gè)非模型產(chǎn)品,AI 而是創(chuàng)作者的工具和社區(qū)。
那么問題來了:
Sora 2 發(fā)布之后,最火的視頻是什么?切玻璃的水果,物理效果逼真到令人窒息。奧運(yùn)體操運(yùn)動(dòng)員的騰空動(dòng)作,每一幀都像真實(shí)拍攝。這些視頻在 TikTok 和 X 上瘋傳,評論區(qū)沸騰了整整一周。
然后,三個(gè)月后,月留存率跌到了 1%。
下載的人很多,留下來的人極少——這個(gè)落差本身就說明了問題。Sora 激發(fā)的是一次性的驚嘆,不是持續(xù)的創(chuàng)作欲。人們看完一條令人窒息的 AI 視頻,感受到的第一情緒往往是震撼,第二情緒往往是渺小——“AI 都能做到這種程度,我還能做什么?”
而這種感受,恰恰是創(chuàng)作欲的殺手。
Veo 3.1 走了另一條路,Google 強(qiáng)調(diào)物理真實(shí)感和電影級畫質(zhì),主要瞄準(zhǔn)廣告公司和影視制作團(tuán)隊(duì)——那些本來就有預(yù)算、有明確項(xiàng)目的專業(yè)買家。
沒錯(cuò),Veo 3.1 是個(gè)好工具,但它的用戶天花板從一開始就畫死了:有項(xiàng)目才用,沒項(xiàng)目就不存在。它天然親近專業(yè)影視制作機(jī)構(gòu)和成熟團(tuán)隊(duì),普通的創(chuàng)作者——比如我,可能只能用它生成幾個(gè)10秒鐘視頻,然后就只能等幾個(gè)鐘頭了——盡管我每個(gè)月付給 Gemini 20美元,但顯然我不配無限制地用它生成那些不可描述的視頻。
Google 終于打通了內(nèi)部的墻。YouTube Shorts,也就是 YouTube 的短視頻工具已經(jīng)全方位接入 Veo 3.1 了,但那個(gè)工具……也太糙了。如果對比一下剪映就知道了。但好像 Google 并沒在乎過這件事兒。
所以你看,過去 YouTube Shorts 就沒做起來,現(xiàn)在也沒有因?yàn)槟敲磪柡Φ?Veo 3.1 就抖起來了。
但無論如何,OpenAI 的 Sora 2 和 Google 的 Veo 3.1 都試圖將“AI 能生成多好的視頻”這一問題的答案,推向一個(gè)極致的最優(yōu)解。只不過 Sora 2 的用戶曇花一現(xiàn),Veo 3.1 滿足了有好奇心的人們的創(chuàng)意需求,但并沒有真正地滿足創(chuàng)作的需求——如果你的自我定義是普通創(chuàng)作者,甚至是我這樣的 virgin 的話。
現(xiàn)在,Seedance 2.0 來了,這一切有什么被改變了么?
毫無疑問,Seedance 2.0 將 Sora 2 和 Veo 3.1 “AI 能生成多好的視頻”的答案,進(jìn)一步推向了極致。它在 Sora 2 能實(shí)現(xiàn)的0.2秒級鏡頭切換上不遑多讓,角色和環(huán)境的一致性、完整性和流暢性也極盡精美。它在物理真實(shí)感和電影畫質(zhì)上也并不弱于 Veo 3.1,是一款 SOTA 視頻生成模型。
而當(dāng) OpenAI、Google 和字節(jié)跳動(dòng)這三家在全球 AI 領(lǐng)域的殿堂級公司在視頻模型的能力和生成質(zhì)量上齊頭并進(jìn)的時(shí)候,“生成”本身就成了一件沒那么重要的事。剪輯能力的超越變成了競爭的關(guān)鍵。而剪輯,才是真正的導(dǎo)演思維——準(zhǔn)確地說,是創(chuàng)作者的思維。
三個(gè)月前,我有幸出任愛奇藝與 Google 聯(lián)合舉辦的一場 AI 視頻短片大賽的評委,評審了來自全球幾十個(gè)國家的500多個(gè) AI 視頻短片作品,眼睛都快出血了。作為來自 AI 領(lǐng)域、而非導(dǎo)演圈子的評委,除了作品的立意、價(jià)值觀、審美、畫面和鏡頭語言等,我其實(shí)更看重 AI 工具的使用維度。
既然是 AI 短片創(chuàng)作大賽,所有參賽者都廣泛地采用了 Sora、Veo、Seedance、可靈、Pika 和 Luma 等視頻模型,這沒什么新鮮的。我更愿意給高分的,是在劇本創(chuàng)作和分鏡腳本過程中使用了大語言模型尤其是開源模型的作品。同時(shí),我對使用 AI 工具剪輯的作品更愿意打高分——這也是“專業(yè)創(chuàng)作者”心理更難過的關(guān)。
有點(diǎn)遺憾,只有20%的作品在創(chuàng)作說明中聲稱采用了 AI 剪輯工具,有 OpusClip 和 Canva,而提到的最多的,是一體兩面的 Capcut 和剪映。這也難怪,剪映和 Capcut 加起來有8億月活用戶,如果你是吃了 AI 視頻剪輯這只螃蟹的人,基本都繞不開剪映。
我也是那會(huì)兒明白過來的—— OpenAI 和 Google,可能缺的就是個(gè)剪映。
也就是說,它們?nèi)钡氖且粋€(gè)真正嵌進(jìn)創(chuàng)作者生活里的產(chǎn)品載體,而不是強(qiáng)大的模型本身。
1
指揮棒,而非對話框
Sora 和 Veo 相信的是:創(chuàng)作者最想要的是更好的輸出質(zhì)量。有了精美的畫質(zhì)和運(yùn)控,以及完整精確的物理空間感,用戶就自然會(huì)聚集。
其實(shí)真正的創(chuàng)作者,最在意的從來不是結(jié)果有多完美,而是過程有多可控。
一個(gè)導(dǎo)演不需要 AI 幫他拍出完美的鏡頭。他需要 AI 在他說“給我一個(gè)希區(qū)柯克式的變焦,配合角色回憶的情緒”的時(shí)候,真的理解他在說什么,然后給他一個(gè)可以繼續(xù)打磨的素材。這兩件事,差距是本質(zhì)性的。
Sora 的 Cameo 功能——把真人面孔植入 AI 視頻——設(shè)計(jì)初衷是讓人覺得好玩。它確實(shí)好玩,但好玩是消費(fèi)品的屬性,不是工具的屬性。新鮮感消退之后,用戶找不到繼續(xù)使用的理由,因?yàn)樗鼜囊婚_始就沒有嵌進(jìn)任何人的工作流。
Veo 配套推出了 Flow 編輯工具,方向是對的,但門檻不低,主要服務(wù)有明確項(xiàng)目的影視團(tuán)隊(duì),而不是那些想在下班后花一小時(shí)做一條短劇的普通創(chuàng)作者。
以前做 AI 視頻,創(chuàng)作者是在“描述”,然后等待模型去“猜”。猜對了是運(yùn)氣,猜錯(cuò)了重新抽卡,主導(dǎo)權(quán)始終不在創(chuàng)作者手里。
直到 Seedance 2.0 的出現(xiàn),讓事情正在發(fā)生了那么一點(diǎn)點(diǎn)的變化。它在剪映中,以一個(gè)不那么起眼的“AI 視頻生成” 模塊出現(xiàn),讓創(chuàng)作借助 Seedance 模型的圣杯級水準(zhǔn),升級成了一套完整的 AI 創(chuàng)作組合拳。
剪映給了創(chuàng)作者一根指揮棒,而非一個(gè)輸入文字的對話框。
在剪映里的 Seedance 2.0 帶來的,是一套叫做“全能參考”的交互系統(tǒng):上傳角色圖片和參考視頻,在提示詞里精確指定每個(gè)素材的用途——“角色1 的女孩走在雨夜的巷子里,參考 視頻1 的運(yùn)鏡風(fēng)格,配上音頻1 的氛圍音”。
值得注意的是,Seedance 2.0 目前關(guān)閉了人臉錄制和參與創(chuàng)作的功能。這應(yīng)該是一個(gè)暫時(shí)的舉動(dòng),待法律風(fēng)險(xiǎn)與合規(guī)落實(shí)悉數(shù)解決和完備之后,仍有望開放。
這套系統(tǒng)在技術(shù)上并不神秘。但它做到了一件以前 AI 工具從未做到的事:把“我想要什么”和“AI 生成什么”之間的鴻溝,變成了一座可以走過去的橋。
你給的參考圖是什么臉,生成的就是什么臉,不會(huì)換。你給的參考視頻是什么運(yùn)鏡,生成的就復(fù)刻那個(gè)運(yùn)鏡,不會(huì)亂來。創(chuàng)作過程第一次真正在創(chuàng)作者的掌控之下——不是在描述,而是在指揮。
影視颶風(fēng)的 Tim 看完演示,凌晨發(fā)視頻說這是“改變視頻行業(yè)的 AI”。他強(qiáng)調(diào)的不是畫質(zhì)有多好,而是“鏡頭切換、分鏡設(shè)計(jì)、音畫匹配,都做到了導(dǎo)演水準(zhǔn)”。《黑神話:悟空》制作人馮驥說得更直接:“AIGC 的童年時(shí)代,結(jié)束了”。
跟這兩位比視頻創(chuàng)作,我連單細(xì)胞生物都算不上。但除了前面那個(gè)炸裂辣眼睛的短片之外,我事實(shí)上也做了幾個(gè)舔著自己這張大臉(沒辦法,我在 Seedance 暫停支持人臉功能之前就錄入進(jìn)去自己和一些熟人的角色)的視頻實(shí)驗(yàn):
比如上面這個(gè),好多人說我長得像溥儀,那我就像給你們看。我穿上清朝皇帝的常服,溥儀的臉都能拿來解鎖我手機(jī)屏幕了。我穿上這身行頭,在頤和園十七孔橋前牽著老四——我的愛犬漫步,鏡頭從正面遠(yuǎn)景緩緩?fù)七M(jìn),我抱起我最親愛的老四,最后停在一個(gè)背對湖面的遠(yuǎn)望背影。光影真實(shí),我和老四的形象全程沒有漂移,分鏡有開頭,有飽滿的情緒落點(diǎn)。
再比如這個(gè),我在抽雪茄,電話響了,我喊了一聲“叼著”,老四站起身來,用嘴試圖叼住我的雪茄,第一次沒叼住,我穩(wěn)了它一下,叼住了,然后它順勢站著趴在我腿上,我一邊揉著它的小腿,一邊接電話,過程那叫一個(gè)絲滑、自然和溫情脈脈。我覺得 Seedance 的角色和素材組合指令,比 Sora 2 里單獨(dú)為了玩人物互動(dòng)劇情的工具性要豐富多了。作為我這樣在視頻創(chuàng)作上一窮二白的人,就需要這個(gè)。
一個(gè)普通人,用普通素材,也能做到。我覺得該震撼的是我,不是 Tim 和馮驥。讓頂尖創(chuàng)作者興奮的,和讓普通觀眾驚嘆的,是不一樣的東西。
模型能力再強(qiáng),也需要一個(gè)容器。Sora 需要從零獲客,Veo 的 Flow 需要用戶專門下載學(xué)習(xí),而 Seedance 2.0 接入剪映的那一刻,面對的是一個(gè)本來就有億級日常用戶的工作臺(tái)——那些人不需要被說服來用 AI,他們本來就在這里做視頻。
Seedance 2.0 只是這件事的一半。另一半,是剪映。
1
零摩擦嵌入與數(shù)據(jù)閉環(huán)
剪映的策略,是把生成能力直接放進(jìn)一個(gè)創(chuàng)作者在使用的國民級工具里。不需要用戶遷移,不需要學(xué)習(xí)新軟件,不需要建立新習(xí)慣。
具體是這樣運(yùn)轉(zhuǎn)的:用 Seedance 2.0 逐鏡生成素材,每次最長 15 秒,一條 2 分鐘的短劇大約需要生成 8-12次。生成結(jié)束后,視頻自動(dòng)同步進(jìn)剪映草稿箱,不需要下載,不需要手動(dòng)導(dǎo)入。然后在剪映里完成剩下的事:智能字幕一鍵識(shí)別原生對話音頻自動(dòng)對齊時(shí)間軸,調(diào)色面板統(tǒng)一所有鏡頭的色溫,轉(zhuǎn)場工具分析相鄰內(nèi)容匹配最合適的銜接方式,背景音樂在原生音效基礎(chǔ)上疊加出層次感。
整條鏈路不需要切換任何軟件。一個(gè)從沒做過短劇的人,一個(gè)下午,可以拿到一條完整的 2 分鐘成片。
這叫做零摩擦嵌入。它不制造驚嘆,但它制造行動(dòng)。
這正是 Sora 和 Veo 缺失的東西。Sora 是一個(gè)獨(dú)立的展示臺(tái)——用戶在上面生成,然后下載,發(fā)到 TikTok。Veo 有 Flow,但 Flow 是一個(gè)新軟件,需要重新學(xué)。只有剪映,是創(chuàng)作者本來就在用的地方,Seedance 2.0 只是在里面多了一個(gè)按鈕。
創(chuàng)作者開始行動(dòng)之后,還有一件事在悄悄發(fā)生。
每一次有人在剪映里用 Seedance 2.0,每一次他們調(diào)整提示詞、更換參考素材、對結(jié)果不滿意重新生成——這些行為信號都會(huì)在體系內(nèi)沉淀下來。什么樣的提示詞產(chǎn)生了好結(jié)果,什么樣的素材組合最有效,什么樣的生成視頻最終在抖音上獲得了高完播率……
這是一個(gè)閉環(huán):剪映生成,剪映剪輯,抖音發(fā)布,抖音反饋反向優(yōu)化生成與剪輯體驗(yàn)。
Sora 沒有這個(gè)閉環(huán)。用戶在 Sora 上生成,然后發(fā)到 TikTok——那些最重要的反饋,全部留在平臺(tái)側(cè)的鏈路里。OpenAI 知道你生成了一個(gè)視頻,但不知道這個(gè)視頻有沒有打動(dòng)人,在哪里被劃走,哪個(gè)細(xì)節(jié)值得優(yōu)化。
Veo 理論上有 YouTube 這個(gè)反饋金礦,但 YouTube 的主力創(chuàng)作者依賴真實(shí)影像,他們的身份認(rèn)同建立在“這是我拍的”上,AI 生成是威脅而不是工具,真正高頻使用 Veo 的用戶群體還太小,飛輪沒有轉(zhuǎn)起來。
數(shù)據(jù)飛輪的效果要在一兩年后才會(huì)充分顯現(xiàn)。但當(dāng)它開始發(fā)揮作用的時(shí)候,技術(shù)差距會(huì)以難以追趕的方式拉開——因?yàn)榈较騺碜哉鎸?shí)創(chuàng)作行為,而不只是來自素材堆疊或離線評測指標(biāo)。
Sora 有頂尖的技術(shù)。Veo 有頂尖的技術(shù)。Seedance 2.0 同樣有頂尖的技術(shù)。只有剪映,把這個(gè)技術(shù)放進(jìn)了創(chuàng)作者本來就在生活的地方。
這就是 OpenAI 和 Google 缺的那個(gè)東西——不是更好的模型,而是一個(gè)創(chuàng)作者愿意每天打開、已經(jīng)建立了使用習(xí)慣、生成完就能直接剪輯發(fā)布的產(chǎn)品容器。
AI 工具改變一個(gè)行業(yè),靠的從來不是發(fā)布會(huì)上令人窒息的演示視頻。靠的是讓一億個(gè)普通人,第一次打開軟件,發(fā)現(xiàn)這件事沒有想象中那么難,比如我。
我又要去用 Seedance 2.0 和剪映去禍害我的同事和朋友們了,還有我70多歲的老母親,以及我親愛的老四——他/她/它們一個(gè)都甭想逃脫,吼吼。
點(diǎn)個(gè)“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.