就在去年,AI視頻還是屬于“獵奇向”的內(nèi)容,大家看了也大多是哈哈一笑,但現(xiàn)在很多AI視頻的質(zhì)量已經(jīng)高到讓觀眾不能第一時(shí)間分辨其真實(shí)性了。
從國(guó)內(nèi)的即夢(mèng)AI到國(guó)外的Sora 2,這些新一代模型的突破,已經(jīng)不是簡(jiǎn)單的“畫(huà)質(zhì)升級(jí)”,而是AI在“理解”我們真實(shí)世界運(yùn)作方式上實(shí)現(xiàn)了一次關(guān)鍵的飛躍。
AI時(shí)代一切都發(fā)展得太快,就像網(wǎng)友們?cè)贏I視頻下面留言說(shuō)的那樣:這還是我熟悉的世界嗎?
和獵豹比賽跑、與猩猩比舉重、跟鱷魚(yú)比游泳……這個(gè)世界,有點(diǎn)離譜。
來(lái)源Angry Tom
AI Video
01
懂規(guī)則的AI
現(xiàn)在的AI視頻可不是簡(jiǎn)單的給角色“換個(gè)皮膚”,而是在“假裝”理解我們真實(shí)世界的物理規(guī)律,并且要徹底改變我們做視頻、看視頻的方式。
以前的AI視頻模型,就像一個(gè)天賦很高的畫(huà)師,但對(duì)物理世界一竅不通。它能畫(huà)出很漂亮的畫(huà)面,但讓水流動(dòng)起來(lái)、讓兩個(gè)東西撞到一起,或者讓同一個(gè)角色在不同鏡頭里長(zhǎng)得一樣,就很容易穿幫。
像這個(gè)視頻里的海浪(創(chuàng)作于2024年2月),在碰撞礁石時(shí)完全沒(méi)有變化,與現(xiàn)實(shí)世界物理規(guī)律相悖。
現(xiàn)在AI模型的厲害之處就在于,它似乎終于“開(kāi)竅”了,開(kāi)始學(xué)會(huì)了我們世界的“規(guī)矩”,也就是我們說(shuō)的“世界模型”:
學(xué)會(huì)了“物理常識(shí)”: 現(xiàn)在的Sora 2,生成的水花濺射、光線照射物體后的影子變化,都比以前自然多了。它不是簡(jiǎn)單地“復(fù)制粘貼”,而是“理解”了物體間如何相互作用,這讓視頻看起來(lái)更“真實(shí)可信”。
來(lái)源midjourney
記性變好了: 以前拍一部戲,同一個(gè)演員,第二分鐘的臉可能和第一分鐘不一樣。Sora 2的“記性”變好了,它能更好地記住同一個(gè)角色、同一件衣服在不同鏡頭里要保持一致,故事的連貫性大大提高。
來(lái)源OpenAI
音畫(huà)同步更自然: 最明顯的就是聲音。它能同步生成人物說(shuō)話時(shí)的口型,或者根據(jù)畫(huà)面里的動(dòng)作自動(dòng)配上對(duì)應(yīng)的環(huán)境音效。這讓整個(gè)觀看體驗(yàn)不再是“畫(huà)面+配樂(lè)”,而是“一個(gè)完整的數(shù)字世界”。
來(lái)源OpenAI
AI Video
02
對(duì)我們來(lái)說(shuō)意味著什么?
AI模型視頻生成的能力,核心價(jià)值在于它對(duì)傳統(tǒng)視頻制作流程中高成本、高門(mén)檻環(huán)節(jié)的徹底替代和優(yōu)化。
“零門(mén)檻”實(shí)現(xiàn)創(chuàng)意
對(duì)于創(chuàng)作者來(lái)說(shuō),最大的瓶頸——資源限制——正在消失:
無(wú)限的“數(shù)字布景”:過(guò)去一個(gè)特效大片需要數(shù)月搭建的數(shù)字場(chǎng)景,現(xiàn)在只需一段文字描述;以前產(chǎn)一個(gè)10秒廣告,可能要拍好幾天的戶外素材,現(xiàn)在主要一句話就能生成。
無(wú)論你需要“水下失重圖書(shū)館”還是“賽博朋克風(fēng)格的古代集市”,AI都能在短時(shí)間內(nèi)生成高精度的初稿,極大地解放了美術(shù)和場(chǎng)景設(shè)計(jì)的成本。
動(dòng)態(tài)預(yù)覽與快速迭代:導(dǎo)演和編劇可以在創(chuàng)意階段就看到高質(zhì)量的“動(dòng)態(tài)分鏡”,可以在幾小時(shí)內(nèi)嘗試十幾種不同的運(yùn)鏡和燈光方案,從而在進(jìn)入昂貴的實(shí)際拍攝前,就確定下最理想的敘事方案。
創(chuàng)作者在面對(duì)甲方的“催稿”時(shí),可以快速地給出多個(gè)預(yù)覽版本給他選擇,再也不用面對(duì)熬夜剪輯好幾版還定個(gè)第一稿的問(wèn)題了。
工業(yè)流程的“中段自動(dòng)化”
AI正在將視頻制作流程中最耗時(shí)、最重復(fù)的中間環(huán)節(jié)自動(dòng)化:
特效合成的簡(jiǎn)化: 很多復(fù)雜的動(dòng)態(tài)合成工作,比如煙霧、爆炸、大場(chǎng)景的動(dòng)態(tài)填充,都可以由模型一步到位完成,而無(wú)需依賴大量的綠幕拍攝和復(fù)雜的后期合成。
資產(chǎn)的快速生成:無(wú)論是特定年代的道具、罕見(jiàn)的動(dòng)物,還是復(fù)雜的人群動(dòng)態(tài),AI都能根據(jù)需要即時(shí)生成,為微短劇、廣告和知識(shí)科普視頻提供了前所未有的素材儲(chǔ)備。
這意味著,視頻制作的重心將從“執(zhí)行力”(能否把畫(huà)面做出來(lái))轉(zhuǎn)移到“想象力”(能想象出什么畫(huà)面)。
比“腦洞”的時(shí)代來(lái)了!
AI Video
03
創(chuàng)作者的學(xué)習(xí)升級(jí)之路
對(duì)于我們普通創(chuàng)作者來(lái)說(shuō),需要升級(jí)我們的學(xué)習(xí)策略了!
你的能力也許不再是“熟練使用剪輯軟件的快捷鍵”,而是“能否用精確的語(yǔ)言描述出你心中的世界觀、光影、情感和節(jié)奏”。
優(yōu)秀的“提示詞工程師”將是未來(lái)的核心人才——表達(dá)很重要,現(xiàn)在很多人就是在描述自己所想的方面有所欠缺,數(shù)藝君也深有所感。
而且最終決定作品是否優(yōu)秀的,是故事本身的情感深度和創(chuàng)意新穎度,人來(lái)想,AI來(lái)實(shí)現(xiàn)!只要算力夠,視頻質(zhì)量一定跟得上。
所以為了不被快速迭代的技術(shù)淘汰,我們需要建立系統(tǒng)的學(xué)習(xí)框架:
理解底層邏輯:“連貫性”并不是魔法,它很大程度上依賴于底層模型如何處理“時(shí)間序列”。
你不用去啃復(fù)雜的公式,但要知道模型是在“記住”前后的畫(huà)面的關(guān)鍵信息,并努力讓后續(xù)畫(huà)面與這些信息保持一致。你的提示詞需要足夠清晰,才能喂給模型準(zhǔn)確的參考信息。
掌握“工作流設(shè)計(jì)”:學(xué)習(xí)如何將多個(gè)AI工具串聯(lián)起來(lái),形成一個(gè)自動(dòng)化、可控的AI制作流程。這才是未來(lái)高效內(nèi)容團(tuán)隊(duì)的核心競(jìng)爭(zhēng)力。
AI Video
04
普通人也能進(jìn)行AI視頻創(chuàng)作
想要系統(tǒng)學(xué)習(xí)如何將ChatGPT&MidJourney&即夢(mèng)AI等工具串聯(lián)起來(lái),實(shí)現(xiàn)一鍵出片,并直接對(duì)接出版級(jí)項(xiàng)目資源?
今晚7:30,鎖定“人民郵電出版社·AI視頻公開(kāi)課”!
這里有:
實(shí)戰(zhàn)干貨:拆解可口可樂(lè)、GUCCI等10+品牌的廣告案例。
資源對(duì)接:0基礎(chǔ)學(xué)員如何通過(guò)簡(jiǎn)單學(xué)習(xí),對(duì)接出版社的項(xiàng)目資源。
獨(dú)家贈(zèng)送:100種新藝術(shù)風(fēng)格、精選的AI中英對(duì)照資料等學(xué)習(xí)大禮包!
機(jī)會(huì)難得,立即行動(dòng)!
本次課程由人民郵電出版社·數(shù)藝社特別支持
限額 200 人
![]()
即夢(mèng)4.0模型 提示詞手冊(cè)
無(wú)套路直接領(lǐng)

你可以從這些平臺(tái)關(guān)注:數(shù)藝社
![]()

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.