<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      實(shí)測可靈2.6:給AI視頻上了一堂聲音課

      0
      分享至


      中文視頻AI邁入“有聲之年”。

      作者|景行

      編輯|楊舟

      不得不感嘆AI大模型的進(jìn)步速度。

      12月,可靈AI先是發(fā)布統(tǒng)一多模態(tài)視頻大模型可靈O1,緊接著閃電發(fā)布可靈2.6、數(shù)字人2.0。

      可靈2.6的發(fā)布,則讓困擾視頻工作者已久的聲畫不同步問題得到解決,其核心功能就是音畫同出,簡單理解,一次生成,能同時(shí)做出視頻和音頻,而且二者實(shí)時(shí)同步。

      其中,可選的音頻效果不僅涵蓋人聲對話、獨(dú)白,還提供環(huán)境音、效果音、樂器演奏乃至說唱等完整的音頻生態(tài)。

      在此之前,部分海外視頻模型已經(jīng)在音畫同出領(lǐng)域做出探索,如Google Veo 3.1和OpenAI Sora 2,二者均能實(shí)現(xiàn)從口型到動(dòng)作、聲音的同步生成,并與畫面完成匹配。

      但這些模型同樣存在弱點(diǎn),如音頻控制力不足,同角色的不同片段聲音、語氣統(tǒng)一效果一般,對中文語音的理解不足導(dǎo)致腔調(diào)怪異,用戶調(diào)整困難等等。

      在可靈2.6發(fā)布后,「市象」也在第一時(shí)間試用了產(chǎn)品。在一系列測試后,可以確認(rèn)的是,AI視頻模型,要對過去的創(chuàng)作流程徹底重構(gòu)了。

      01從啞劇到聲臨其境

      AI視頻的音畫同出,并非最新功能,此前已有多模型能做到。

      “Sora 2是視頻生成領(lǐng)域的 GPT-3.5時(shí)刻?!?/p>

      這一表述來自今年9月,OpenAI的官方博客。伴隨新一代視頻生成模型Sora2發(fā)布,OpenAI公開表示,新模型的性能已經(jīng)超越歷代模型,不僅在物理效果上更加精確,同時(shí)還配備了同步音頻功能。

      例如,在生成視頻時(shí),能完成復(fù)雜的運(yùn)動(dòng)動(dòng)作,或模擬真實(shí)運(yùn)動(dòng)場的物理表現(xiàn),同時(shí)生成背景音、語音和音效,并將其融入到視頻當(dāng)中。

      但面對Sora2、Veo3.1這樣的海外一線模型時(shí),不少海外博主,表現(xiàn)出對可靈2.6的認(rèn)可。

      “這比Veo3好多了!相比Veo3,它最大的優(yōu)勢在于:原生支持1080p,這在畫質(zhì)上帶來了巨大的提升。”

      這一表述來自海外視頻博主Simon Meyers,在分享中,他使用可靈2.6制作了一則預(yù)告片,并用各種復(fù)雜的提示詞來測試模型功能:

      “我嘗試了各種聲音和對話,沒有發(fā)現(xiàn)任何明顯的限制——音效、人聲,甚至歌聲都能完美呈現(xiàn)!當(dāng)然,和所有視頻模型一樣,你仍然需要進(jìn)行一些迭代,但這完全可以接受。語音聽起來很逼真,語調(diào)也十分精準(zhǔn),總的來說,這是一個(gè)巨大的飛躍?!?/p>


      在這段不到一分鐘時(shí)長的作品中,觀眾可以直觀感受到可靈2.6對音畫生成的理解:

      單人獨(dú)白、背景歌曲、視頻氛圍音效、吉他彈奏聲(甚至有遠(yuǎn)景和近景下,兩種吉他音的不同表現(xiàn))、歌唱聲、打擊樂器聲、氣球、攪拌器、電鉆、無人機(jī)、甚至結(jié)尾字幕配合的女聲吟唱,多種復(fù)雜音頻出現(xiàn)在同一作品中,互不干擾,并與畫面完美融合。

      另一視頻博主Curious Refuge選擇用新的方式測試可靈2.6——用四組畫面和生成詞,分別交給Veo3.1和可靈2.6,分別是俯拍鏡頭,兩位騎士騎馬穿越森林;推鏡頭,食客在面館吃拉面;特寫鏡頭,男子在帆船上獨(dú)白;固定中景鏡頭,男子吃掉餅干,并與寵物狗交流。

      結(jié)論是,可靈2.6的表現(xiàn)令人意外。


      在各項(xiàng)對比中,可靈2.6在多個(gè)測試成績上要超過Veo3.1,如場景生成、相機(jī)運(yùn)動(dòng)更符合生成詞等等。盡管在Veo 3.1的輸出結(jié)果中,也有部分表現(xiàn)出色,如音頻更為洪亮,但該博主的結(jié)論是,在這一輪測試中,可靈2.6略占上風(fēng)。

      事實(shí)上,除音畫協(xié)同外,可靈2.6還重點(diǎn)強(qiáng)化了音頻質(zhì)量和語義理解。前者會(huì)讓各類音效層次更豐富、接近真實(shí)世界的聲音效果;后者則讓AI對復(fù)雜劇情的理解能力更強(qiáng),理解作者意圖。

      更多音頻元素的融入,則讓AI視頻效果直逼現(xiàn)實(shí)。除了單人講話外,可靈2.6支持多人多白、不同風(fēng)格歌聲、環(huán)境音、物理音效,乃至多種音頻組合的混合音效。

      這意味著,創(chuàng)作者只需要通過文本描述,就能還原一個(gè)物理世界多重環(huán)境音的層次感與空間感,獲得一個(gè)無需后期修改的完整作品。

      02重構(gòu)工作流

      過去的AI視頻模型,創(chuàng)作者的工序大概是這樣幾步:

      創(chuàng)作者思考創(chuàng)意,確定文字腳本、畫面分鏡等方向——由AI生成文、圖等素材——進(jìn)一步通過素材生成視頻——后期生成配音和音效,并校對完成。

      其中,后期制作是最為耗時(shí)的環(huán)節(jié)之一。對剪輯從業(yè)者來說,無論是語音、效果音的制作和篩選,還是視頻的后期對軸,將音效與畫面逐幀對齊,這一工作對視頻質(zhì)量的影響極大,不僅依賴經(jīng)驗(yàn),且過程繁瑣,需要在視頻工具、音頻工具中反復(fù)切換,

      這讓可靈2.6的新功能重要性更為突出。在創(chuàng)作時(shí),用戶只需輸入畫面、動(dòng)作、聲音的三要素精確描述,就能獲得一段高質(zhì)量的AI視頻。

      這意味著,無論用戶是否有AI視頻創(chuàng)作經(jīng)驗(yàn),都能在可靈2.6模型中體驗(yàn)無門檻的創(chuàng)作流程。

      具體方法十分簡單,在Web端可靈頁面中選擇視頻生成,文生視頻、圖生視頻均可選擇,在下方勾選“音畫同出”,并選擇品質(zhì)模式、畫面比例和產(chǎn)出條數(shù),輸入生成詞或參考圖即可。


      需要注意的是,要生成一條滿意的AI音畫直出視頻,用戶最好能對視頻畫面、動(dòng)作、聲音三要素進(jìn)行精確描述,如畫面細(xì)節(jié),人物情緒、語速等。

      「市象」選擇文生視頻的方式,首先測試可靈2.6對歌曲、樂器的理解能力,生成詞如下:

      光線明亮的演播室,歌手正在一邊彈奏吉他,發(fā)出悠揚(yáng)的吉他音樂聲,一邊用溫柔的聲音演唱中文歌曲。

      可以看到,視頻中歌手不僅通過自彈自唱方式演唱了一段原創(chuàng)歌曲,且口型、彈奏動(dòng)作畫面與聲音形成契合。整個(gè)視頻不僅能實(shí)現(xiàn)畫面流暢、光影自然,在音頻層面則能做到旋律清晰,吉他演奏聲與人聲演唱層次分明,互不干擾。

      再如這段生成詞:中景,慢速推鏡頭,雨聲比較大的陰雨天,有短促的閃電,滿臉泥濘的消防員在雨中說,很高興,我們成功撲滅了大火。

      從視頻效果看,可靈按要求還原了雨天場景,同時(shí)表現(xiàn)出了雨水落在帽子上的物理效果,人物的獨(dú)白聲則與背景的雨聲獨(dú)立開來,形成有層次的混合音效體驗(yàn)。

      03當(dāng)AI學(xué)會(huì)說話

      在與羅永浩的播客對談中,影視颶風(fēng)創(chuàng)始人TIM曾有這樣一番表述:在AI面前,創(chuàng)作者10年的努力都沒有價(jià)值。最多兩年,AI就能替換掉一個(gè)非常優(yōu)秀的剪輯師。

      從產(chǎn)業(yè)場景來看,視頻AI正以閃電速度,從自媒體創(chuàng)意輔助者向全能的視頻生產(chǎn)力工具轉(zhuǎn)變。特別是可靈2.6將視頻模型音畫協(xié)同能力大幅提升后,一些過去依賴人工完成的創(chuàng)作工作,在AI面前將失去性價(jià)比優(yōu)勢。

      例如在電商場景下,人工解說的效率將難以匹敵AI。

      未來的電商市場,一款產(chǎn)品的商品圖片,可以由商家自主拍攝上傳,商品賣點(diǎn)的口播,則可以由AI解說完成,具體到使用場景,AI可以幫助商家輕易搭建任何高成本、電影級質(zhì)感的視頻背景,并清晰傳遞出產(chǎn)品優(yōu)勢。如果憑借人力完成,其成本無疑將是天文數(shù)字。

      在廣告場景下,視頻AI則有更大的發(fā)揮空間。

      以可靈2.6的演示視頻為例,模型可高質(zhì)量完成鏡頭調(diào)度、分鏡設(shè)計(jì)、音頻設(shè)計(jì)、配樂設(shè)計(jì)、動(dòng)作設(shè)計(jì)、音畫結(jié)合等創(chuàng)作者近乎全方位的意圖。

      在過去,一條一分鐘左右的廣告宣傳片制作周期可能要花費(fèi)數(shù)周,策劃、攝影、剪輯、配音、后期等工種則需要全程跟進(jìn),確保最終產(chǎn)出符合創(chuàng)意規(guī)劃。

      如今借助AI模型,創(chuàng)作者只需將創(chuàng)意交給AI來跑,借助文本生成、圖片生成等方式產(chǎn)出多個(gè)音畫協(xié)同的視頻作品并加以篩選,一些涉及到虛擬形象、特效等后期工作的效果,則能通過AI在幾分鐘內(nèi)實(shí)現(xiàn)。

      比如文本描述“生成一些精靈,用手舉起目標(biāo)產(chǎn)品”“讓商品跨出國門,飛向世界各地”等,這不僅效率大幅提高,更降去了大部分成本。

      可以說,只要一個(gè)行業(yè)存在視頻內(nèi)容的產(chǎn)出需求,類似的改變就將持續(xù)發(fā)生。如自媒體創(chuàng)作、直播、播音傳媒、音樂MV、影視制作等等。

      一個(gè)肉眼可見的改變是,在短視頻平臺(tái),部分經(jīng)史人文類博主已經(jīng)率先應(yīng)用AI生成視頻素材,以節(jié)約創(chuàng)作時(shí)間。隨著可靈2.6發(fā)布,中文視頻模型音畫協(xié)同技術(shù)成熟,留給博主的創(chuàng)作空間還將進(jìn)一步拓展。

      對所有相關(guān)從業(yè)者而言,這場聲音革命都迫使人思考,當(dāng)長周期重投入的生產(chǎn)模式變成即時(shí)批量生產(chǎn),當(dāng)AI學(xué)會(huì)自己發(fā)聲,人應(yīng)該掌握的,應(yīng)當(dāng)是把握創(chuàng)意和審美,教AI講好故事。

      本文為《市象》原創(chuàng)文章

      未經(jīng)授權(quán)不得轉(zhuǎn)載或建立鏡像

      轉(zhuǎn)載、交流、合作請?zhí)砑游⑿牛篗ingFei_99

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      最低5℃以下!“阿冷”年底沖業(yè)績?廣東人的降溫在路上……

      最低5℃以下!“阿冷”年底沖業(yè)績?廣東人的降溫在路上……

      佛山電視臺(tái)小強(qiáng)熱線
      2025-12-23 20:07:34
      穩(wěn)了!中央三部門集中發(fā)聲!2026年,樓市開啟“絕地反擊”…

      穩(wěn)了!中央三部門集中發(fā)聲!2026年,樓市開啟“絕地反擊”…

      居者
      2025-12-23 18:07:04
      克林頓回應(yīng)愛潑斯坦案新檔案:立即全部公開!

      克林頓回應(yīng)愛潑斯坦案新檔案:立即全部公開!

      新華社
      2025-12-23 20:53:07
      “你去吃屎吧”——萬斯向尼克·富恩特斯發(fā)泄怒火

      “你去吃屎吧”——萬斯向尼克·富恩特斯發(fā)泄怒火

      老王說正義
      2025-12-23 00:05:44
      特朗普急眼了!美軍公海劫中國11億原油,中國反制信號已亮

      特朗普急眼了!美軍公海劫中國11億原油,中國反制信號已亮

      陳博世財(cái)經(jīng)
      2025-12-22 10:52:10
      閆妮在華強(qiáng)北送外賣!有深圳人看哭......

      閆妮在華強(qiáng)北送外賣!有深圳人看哭......

      深圳晚報(bào)
      2025-12-23 12:33:55
      伏明霞年輕的時(shí)候玩得是真花,估計(jì)老梁看了她的情史,都想離婚了

      伏明霞年輕的時(shí)候玩得是真花,估計(jì)老梁看了她的情史,都想離婚了

      小熊侃史
      2025-12-23 11:57:14
      山東男籃惜敗深圳,邱彪擺爛或是下一盤大棋,媒體人曝出真相

      山東男籃惜敗深圳,邱彪擺爛或是下一盤大棋,媒體人曝出真相

      姜大叔侃球
      2025-12-23 10:22:41
      “魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

      “魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

      胖胖說他不胖
      2025-12-22 11:00:13
      全球貴金屬市場集體狂歡,國內(nèi)金飾克價(jià)漲破1400元!消費(fèi)者:買的黃金產(chǎn)品還沒發(fā)貨,就開始漲價(jià),網(wǎng)友熱議......

      全球貴金屬市場集體狂歡,國內(nèi)金飾克價(jià)漲破1400元!消費(fèi)者:買的黃金產(chǎn)品還沒發(fā)貨,就開始漲價(jià),網(wǎng)友熱議......

      每日經(jīng)濟(jì)新聞
      2025-12-23 14:55:08
      南京博物院風(fēng)波后續(xù):全網(wǎng)追的神秘“老同志”,他到底是誰?

      南京博物院風(fēng)波后續(xù):全網(wǎng)追的神秘“老同志”,他到底是誰?

      恪守原則和底線
      2025-12-22 05:40:06
      濟(jì)南知名烘焙品牌愛立頌兩門店近日關(guān)閉,商家稱系房租到期且無恢復(fù)計(jì)劃

      濟(jì)南知名烘焙品牌愛立頌兩門店近日關(guān)閉,商家稱系房租到期且無恢復(fù)計(jì)劃

      政法頻道
      2025-12-23 20:31:48
      交警提醒:紅燈右轉(zhuǎn)新規(guī),別再憑感覺轉(zhuǎn)!看錯(cuò)一個(gè)標(biāo)志扣3分罰200

      交警提醒:紅燈右轉(zhuǎn)新規(guī),別再憑感覺轉(zhuǎn)!看錯(cuò)一個(gè)標(biāo)志扣3分罰200

      今朝牛馬
      2025-12-22 22:10:53
      挺著七個(gè)月孕肚跪雪地作畫,繼子女喊“梅媽媽”,撕碎了后媽劇本

      挺著七個(gè)月孕肚跪雪地作畫,繼子女喊“梅媽媽”,撕碎了后媽劇本

      做一個(gè)合格的吃瓜群眾
      2025-12-23 19:02:01
      男兒護(hù)國著征袍:烏綠衣主教葉爾馬克血戰(zhàn)沙場,俄塔曼港遭重創(chuàng)

      男兒護(hù)國著征袍:烏綠衣主教葉爾馬克血戰(zhàn)沙場,俄塔曼港遭重創(chuàng)

      史政先鋒
      2025-12-23 14:41:27
      生物博士變身鑒寶 公證書撤銷照樣算數(shù) 南博為何“制造”龐家后人

      生物博士變身鑒寶 公證書撤銷照樣算數(shù) 南博為何“制造”龐家后人

      金牌輿情官
      2025-12-22 22:40:53
      建議停用這5種保健品,吃得越多,身體負(fù)擔(dān)或越重?一文講清

      建議停用這5種保健品,吃得越多,身體負(fù)擔(dān)或越重?一文講清

      橘子約定
      2025-12-22 22:15:56
      王炸開局!新機(jī)官宣:1月1日,正式發(fā)售上市!

      王炸開局!新機(jī)官宣:1月1日,正式發(fā)售上市!

      科技堡壘
      2025-12-21 11:33:39
      巴薩核心對著隊(duì)友怒吼!西媒:他才是巴薩的真領(lǐng)袖

      巴薩核心對著隊(duì)友怒吼!西媒:他才是巴薩的真領(lǐng)袖

      星耀國際足壇
      2025-12-23 11:20:19
      小麥身價(jià)下跌,德轉(zhuǎn):僅靠穩(wěn)定發(fā)揮不足以維持高身價(jià),且已29歲

      小麥身價(jià)下跌,德轉(zhuǎn):僅靠穩(wěn)定發(fā)揮不足以維持高身價(jià),且已29歲

      懂球帝
      2025-12-23 21:58:18
      2025-12-23 23:28:49
      市象 incentive-icons
      市象
      研究真問題,書寫真洞察。
      368文章數(shù) 20關(guān)注度
      往期回顧 全部

      科技要聞

      慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

      頭條要聞

      特朗普稱出于國家安全"必須拿下格陵蘭島" 又扯上中俄

      頭條要聞

      特朗普稱出于國家安全"必須拿下格陵蘭島" 又扯上中俄

      體育要聞

      楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

      娛樂要聞

      朱孝天回應(yīng)阿信感謝,自曝沒再收到邀約

      財(cái)經(jīng)要聞

      祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

      汽車要聞

      四款新車集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

      態(tài)度原創(chuàng)

      游戲
      房產(chǎn)
      健康
      親子
      旅游

      原來句句有回應(yīng)!過完3.8主線,回頭看《不眠之夜》玩家萬分感慨

      房產(chǎn)要聞

      獨(dú)家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

      這些新療法,讓化療不再那么痛苦

      親子要聞

      年銷10億的兒童止咳藥,說明書增加:會(huì)導(dǎo)致“自殺傾向”

      旅游要聞

      大反轉(zhuǎn)!即將抵達(dá)仙游!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产精品白浆一区二小说| 一区二区三区四区在线不卡高清| 定兴县| 中文人妻无码一区二区三区在线| 日韩av一区二区精品不卡| 人人妻人人澡人人爽人人精品97| 国产精品无码成人午夜电影| 国产精品天天干| 东港市| 粗大的内捧猛烈进出小视频| 美女大量吞精在线观看456| yw尤物av无码国产在线观看| 乱中年女人伦av三区| 夫妻拳交自拍| 一本色道av| 亚洲国产精品美女久久久久| 久久综合久久综合九色| 免费乱理伦片在线观看| 久久久久国产精品人妻| 久久窝| 好吊视频一区二区三区| 久久久中日ab精品综合| 亚洲第一无码AV无码专区| 一级AV韩国| 白嫩日本少妇做爰| 日韩丰满少妇无码内射| 午夜欧美日韩在线视频播放| 久草福利| AV资源吧| 美女张开腿黄网站免费| 国产欧美va欧美va在线| 国产igao| 国产人妻精品一区二区三区不卡| 国内国外精品影片无人区| jizz麻豆| 巴林左旗| 日韩熟女精品一区二区三区| 国产精品 视频一区 二区三区| av动态| 成人网中文字幕| 欧美无人区码suv|