AI視頻生成,正在追求變得好玩?
12月16日,阿里千問App(應(yīng)用程序)同步上線最新視頻生成模型萬相2.6,并向所有用戶免費(fèi)開放。《每日經(jīng)濟(jì)新聞》記者了解到,基于該模型的核心能力,千問App上線了“AI小劇場”功能(即基于該模型的角色扮演新功能),在國內(nèi)首次實(shí)現(xiàn)了“角色合拍”玩法。
記者體驗(yàn)千問App后發(fā)現(xiàn),點(diǎn)進(jìn)“AI小劇場”,的確可以和知名角色、歷史人物合拍視頻。
根據(jù)示例,輸入簡單描述,“蘇軾”就能穿越時空被高考難到崩潰;只要上傳自己的照片錄入角色,就能和美國隊(duì)長出現(xiàn)在同一視頻中,接受他送的玫瑰花。此外,視頻生成后,還可以一鍵分享鏈接到微信好友、朋友圈和QQ好友。
值得注意的是,這一功能對標(biāo)的正是Open AI旗下的Sora2。“AI小劇場”玩法目前僅Sora2大模型有類似功能,而Sora2的優(yōu)勢便在于,其同步上線了內(nèi)容社區(qū),開啟了AI內(nèi)容社區(qū)化時代。
當(dāng)前,在AI視頻生成領(lǐng)域,中國企業(yè)和美國企業(yè)正展開激烈競爭。根據(jù)招商證券統(tǒng)計(jì),目前,該領(lǐng)域已有15個以上被廣泛認(rèn)可的模型。在此大背景下,阿里持續(xù)加碼視頻生成賽道意欲何為?
![]()
對標(biāo)Sora2,阿里持續(xù)加碼視頻生成
事實(shí)上,今年以來,阿里持續(xù)布局視頻生成賽道。
2月,據(jù)阿里云披露消息,阿里云視頻生成大模型萬相2.1(Wan)重磅開源,此次開源采用Apache2.0協(xié)議,14B和1.3B兩個參數(shù)規(guī)格的全部推理代碼和權(quán)重全部開源,同時支持文生視頻和圖生視頻任務(wù)。
而在今年9月的云棲大會上,阿里發(fā)布通義萬相Wan2.5 preview系列模型,首次實(shí)現(xiàn)音畫同步的視頻生成能力,視頻時長從5S提升至10S,支持24幀每秒的1080P高清輸出,通義App第一時間接入了視頻生成模型。
11月17日,阿里正式宣布“千問”項(xiàng)目,全力進(jìn)軍AI to C市場,“通義”App正式改名為“千問”App。12月初,千問App便已接入萬相系列當(dāng)時的最新模型Wan2.5。
這一次,千問App第一時間接入的萬相2.6視覺大模型,支持音畫同步、多鏡頭生成及聲音驅(qū)動等功能,號稱是全球功能最全的視頻生成模型,也是國內(nèi)首個支持角色扮演功能的視頻生成模型。阿里方面表示,這次更新的萬相2.6,有的功能比如音頻驅(qū)動生成視頻,Sora2尚未實(shí)現(xiàn)。
為何這次千問卯足了勁對標(biāo)Sora2,雙方之間究竟差距何在?
根據(jù)華泰證券相關(guān)研報(bào),9月30日,Open AI發(fā)布最新音視頻生成模型Sora2,并同步試運(yùn)行由該模型驅(qū)動的iOS社交應(yīng)用Sora。
該研報(bào)認(rèn)為,Sora此次較大的突破在于推出AI社交平臺,有望通過雙邊效應(yīng)實(shí)現(xiàn)自我強(qiáng)化,進(jìn)一步降低內(nèi)容創(chuàng)作的門檻,吸引全球開發(fā)者與普通用戶共創(chuàng)內(nèi)容生產(chǎn),并通過垂直分發(fā)機(jī)制提升內(nèi)容消費(fèi)效率,有望創(chuàng)造新型社交場景。
有觀點(diǎn)認(rèn)為,Sora2及其配套社交應(yīng)用的發(fā)布,標(biāo)志著AI視頻生成與社交互動進(jìn)入融合階段,或迎來AI視頻生成的“ChatGPT時刻”。
工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林對《每日經(jīng)濟(jì)新聞》記者表示,如今,在AI大模型算法能力上,中國相對較強(qiáng),具備追上Sora2的能力,且阿里本身具備比較豐富的數(shù)據(jù)資源和算力資源,即便短期有些性能差距,阿里千問也能通過持續(xù)的算力和數(shù)據(jù)投入來解決問題。
“性能上應(yīng)該是能夠無限接近Sora2。當(dāng)然,現(xiàn)階段還是有些差距的,多是一些生成細(xì)節(jié)上的差距。”盤和林說。
記者在千問App實(shí)測“AI小劇場”功能發(fā)現(xiàn),在選擇現(xiàn)存示例進(jìn)行“AI翻拍”的情況下,其視頻生成時間一般在2到5分鐘,可生成一段10秒視頻。
不過,當(dāng)記者輸入描述,要求“孫悟空和財(cái)神擁抱”時,千問App的理解并不到位,給出了前后不相關(guān)的數(shù)個視頻畫面,包括孫悟空舉起玫瑰花、兩個財(cái)神擁抱。
千問App月內(nèi)狂推18個版本,阿里“硬剛”O(jiān)pen AI背后的豪賭
就視頻生成賽道而言,千問App在國內(nèi)也有不少競爭對手。
同樣在12月16日,字節(jié)跳動旗下“即夢AI”網(wǎng)頁版官宣全面升級,打造一站式“AI片場”。此次升級核心是即夢AI最新視頻生成能力“視頻3.5 Pro”,支持視頻與音頻同時生成,人物口型、樂器演奏、環(huán)境音效等元素?zé)o需再后期配音,提升視頻的真實(shí)感與沉浸感。
今年12月,快手旗下“可靈AI”推出視頻生成2.6模型。據(jù)介紹,該模型提供了“音畫同出”能力,能夠在單次生成中,輸出包含自然語言、動作音效以及環(huán)境氛圍音的完整視頻。目前,其語音支持生成中文與英文,生成的視頻長度最長可達(dá)10秒。12月5日,可靈AI宣布,可靈O1主體庫和對比模板兩大功能全新上線。
盤和林認(rèn)為,各大視頻生成AI之間,差距都比較小。“千問視頻生成能力應(yīng)該和即夢、可靈在同一起跑線。”他表示,因?yàn)楦骷以谒惴ā⑺懔Α?shù)據(jù)等基礎(chǔ)上處于近似的水平,AI視頻生成應(yīng)用是這些基礎(chǔ)的結(jié)果而已。
值得一提的是,這些大廠共同爭奪的,是一個廣闊的市場前景。
招商證券相關(guān)研報(bào)提及,根據(jù)Grand View Horizon,2025年全球AI視頻生成市場規(guī)模預(yù)計(jì)達(dá)8億美元。在其基本情形假設(shè)中,預(yù)計(jì)AI視頻生成可觸達(dá)市場規(guī)模接近400億美元,包含B端規(guī)模360億美元(90%占比)和C端規(guī)模40億美元(10%占比)。
不過,12月13日,據(jù)《中國經(jīng)營報(bào)》報(bào)道,近日,硅谷風(fēng)投機(jī)構(gòu)a16z合伙人Olivia Moore在社交媒體爆料稱,Sora的下載量仍在增長,但早期用戶留存率數(shù)據(jù)看起來相當(dāng)疲軟。他曬出了一張App數(shù)據(jù)監(jiān)測服務(wù)SensorTower的數(shù)據(jù)截圖:Sora的1天、7天、30天和60天用戶留存率分別為10%、2%、1%和0%。
不過,就阿里在AI上的整體布局來看,千問App上線“AI小劇場”的訴求未必是劍指AI視頻生成市場這么簡單。千問App剛上線時,阿里便宣稱,其要與ChatGPT展開全面競爭,此次推出視頻生成新玩法,或是試圖縮小與Open AI的綜合差距,為正面抗衡鋪路。
截至12月17日,千問App公測已滿一個月。一個月來,這款A(yù)pp共計(jì)更新18個版本,正加強(qiáng)創(chuàng)作、學(xué)習(xí)、辦公三大場景能力。12月10日,阿里官方信息顯示,自11月17日公測僅23天,千問月活躍用戶數(shù)(含App、Web、PC端)已突破3000萬,成為當(dāng)前全球增長最快的AI應(yīng)用。
組織架構(gòu)的調(diào)整也在進(jìn)行中。12月9日消息,阿里已成立千問C端事業(yè)群,由阿里巴巴集團(tuán)副總裁吳嘉負(fù)責(zé)。據(jù)媒體報(bào)道,阿里在內(nèi)部溝通中提及,千問C端事業(yè)群的首要目標(biāo)是將千問打造成為一款超級App,成為AI時代用戶的第一入口。
AI視頻生成的戰(zhàn)場硝煙彌漫,時至如今,這場較量不僅是技術(shù)參數(shù)的比拼,更是各家生態(tài)能力與用戶洞察的對決。在此大背景下,在AI賽道上,阿里若想“硬剛”O(jiān)pen AI,需要做的還有很多。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.