![]()
編者的話:2024年2月15日,一幅“女子在東京街頭漫步”的演示畫面驚艷全球,讓人們看到了人工智能(AI)的無限可能。可僅僅兩年多的時間,生成這一視頻的大模型應用Sora卻迎來了關停的命運——3月25日,發布Sora的美國人工智能公司OpenAI宣布將停止Sora視頻生成服務。也正是在這短短兩年時間里,全球文生視頻行業迎來快速發展,相關大模型快速推出,賽道競爭也愈發激烈。作為OpenAI的里程碑產品,Sora為何會在此時宣布關停?這給全球相關大模型企業帶來怎樣的啟示?中國的文生視頻大模型競爭力又體現在哪里?
每天虧損約100萬美元
就在上個月初,OpenAI首席執行官奧爾特曼來到洛杉磯參加奧斯卡派對時,他的公司距離向好萊塢電影公司授權其Sora視頻生成工具僅剩幾周時間。迪士尼高管們正在為雙方合作帶來的股價上漲而舉杯慶祝,但他們不知道的是,在Sora推出后的幾個月里,它已悄然成為OpenAI的一個不利因素,尤其是在這家初創公司為即將進行的首次公開募股做準備之際。
“奧爾特曼曾夢想通過該項目將公司進一步打造成AI時代的創意先鋒,并且帶來豐厚的收入,然而這一標志性項目以令人震驚的方式告終。”據美國《華爾街日報》報道,在ChatGPT大獲成功之后,Sora被吹捧為AI領域下一個面向消費者的前沿產品。Sora是一款文生視頻大模型,于2024年2月15日正式對外發布。2025年9月30日,OpenAI發布視頻生成模型Sora 2并推出社交應用Sora,該應用程序可以根據用戶的文本提示創建最長60秒的逼真視頻。
然而據美國《華爾街日報》報道,這款應用程序并未如其開發者所設想的那樣取得成功。它更像是人工智能的“垃圾”而非“魔法”。有數據顯示,該應用上線后不久,全球用戶數曾在一段時間內達到約100萬的峰值,但在隨后的幾個月里,用戶數降至50萬以下。
Sora關停后,多家外媒在分析其背后原因時,將矛頭主要指向了成本問題。據一位知情人士透露,Sora每天虧損約100萬美元,原因在于大規模運行視頻生成任務的成本高得驚人。美國《紐約時報》在一篇文章中分析說,去年,OpenAI營收約為130億美元,但預計在未來4年還將花費約1000億美元。對OpenAI來說,運營一個AI視頻生成服務,尤其是一個沒有收入來源的應用程序是一項巨大開支。
除了成本之外,此次關停Sora也暴露出OpenAI公司自身的業務和競爭力問題。《華爾街日報》分析認為,OpenAI正面臨來自競爭對手Anthropic日益增大的壓力,后者憑借多款產品,已成為當下美國企業AI服務的主要提供商。從業務板塊看,Anthropic押注的產品比OpenAI少,避開了圖像和視頻生成產品,這也保證其能夠將精力集中在重要盈利方面。如今,OpenAI和Anthropic兩家公司都已朝著公開上市邁出步伐,競爭更加激烈。這也迫使OpenAI不得不及時拋棄虧損項目,調整戰略重心。
至于Sora未來將用于何處?OpenAI表示,公司將繼續在幕后使用該技術以訓練人形機器人完成特定的任務。與此同時,OpenAI預計將把重點轉向一款新的“超級應用程序”,該應用程序融合了所謂的“代理式”AI工具,能夠自主為用戶執行編寫軟件、分析數據和預訂旅行等任務。
“中國大模型更具規模化應用潛力”
“Sora變得令人厭煩。”美國“商業內幕”網站在報道中提到,很多下載Sora的用戶在一開始會對AI制作視頻充滿好奇與興趣,但沒過多久就失去了新鮮感。幾乎在同一時期,Meta也嘗試推出了一款基于AI技術的視頻應用程序,結果同樣令人失望。這引發了一個值得深思的問題:AI生成視頻的商業價值究竟有多大,以及如何才能可持續發展下去?
盡管Sora在商業化道路上最終失敗,但接受《環球時報》記者采訪的多位專家均對未來AI視頻大模型的商業化潛力表示看好。
上海外國語大學世界智庫研究中心人工智能項目負責人張志鵬在接受《環球時報》記者采訪時表示,生成式AI賽道的競爭已不再是單純的算力角逐,而是涵蓋市場場景、人才密度、數字基建與文化底蘊的全要素、系統性競爭。
張志鵬進一步分析說,有數據顯示,Sora生成一段15秒左右的理想鏡頭需嘗試5至10次,合計成本約800元人民幣。相較之下,同樣是生成15秒高質量鏡頭,中國主流文生視頻大模型的試錯成本已被壓縮至150元人民幣左右。這種成本優勢讓中國大模型更具規模化應用潛力,尤其受到中小企業青睞。
美國《福布斯》雜志也在一篇文章中稱,Sora的關停,或許并非是OpenAI的戰略失誤,而是一個關于AI競爭中“場景數據優勢”的故事。未來能夠可持續發展的項目或者AI應用,將是那些有豐富場景數據,如客戶互動、臨床診療、物流網絡等,并能在此基礎上深度錨定與落地的項目。
伴隨著Sora即將關停,全球文生視頻行業迎來新的競爭格局。據美國《洛杉磯時報》近日報道,在OpenAI表示將關閉Sora一周之后,來自中國的可靈AI(Kling AI)、美國RunwayML 等同類大模型已經占據了優勢地位。數據顯示,可靈AI自3月20日至3月26日的全球周活躍用戶數較前一周增長了4%。另外值得關注的是,在過去的一年里,谷歌、Meta以及美國富豪馬斯克的xAI都在各自的聊天機器人中加入了文生視頻功能,盡管這些公司并未單獨披露這些功能的具體使用數據,但這也意味著賽道競爭更加激烈。報道中提醒,與OpenAI一樣,如果這些競爭對手希望避免重蹈覆轍,就必須在用戶需求與成本之間取得平衡。
張志鵬認為,龐大的市場為中國文生視頻大模型構建“技術賦能場景、場景反哺技術”的商業閉環提供了土壤。他舉例說:“中國擁有極為活躍的短視頻和微短劇生態,為視頻大模型提供了大規模工業化應用場地,使內容創作者和大模型開發者雙方都能根據真實的受眾反饋不斷試錯、快速迭代。”
市場進入多極化競爭
2023年,在文生視頻剛剛起步時,一段AI生成的威爾·史密斯吃意大利面視頻,因其質量之拙劣成功“出圈”,被認為是AI在視頻生成領域能力有限的直觀寫照。
短短3年后,如今各大AI企業視頻模型所生成的“吃面”視頻已然真假難辨。誰生成的視頻更真實成為各家企業模型水平的“試金石”。
英國廣播公司近日在報道中提到 ,中國企業字節跳動開發的視頻生成模型Seedance 2.0不僅能創造出這位明星享用意面的逼真影像,還衍生出史密斯大戰意面怪物等視頻——其觀感堪比高成本電影。影視行業人士直言:“其生成復雜動作場景的逼真度已超越同類產品。”
而這背后,是近年來中國企業在文生視頻領域從“跟跑者”到“領跑者”的身份轉變。
清華大學新聞與傳播學院、人工智能學院雙聘教授沈陽很早之前便開始使用AI進行藝術創作,對中國及海外文生視頻模型的發展有深刻體會。在接受《環球時報》記者采訪時,他對這一領域的變化進行了梳理:2024年2月OpenAI發布Sora技術演示視頻可以被視作該領域的“ChatGPT時刻”,標志著文生視頻進入主流視野并引發資本與公眾關注;在這之后,2024年初至年中,Sora憑借演示質量處于領先位置,Runway Gen-2/Gen-3、Luma Dream Machine、Pika等海外模型同步發展,主要在生成時長、一致性與鏡頭控制維度展開競爭。
“變化出現在2024年中至2025年。”沈陽告訴記者,這一時期中國相關大模型實現趕超。快手旗下的可靈、字節跳動的Seedance、生數科技的Vidu等中國企業模型產品在動作真實度、生成速度、成本控制及中文適配方面取得進展。而從2025年到2026年,市場進入多極化競爭階段。美國企業谷歌的Veo 3.1在電影級光影與音頻同步方面具備優勢,Runway Gen-4側重專業創意控制與工作流集成,而可靈3.0、Seedance 2.0、Vidu Q3等模型在性價比、長視頻一致性、4K分辨率及平臺生態融合上占據優勢。
直到Sora的突然離場,猶如一聲驚雷在文生視頻行業中“炸響”。美國《福布斯》雜志分析稱 ,Sora最終將作為一個警示路標被銘記,其短暫生命帶來的重大實踐教訓在于揭示了AI視頻的下一階段,將不再由發布當天看起來最驚艷的應用決定,而更多地取決于誰能將這些模型整合到圍繞版權、來源、存儲、審批、搜索、版本控制和客戶信任構建的持久工作流程中。
對此,沈陽表示,中國企業推出的與Sora功能類似、以視頻生成為主的模型同樣面臨一致性、物理模擬、長視頻連貫性及算力消耗等技術挑戰。但他同時強調,中國企業依托本土平臺生態形成了“生成—編輯—分發—變現”的完整閉環;中國企業模型的成本控制與迭代速度具備優勢;此外,這些模型針對中文場景與用戶需求進行了深度適配,已經建立起穩定的商業反饋機制。總體而言,Sora屬于技術驅動的獨立應用模式,而中國企業模型已融入內容生產生態系統,形成差異化發展路徑。“可以認為,Seedance 2.0發布之后,這一領域開始進入到中國視頻大模型初步領先的新階段。”沈陽說。(本報記者 肖震冬 李迅典 本報特約記者 任 重)▲
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.