![]()
文|魏琳華
編|王一粟
“你還是回去吧,大模型在中國(guó)沒有機(jī)會(huì)。”
2023年剛創(chuàng)業(yè),愛詩(shī)科技創(chuàng)始人兼CEO王長(zhǎng)虎收到了天使投資人朱嘯虎的“勸退”。
但兩年時(shí)間過去,兩個(gè)節(jié)點(diǎn)顛覆了投資人對(duì)AI視頻生成賽道的固有印象。先是2024年OpenAI 發(fā)布Sora爆火,再到今年被定義為AI視頻“商業(yè)化元年”,AI視頻賽道融資的速度開始加快。
兩周前(9月10日),愛詩(shī)科技拿下了AI視頻賽道單輪最高融資6000萬(wàn)美元(約合4.3億元人民幣),更多好消息開始被人們注意到,包括突破1億的全球用戶、目前收入能夠覆蓋絕大部分支出。種種跡象表明,愛詩(shī)科技已經(jīng)解決了最難的生存問題,開始瞄準(zhǔn)大廠做下一步規(guī)劃。
熬過第一個(gè)生死存亡的節(jié)點(diǎn),對(duì)于愛詩(shī)科技來說只是個(gè)開始,如何和資源豐厚、有應(yīng)用場(chǎng)景的可靈、即夢(mèng)們掰手腕,才是一場(chǎng)更難打的仗。
利好小白用戶,愛詩(shī)科技的破圈突圍
這筆融資,堪稱愛詩(shī)科技的“及時(shí)雨”。
9月10日,愛詩(shī)科技完成6000萬(wàn)美元(約合4.3億元人民幣)B輪融資,該輪融資由阿里領(lǐng)投,達(dá)晨財(cái)智、深創(chuàng)投、北京市人工智能產(chǎn)業(yè)投資基金、湖南電廣傳媒、巨人網(wǎng)絡(luò)和Antler等投資方跟投。
能拿到這筆投資,一定程度上,是因?yàn)閻墼?shī)科技的產(chǎn)品已經(jīng)被市場(chǎng)廣泛認(rèn)可。
在宣布B輪融資的前一個(gè)月,愛詩(shī)科技放出了一個(gè)消息,其產(chǎn)品目前全球用戶數(shù)量突破一億,對(duì)比3個(gè)月前,這個(gè)數(shù)字還是6000萬(wàn)。也是在6月,愛詩(shī)科技的AI視頻產(chǎn)品Pixverse的國(guó)內(nèi)版“拍我AI”在國(guó)內(nèi)上線。
尤其在今年,整個(gè)AI視頻賽道的用戶基本盤正在高速增長(zhǎng)。以快手可靈AI為例,截至7月底,可靈AI的用戶數(shù)超過4500萬(wàn),同樣比三個(gè)月前的2200萬(wàn)翻了一番。
被市場(chǎng)認(rèn)可、拿到融資,愛詩(shī)科技是怎么做到的?靠的是貼近用戶的產(chǎn)品設(shè)計(jì)。
愛詩(shī)科技的模型優(yōu)化,核心在于怎么讓用戶能夠真地用起來,并且用得順手。
以今年8月愛詩(shī)科技更新的V5版本模型為例,其重點(diǎn)就放在了用戶使用體驗(yàn)的改進(jìn)上。
比起其他廠商,愛詩(shī)科技的突出優(yōu)勢(shì)就是快。從模型生成速度來說,V5依然保持著生成視頻速度快的優(yōu)勢(shì)。比如,當(dāng)光錐智能讓它生成一個(gè)“小貓?zhí)钡腁I視頻,它在20秒以內(nèi)就給出了一版,而同類產(chǎn)品可能要花幾分鐘左右。
從生成質(zhì)量來說,愛詩(shī)科技業(yè)也達(dá)到了商業(yè)化的標(biāo)準(zhǔn)質(zhì)量,不過也優(yōu)缺點(diǎn)并存。
V5在動(dòng)效的真實(shí)性上的效果只能算是及格水平,但在用戶意圖的拆解上表現(xiàn)更加突出。
以貓咪落水的生成效果對(duì)比,在貓咪入水后的水花效果和飛起運(yùn)動(dòng)的情況來看,存在質(zhì)感不夠逼真的問題。而快手可靈AI的落水效果更自然,卻沒有理解“英短貓”和“跳水”的關(guān)鍵詞,生成的畫面和用戶需求有一定差距。
此外,瞄準(zhǔn)大眾創(chuàng)造者的情況下,愛詩(shī)科技在產(chǎn)品設(shè)計(jì)上多了一些巧思,比如專門為小白用戶做了智能體,讓沒有基礎(chǔ)的用戶也能輕松做出同款視頻。
目前,愛詩(shī)科技在拍我AI的智能體廣場(chǎng)中放入了大量模版,只需要用戶上傳照片并根據(jù)提示操作,就能生成同款視頻。比如上傳自己的照片、并寫上一個(gè)名人,就能得到你和偶像合拍的視頻。和過往需要調(diào)整比例、首尾幀、寫好畫面分鏡等繁瑣操作相比,智能體的介入降低了用戶的使用門檻。
![]()
不過在使用體驗(yàn)上,目前模版還不夠盡善盡美,出現(xiàn)了識(shí)別對(duì)象錯(cuò)誤的問題。
實(shí)際測(cè)試中,光錐智能上傳了OpenAI前首席科學(xué)家Ilya的照片,要求其做一個(gè)和Sam Altman合拍的視頻。可以看到人物主體一致性保持得很不錯(cuò),動(dòng)起來的效果也足夠逼真,只是可惜智能體找錯(cuò)了Sam Altman的照片。
整體來說,愛詩(shī)科技的模型生成水平已經(jīng)達(dá)到了面向C端用戶商業(yè)化的標(biāo)準(zhǔn),但部分生成動(dòng)效的真實(shí)性、運(yùn)鏡效果等細(xì)節(jié)的表現(xiàn)還有待優(yōu)化。
不過,相對(duì)于模型上的一些小優(yōu)勢(shì),在產(chǎn)品上的“視頻模版”爆款玩法才是真正讓這家公司破圈的功臣。
在產(chǎn)品層面,愛詩(shī)科技熱衷于靠各種視頻特效模版實(shí)現(xiàn)破圈,再靠模版在社交媒體平臺(tái)上的傳播來吸引更多用戶使用。
“普通人不需要輸入Prompt,只需要上傳一張圖片,選好模版就能達(dá)到 100% 的成功率。”王長(zhǎng)虎這樣評(píng)價(jià)視頻模版的出現(xiàn),“這是真的讓普通人玩起來的時(shí)刻,我們認(rèn)為這是視頻生成的 ChatGPT 時(shí)刻。”
出身于字節(jié)跳動(dòng)的王長(zhǎng)虎,似乎深諳爆款的運(yùn)營(yíng)之道。
![]()
不過,靠爆款拉動(dòng)應(yīng)用,愛詩(shī)科技不是第一個(gè),也不是最后一個(gè)。
最近,谷歌Nano Banana模型掀起的“手辦照片”特效就是一個(gè)風(fēng)靡海內(nèi)外的爆款模版。就在9月15日,谷歌旗下的Gemini的App排名甚至超過了ChatGPT,登上了美國(guó)App Store免費(fèi)榜單的第一。
有限資源,靠跑通商業(yè)化“自救”
作為AI視頻生成賽道創(chuàng)業(yè)第一波玩家,愛詩(shī)科技的成名其實(shí)夠早。
從2024年1月,這家公司拿出了首個(gè)視頻生成模型PixVerse V1版本,其發(fā)布時(shí)間早了Sora一個(gè)月,并在上線的30天實(shí)現(xiàn)破百萬(wàn)訪問量。雖然和RunWay、Pika等海外產(chǎn)品同期,但苦于國(guó)內(nèi)當(dāng)時(shí)不看好AI視頻賽道,在國(guó)內(nèi)知名度不足。
直到去年2月捧出視頻生成模型Sora時(shí),國(guó)內(nèi)才開始熱切關(guān)注AI視頻生成賽道。
AI視頻行業(yè)相對(duì)大語(yǔ)言模型,燒錢多、爆發(fā)晚,導(dǎo)致每一個(gè)創(chuàng)業(yè)玩家只能在相對(duì)有限的資源里艱難求生。
轉(zhuǎn)向國(guó)內(nèi),AI視頻賽道的入局者們來得更晚,快手和MiniMax先后放出的視頻生成模型,但輕易搶走了風(fēng)頭。去年6月,快手捧出內(nèi)部研發(fā)的視頻生成模型可靈1.0,MiniMax也在去年9月發(fā)布海螺AI。
為什么這段時(shí)間,快手可靈和MiniMax的海螺AI成了后起之秀?原因是愛詩(shī)的V1、V2版本,在抽卡效果和視頻質(zhì)量上表現(xiàn)不夠好。
畢竟,愛詩(shī)科技當(dāng)時(shí)能拿到的資源非常有限。
“早些年,有些錢我們沒有拿。”王長(zhǎng)虎說,“但回頭看,我們應(yīng)該多儲(chǔ)備一些資金,盡可能地去拿錢,更早把模型做出來。”
王長(zhǎng)虎回憶起來也難免后悔,他也曾透露,最早的時(shí)候,愛詩(shī)科技只有百卡儲(chǔ)備,后來拿到新一輪融資才升級(jí)到千卡級(jí)別。
在掰著手指頭花錢的情況下,選擇比努力可能更重要。
字節(jié)出身的王長(zhǎng)虎,曾在AI視頻團(tuán)隊(duì)給抖音、今日頭條等產(chǎn)品做技術(shù)支撐,在選擇To B還是To C上,王長(zhǎng)虎認(rèn)為走To B路線在商業(yè)化上的穩(wěn)定性不足。
“早期一些移動(dòng) App 也用過一些計(jì)算機(jī)視覺公司的 API,但這些 App 做得更大后,就開始用自建的。”王長(zhǎng)虎說。
再?gòu)氖袌?chǎng)選擇上,在海外對(duì)AI工具的認(rèn)知和用戶付費(fèi)意愿更好的情況下,愛詩(shī)科技也選擇了第一天就出海,這讓這家公司在海外率先積累了一定用戶量,打通變現(xiàn)也會(huì)更方便。
現(xiàn)在,當(dāng)模型能力達(dá)到標(biāo)準(zhǔn)線的情況下,愛詩(shī)科技也迎來了自己的爆發(fā)節(jié)點(diǎn)。
這家公司推出的“毒液”模版成為了引爆流量的關(guān)鍵。這個(gè)模版于去年11月上線后,就在海外的TikTok等社交媒體上流行,變身特效視頻被播放超過 10 億次,甚至火到了國(guó)內(nèi)。當(dāng)時(shí)的小紅書、閑魚等平臺(tái)不少用戶甚至發(fā)帖找人花錢做同款特效視頻。
“毒液”模版走紅帶來的熱度,證明了一件事,即當(dāng)模型生成的視頻質(zhì)量達(dá)到用戶能接受的水平線,創(chuàng)業(yè)公司同樣能和大廠們一起“卷爆款”。
有了初步的市場(chǎng)認(rèn)可和用戶數(shù)量,愛詩(shī)開始探索更多盈利渠道,比如繼續(xù)打通to B業(yè)務(wù)。從今年1月,愛詩(shī)科技開始支持各行業(yè)的API和定制化視頻生成,涵蓋互聯(lián)網(wǎng)、營(yíng)銷、電商等。
愛詩(shī)的發(fā)展,一定程度上體現(xiàn)了AI視頻行業(yè)商業(yè)化的共性,在商業(yè)化前景不夠明朗的情況下,B端和C端要兩手抓。
同樣是做視頻生成,生數(shù)科技走的則是“先B后C”的路線。成立兩年的時(shí)間里,生數(shù)科技有1年半都在琢磨落地問題。在今年的智源大會(huì)上,之前主攻B端的生數(shù)科技CEO駱怡航給出了“八大行業(yè)、三十大場(chǎng)景”的版圖,其中,互聯(lián)網(wǎng)、廣告、電影、動(dòng)漫的應(yīng)用占到了8成。
當(dāng)大家的競(jìng)爭(zhēng)基本盤又回到了同一張桌子上,怎么看未來表現(xiàn),就要看誰(shuí)的商業(yè)化路線執(zhí)行成果更漂亮。
“DeepSeek時(shí)刻”未至,AI視頻賽道的路不好走
雖然愛詩(shī)科技已經(jīng)初步取得市場(chǎng)認(rèn)可,但面向未來,to C是一條更難走的路。
目前自帶短視頻產(chǎn)品的快手,在技術(shù)和場(chǎng)景的加成下,已經(jīng)占據(jù)市場(chǎng)頭部的位置。
快手Q2財(cái)報(bào)披露,可靈AI在第二季度收入達(dá)到2.5億。據(jù)中金研報(bào),以2025e ARR來測(cè)算,市占率快手可靈全球領(lǐng)先,其市占率約20%,而海螺、Pixverse、生數(shù)、即夢(mèng)市占率均估算在4-5%區(qū)間。擁擠的AI視頻賽道里,擠滿了玩家。
![]()
但相比大廠,愛詩(shī)科技的資源少得可憐。截至9月,愛詩(shī)科技累計(jì)融資僅在8億元人民幣左右,這筆錢實(shí)在太少了。
雖然快手并未披露可靈的研發(fā)成本,但AI視頻模型前期投入的巨額訓(xùn)練成本就不會(huì)是一筆小數(shù)目,2.5億的營(yíng)收也只夠其毛利上追平其推理成本。程一笑還在Q2財(cái)報(bào)電話會(huì)上表示,快手將在未來三年甚至更長(zhǎng)時(shí)間進(jìn)行更大規(guī)模研發(fā)投入。
“我們沒有那樣的機(jī)會(huì)。做一遍做錯(cuò)了就可能發(fā)展不起來了。因?yàn)橹灰鼍蜁?huì)花很多錢,我們不像 OpenAI 那樣不差錢。”
王長(zhǎng)虎很明白,AI視頻賽道的處境很緊張,越來越卷的賽道里,沒有新一輪融資支撐、商業(yè)化沒跑通的企業(yè),將會(huì)提前出局。
為了搶用戶,限時(shí)試用、積分贈(zèng)送已經(jīng)成了各家產(chǎn)品心照不宣的手段。就在手辦特效走紅的本月,愛詩(shī)科技也推出了不限積分的限時(shí)6天試用活動(dòng)。
愛詩(shī)科技之所以有底氣搞這個(gè)活動(dòng),就是通過最先出海+C端的策略,已經(jīng)靠商業(yè)化變現(xiàn)保證先讓自己活下去。據(jù)王長(zhǎng)虎透露,目前公司產(chǎn)品的訂閱收入已經(jīng)覆蓋成本。
愛詩(shī)的商業(yè)化策略一直都是很清晰,先聚焦C端,快速驗(yàn)證商業(yè)模式,憑借健康的ROI(投資回報(bào)率)吸引新的投資,再利用獲得的資金投入技術(shù)研發(fā),不斷緊追大廠的步伐。
放長(zhǎng)遠(yuǎn)看,各種競(jìng)爭(zhēng)策略爭(zhēng)奇斗艷,而當(dāng)下,技術(shù)仍然是決定用戶選擇的關(guān)鍵因素。
谷歌最新發(fā)布的VEO 3模型就是一個(gè)典型的例子,它不僅是一個(gè)能夠生成高質(zhì)量畫面的視頻模型,更是一個(gè)原生多模態(tài)大模型,能夠在生成視頻的同時(shí),精準(zhǔn)生成與之匹配的環(huán)境音效。在商業(yè)化探索上,國(guó)內(nèi)廠商還沒有推出可直接對(duì)標(biāo)的原生多模態(tài)產(chǎn)品。
在視頻訓(xùn)練數(shù)據(jù)來源、資源不同的情況下,雖然國(guó)內(nèi)AI視頻生成領(lǐng)域的玩家們有不同的優(yōu)勢(shì)領(lǐng)域,但這些差距還不夠大。顯而易見,AI視頻還沒有迎來自己的DeepSeek時(shí)刻。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.