文 | 佘宗明
在吐槽西貝事件風(fēng)波漸平后,9月22日,羅永浩又現(xiàn)身直播間了——這次依舊是真人不露相,露相的是數(shù)字人。
之所以說“依舊”,是因?yàn)椋航衲?月15日,羅永浩數(shù)字人就曾在百度優(yōu)選開啟直播首秀。究其效果之逼真,連羅永浩本人看了都直呼“把我自己都嚇一跳”。
這次羅永浩數(shù)字人在百度優(yōu)選再度開播,將數(shù)字人主播逼真度的天花板又往上抬了一截。看完之后,我的第一感受是:這場直播,真的毫無“預(yù)制感”。
![]()
都知道,前不久羅永浩VS西貝(賈國龍)掀起了預(yù)制菜之爭,而之前在直播間里以呆板表情、機(jī)械反應(yīng)淪為文字復(fù)讀機(jī)的主播數(shù)字分身,未嘗不是數(shù)字人版的“預(yù)制菜”。
如果說2D紙片人式的傳統(tǒng)數(shù)字人承載不起為直播電商“降本增效”的厚望,那羅永浩數(shù)字人的再播,無疑讓人看到了AI重塑直播電商的無限可能——在“高說服力數(shù)字人”的“高”字比Pro更Max時,用數(shù)字人將直播電商重做一遍的圖景還會遠(yuǎn)嗎?
01
說這場直播毫無“預(yù)制感”,是因其首次實(shí)現(xiàn)了無縫銜接式的AI換品——工作人員只需上傳1張圖,即可實(shí)現(xiàn)數(shù)字人帶新品。
別小看這么個動作,它看起來似乎很簡單,實(shí)則數(shù)字人直播場景的歷史性突破。
要知道,傳統(tǒng)數(shù)字人直播的核心桎梏就在于“內(nèi)容預(yù)制不可變”,主播動作、商品展示均需提前通過固定規(guī)范進(jìn)行錄制。這意味著,只要涉及新品上架,便要重新搭建場景、拍攝動作,成本極高,周期很長。碰上快消、3C等品類,傳統(tǒng)數(shù)字人的“慢半拍”反應(yīng),根本無法滿足直播電商“快速上新,靈活選品”之需。
受制于既有短板,預(yù)制動作與新品形態(tài)適配度也經(jīng)常不足,會出現(xiàn)諸如“音容不匹配,商品展示不自然”等問題。
但在9月22日的直播中,羅永浩數(shù)字人連續(xù)展示了多款從未帶過的新品,切換絲滑,動作連貫,講解自然,分明給人“數(shù)字人進(jìn)化成精”的既視感。
AI換品一氣呵成,離不開慧播星背后的高一致性超擬真數(shù)字人長視頻生成技術(shù)。
該技術(shù)基于數(shù)字人視頻生成大模型,使用單張商品圖即可實(shí)現(xiàn)極其自然、保持商品細(xì)節(jié)的人-商品交互視頻生成,大幅降低成本,提升帶新品效率。
02
說這場直播毫無“預(yù)制感”,還是因其顯著強(qiáng)化了數(shù)字人的環(huán)境感知能力——通過融合實(shí)時時間軸與動態(tài)信息庫,讓互動回復(fù)兼具時效性與人格化特征。
為什么此前數(shù)字人直播的用戶平均停留時長總是受限?有個重要原因就在于,直播電商的核心競爭力在于“實(shí)時互動感”,傳統(tǒng)數(shù)字人卻動輒深陷“有問無答”或“答非所問”的泥潭:一方面,是缺乏“時間與熱點(diǎn)感知能力”,另一方面,是缺乏“人設(shè)關(guān)聯(lián)能力”。
但在這次直播中,羅永浩數(shù)字人卻能在用戶評論“國慶前無心上班”時,立刻以“我上班時也不想上班”的羅氏口吻共情;當(dāng)講解到汾酒時,又能自然幽默的說“聽說數(shù)字人要連播兩場的微博發(fā)出后,百度股價漲了不少”的實(shí)時熱點(diǎn),同時還不忘推薦網(wǎng)友下單“很適合來一單×酒慶祝一下”……簡直是“老羅本羅”。
![]()
促成這點(diǎn)的,是百度慧播星對“時間感知+熱點(diǎn)感知”雙重能力的強(qiáng)化:在時間感知層面,系統(tǒng)內(nèi)置“節(jié)日-賽事-熱點(diǎn)”三級日歷,可自動關(guān)聯(lián)“國慶(中秋)放假”等話題;人設(shè)感知層面,實(shí)時抓取羅永浩微博、開播等信息,繼而讓回復(fù)兼具時效性與人格化,而不是照模板答話。
就拿人設(shè)還原缺失難題來說,系統(tǒng)會通過對羅永浩過往直播內(nèi)容的海量學(xué)習(xí),精準(zhǔn)捕捉了其“硬核理性+適度幽默+真誠種草”的人設(shè)內(nèi)核,實(shí)現(xiàn)“思維特征、幽默特質(zhì)、語言風(fēng)格”的復(fù)刻。
正因神形兼?zhèn)涞难诱够樱_永浩數(shù)字人此次直播,用戶互動頻次比3個月前的增長了21%,回復(fù)優(yōu)質(zhì)率暴漲107%。
在此過程中,羅永浩數(shù)字人在邏輯、幽默、帶貨三位一體的“超擬真”中承接了羅永浩IP的商業(yè)價值,解決了“數(shù)字人難延續(xù)IP影響力”的難題。這讓劉潤此前的判斷來得愈發(fā)真切:我們正在見證全新商業(yè)模式的誕生,它就是IP as a Service(IP即服務(wù))。
03
AI換品能力實(shí)現(xiàn)與問答互動能力升級,是百度慧播星數(shù)字人技術(shù)領(lǐng)先性的再加固。
過去幾年,數(shù)字人直播面臨的處境是:一邊是外部期望很高,將其視作AI的下個規(guī)模化落地場景,一邊是實(shí)際效果一般,看著那“幀漂移”的卡頓畫面、臺詞跟表情錯位的游離畫風(fēng),很多人會忍不住將傳統(tǒng)數(shù)字人跟“五毛特效”畫等號。
但作為業(yè)界首個AI全棧式數(shù)字人直播解決方案的慧播星,憑著6月15日那幾項(xiàng)“業(yè)內(nèi)首次”,讓很多人看到了李彥宏所說的“高說服力數(shù)字人”的魔力。
“業(yè)內(nèi)首次”,其一是首次實(shí)現(xiàn)超頭主播用數(shù)字人直播帶貨;其二是首次突破多數(shù)字人同框直播;其三是首次將AI視頻生成極限拉升至超6小時。
這背后是百度慧播星的路徑革新:它沒有沿襲傳統(tǒng)數(shù)字人技術(shù)語言、語音、視覺三條線各自生成內(nèi)容后再拼接的模式,而是利用劇本驅(qū)動的數(shù)字人多模協(xié)同、融合多模規(guī)劃與深度思考的劇本生成、動態(tài)決策的實(shí)時交互、文本自控的語音合成、高一致性超擬真數(shù)字人長視頻生成等創(chuàng)新技術(shù),實(shí)現(xiàn)了數(shù)字人“神、形、音、容、話”的全模態(tài)高度統(tǒng)一。
因而首次亮相的羅永浩數(shù)字人能跳出傳統(tǒng)數(shù)字人“預(yù)制腳本+機(jī)械動作”的初級階段,憑著“劇本生成—動作調(diào)度—語音合成—交互決策”的全鏈路智能協(xié)同驚艷四座。
而此次羅永浩數(shù)字人直播,又在此基礎(chǔ)上進(jìn)行了核心能力升級,強(qiáng)化了數(shù)字人“實(shí)時決策 +自然交互+商品共創(chuàng)”的能力,實(shí)現(xiàn)了從虛擬替身到智能主播的跨越。
在直播中,有個細(xì)節(jié)是:有觀眾留言十一去哪里玩的時候,羅永浩數(shù)字人接話“馬上十一了,出去玩的朋友很適合帶上我們這款面膜。這個品牌,懂得都懂,我就不多說了”。這表明,它能將話術(shù)拆解為“熱點(diǎn)互動”與“帶貨的品質(zhì)承諾”,再用既能體現(xiàn)選品靠譜人設(shè)的適當(dāng)邏輯延展回應(yīng)。
它依托的,就是文心大模型4.5 Turbo的技術(shù)能力:高說服力數(shù)字人具備的多模協(xié)同、?表現(xiàn)?、復(fù)雜交互等特點(diǎn),本就是語?、視覺、語?深度融合等?模型能?的集中展示。
04
得益于此,在Anthropic、OpenAI等國外AI巨頭正投入巨資打造“虛擬員工”時,百度已經(jīng)秀出了羅永浩數(shù)字人這類標(biāo)桿性應(yīng)用案例,率先實(shí)現(xiàn)數(shù)字人業(yè)務(wù)的規(guī)模化盈利,呈現(xiàn)了技術(shù)落地上的優(yōu)勢。
IDC報(bào)告顯示,百度慧播星在技術(shù)能力、產(chǎn)品表現(xiàn)、平臺合規(guī)與穩(wěn)定性、客戶服務(wù)四項(xiàng)指標(biāo)中均位列行業(yè)第一,就是對這份優(yōu)勢的蓋章確認(rèn)。
從效果上看,無論是6月15日直播GMV突破5500萬元,還是9月22日復(fù)播互動創(chuàng)新高,抑或是3C、食品等核心品類的帶貨單量超過以往,都表明了其可以超越真人的效果。
揆諸現(xiàn)實(shí),百度慧播星的突破,正引發(fā)行業(yè)對“數(shù)字人價值”的重新認(rèn)知。
以往多數(shù)數(shù)字人廠商僅提供單一技術(shù)模塊(如視覺生成或語音合成),導(dǎo)致商家需對接多個供應(yīng)商,面臨“技術(shù)碎片化、整體適配難”的痛點(diǎn)。如今慧播星提供從模型訓(xùn)練、動作生成到互動決策的全流程服務(wù),可以讓企業(yè)的數(shù)字人多維需求得到一站式滿足。
以往直播行業(yè)生態(tài)還停留在移動互聯(lián)網(wǎng)階段,現(xiàn)在慧播星則在帶動上下游循著AI的方向升級:上游,素材服務(wù)商開始優(yōu)化商品圖片/視頻的“AI適配性”;中游,催生出“數(shù)字人訓(xùn)練師”“AI腳本策劃”等新職業(yè);下游,品牌開始重構(gòu)“數(shù)字人直播選品邏輯”。
而帶動行業(yè)重新認(rèn)識數(shù)字人價值的百度,也得到市場估價尺度的重新丈量。
9月22日直播當(dāng)天,百度集團(tuán)股價沖高至138美元,創(chuàng)近兩年新高,近20個交易日累計(jì)漲幅超50%。
![]()
這跟百度高說服力數(shù)字人等代表性AI應(yīng)用帶動不無關(guān)系:在2024年以9.8%的市場份額位居中國AI數(shù)字人行業(yè)市場第一的基礎(chǔ)上,其數(shù)字人業(yè)務(wù)仍在呈現(xiàn)高速增長態(tài)勢——尤其是在羅永浩數(shù)字人等案例用“技術(shù)—產(chǎn)品—收入”的閉環(huán)打破了落地難的質(zhì)疑后。
時至今日,數(shù)字人跟蘿卜快跑等已成百度AI跑馬場里跑出的典型性超級應(yīng)用,也成了百度估值中樞上移、股價市值上漲的核心催化劑。
05
本質(zhì)上,羅永浩數(shù)字人的成功,并非“技術(shù)替代人”的勝利,而是“技術(shù)解決痛點(diǎn)”的結(jié)果。
這里面,蘊(yùn)含了百度對于“AI何為”的回答:技術(shù)進(jìn)步的意義,不在于替代,而是通過解決痛點(diǎn)讓商業(yè)回歸“效率與價值”的本質(zhì)。羅永浩數(shù)字人,就是這場變革的直觀注腳。
百度慧播星數(shù)字人提升效率、創(chuàng)造價值的途徑,就是以AI為支點(diǎn),打破直播電商的“不可能三角”——低成本、長時長、高轉(zhuǎn)化。
以前數(shù)字人直播雖然承載了降本增效的期許,但讓市場看到的只是概念、故事和Demo,現(xiàn)在百度真正給出了“可落地、可盈利、可延續(xù)”的系統(tǒng)性解決方案,讓“用數(shù)字人實(shí)現(xiàn)盈利”的冀望不再只是奢望。
隨之而來的,是AI時代被人機(jī)共生新生態(tài)重塑的新直播電商圖景。按劉潤的說法就是,直播電商的“自動駕駛”時代正在到來。
當(dāng)數(shù)字人可以妥善承接標(biāo)準(zhǔn)化、長時間、高體力的直播場景后,得到解放的真人主播也就可以聚焦深耕創(chuàng)意、選品、私域、品牌建設(shè)等高階價值。這樣的人機(jī)協(xié)作“1+1”模型(由凱文·凱利提出),也能更好地助益企業(yè)用直播電商這條路發(fā)掘增量。
當(dāng)無數(shù)企業(yè)降本增效、直播行業(yè)規(guī)則改寫被一根“用更低成本創(chuàng)造更大價值”的繩子串起,那超擬真數(shù)字人的價值釋放必然會被更多人感知。
就此看,羅永浩數(shù)字人這張多米諾骨牌引發(fā)的連鎖反應(yīng),才剛剛開始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.