![]()
出品|虎嗅科技組
作者|苗正卿
題圖|視覺中國
數字人正在被百度內部視為帶來增長的“關鍵武器”。
虎嗅獨家獲悉,百度內部預計將在2025年下半年加大對數字人項目的投入。內部針對數字人的評估與考核維度,主要以客戶量(使用數字人產品的B端用戶),用戶量(觀看百度數字人相關直播、短視頻等內容的C端用戶),以及由數字人帶來的廣告營銷收入三個方面為主。
目前,百度的數字人項目隸屬于百度電商業務(百度優選),由百度副總裁、百度電商總經理平曉黎為一號位。
另據虎嗅獨家掌握的信息,百度電商在2023年成為一級事業部后,目前保持了持續盈利,而數字人是其最重要的收入和利潤增長引擎之一,貢獻了收入增長的大頭。
![]()
百度副總裁、百度電商總經理平曉黎
今年618期間,百度電商推出了羅永浩“數字人”,被內部視為2025年的關鍵動作。而此前,百度創始人李彥宏也曾親自體驗過百度數字人相關技術,并對業務線表達了信心,他在今年4月百度Create大會上表示:“2025年最令人激動的突破性應用之一,就是AI數字人”。
在今年WAIC上,百度正式發布了新一代數字人技術Nova,讓數字人進化成為一個多模協同且具備思考決策能力的AI應用。
近期,虎嗅就百度數字人業務發展的脈絡、內部對于數字人趨勢的判斷、與其他大廠的區別等問題,和平曉黎進行了深入溝通,下附溝通實錄(經刪減編輯):
虎嗅:百度整個數字人業務,是什么時候決定開始做的?你們內部怎么看待這幾年數字人的發展脈絡?
平曉黎:最早是2022年底,當時大模型還沒有出來。當時集團成立了電商事業部,讓我來負責。我此前負責百度APP,主要負責信息流產品,當時還管百家號、管新聞類內容生態創作。做這些內容向的業務時,我接觸了很多創作者,當時我就想,有沒有什么AI技術可以幫這些創作者做更好的內容。數字人技術,其實是這個時候關注到的。我當時看短視頻里面一些醫生、律師的節目,就在想用數字人替代這些真人可能是一種很不錯的方式。因為他們平時太忙了,不一定有足夠多時間來做視頻和直播。
2022年底,公司成立了電商事業部,讓我來負責。當時電商行業里,直播電商已經非常火爆了。我當時就思考,數字人技術能不能來幫助直播。于是我讓團隊做了幾個試水。但礙于當時做出來的“數字人”更像是僵硬的紙片人,效果確實不太行,它只是具備了一個初級的人形樣子和TTS能力。
第一個轉機是2023年初,ChatGPT發布了,很快百度自己的文心大模型也發布了。我很快找到我們的模型團隊,請他們協助一起做數字人,希望大模型團隊幫我們解決三個主要的問題:第一是之前數字人都是人工寫腳本,現在希望靠大模型去生成腳本;第二是希望實現實時互動,數字人能和用戶去真實的互動;第三是升級數字人的視覺和語音表現力。
我把2023年起基于大模型完成關鍵進化的數字人歸類為2.0階段,我們叫超擬真數字人。當然它是一個持續進化過程,2023年到2024年,我們都在不斷完善:除了語言能力、互動能力、擬真聲音這些技術要素,也包括了成本的控制與降低。2024年,我們基于超擬真數字人發布了一鍵克隆的功能,通過一個5~10分鐘的視頻片段,就能生成一個超擬真數字人直播間。
從2024年下半年到今年,我們在進入一個新的階段,Robin定義其為“高說服力數字人”,這是數字人的3.0階段。這個版本的關鍵點在于數字人的智能化能力,它已經是一個具備思考決策能力的超級智能體了。它的聲音、動作、形象、語言可以實現如真人的協同一致性,目前市面上絕大部分的數字人,都沒有完美做到,神形音容的匹配我們認為也是第三個階段的另外的核心特征之一,它已經非常像真人了。
你看到的我們618羅永浩數字人,其實就屬于“高說服力數字人”范疇。它本身有帶貨能力、有自己的決策和思考鏈,而且從效果上,它的單場帶貨水平并不低于真人。
這里面關鍵的地方,就是感知決策,數字人可以通過感知到屏幕前用戶的反饋、信息,去實時決策、實時互動。我們這個羅永浩數字人推出后,很多人都覺得驚訝,覺得太逼真了。
但我覺得,這還不是技術和產品的終點。我們內部認為,數字人的技術能力還會進一步抬升,尤其是多模態大模型技術的發展,會繼續推動數字人進化。下一代,可能是超越真人的數字人。
虎嗅:我還是想再追問一個回溯問題,你接手百度電商后,當時為什么會把數字人當做一個關鍵方向?
平曉黎:第一個因素是2022年底,百度決定建立電商BU時,公司是思考過自己到底有什么差異化優勢,尤其是百度面臨一個現狀“沒有特別多的直播生態”的前提下,我們的優勢到底在哪?我們思考后認為,技術肯定是一個壁壘,因此當時就有一個明確的站位,要做“智能電商”。
這里有兩個切入角度,其一是希望通過AI幫助用戶更好的獲得購物體驗;其二是希望通過AI幫助商家降本增效,吸引商家用更低成本做更大量直播,從而豐富我們生態的供給。我們想做自己的電商閉環,讓更多商家包括大量的中小商家,進入我們的生態。
第二個因素是,2023年年初,我在好幾個產業帶去拜訪商家,我去看他們的直播間發現,這些商家的直播成本非常高,相比于傳統貨架電商,這些商家的運營成本增加了很多。這些交流和探訪,讓我很確信,用AI技術做低成本批量化是可以滿足市場剛需的。
虎嗅:你剛才提及2023年初大模型給你的數字人產品帶來了質變,當時你是怎么說服集團投入這些技術資源給你的?
平曉黎:我覺得這是百度一個特點,百度在做產品的時候是業務驅動。我們團隊當時先拿出來整個思路,包括產品、運營、客戶等等細節都想處理了,然后我去和集團匯報了想法,希望可以通過大模型技術推動數字人進化,從而帶動電商直播業務。在討論清楚市場需求和業務戰略后,集團同意了,而且以“高優”模式支持了數字人項目。然后我們就跟集團的大模型技術團隊形成了一個協同模式。
虎嗅:其實有一些大廠在做數字人類產品時,是技術團隊牽頭業務協同,你們好像是反過來的?
平曉黎:我覺得業務牽引非常重要,產品終究是服務于市場、服務于用戶的,一定要從市場需求出發、從用戶痛點出發。純粹技術去牽引,他們可能會追求高精尖的技術,但高精尖的技術有時候不一定能解決真實業務場景的問題。
我團隊內,業務運營、產品經理會成為整個數字人產品技術發展的牽引力,當然我會要求他們去知道技術的能力和邊界在哪。業務和產品經理最大的價值是對于需求場景有深刻的理解,并基于這些理解去給出優化方向。
舉個例子。之前我們和技術溝通,技術給出的技術方案是,要讓商家到“綠幕”里錄制,然后基于這個錄制樣片,去生成新的克隆體。技術覺得,這樣錄出來的底板最好用。但這顯然不是真實的業務場景。哪個商家會去給你找個綠幕錄制呢?這個門檻高到沒有人會用。于是我們的PM明確告訴技術,就是希望通過已經播出過的直播畫面或者已有的畫面去生成。可以輸入一段5~10分鐘的“底板視頻”(直播回放),剩下的需要技術去搞定。
再比如,當時有技術反映說,這些底板視頻中,不能出現手遮擋嘴的畫面。這顯然也不現實,不能說手遮擋了一點嘴,你就生成不出視頻了。為什么我們堅持PM主導,就是為了站在商家和用戶視角去引導技術解決問題。
虎嗅:你們內部,業務說服技術是一件很輕松的事情?
平曉黎:倒也不是那么容易,但整體氛圍是好的。CEO希望大家開放共創,從我們實操角度,我覺得“講道理”是非常重要的,拿真實用戶場景事實或數據來說話,然后充分討論、達成共識。
比如這次羅永浩數字人直播的技術。這是我們3.0階段的技術,在研發這代數字人技術時,PM會先給出頂層設計框架,比如希望數字人語音和動作匹配、有AI大腦可以根據直播間實時信號決策、可以調度多智能體協同執行任務等等。
比如我們希望這代數字人可以實現“神形音容一致”。技術看到我們這個框架后,最初說需要主播錄制一個時長1小時、涵蓋各種動作表情的視頻,作為輸入然后再根據新的劇本要求去生成。我們就告訴技術,這在實操上是不現實的,必須拋棄“傳統綠幕錄制”的思路。
我們講了一個很簡單的道理。綠幕錄制出的底板視頻,和真實的直播回放,其實是很不一樣的。真實直播,主播充滿激情、狀態特別好。在綠幕里錄制出來的,主播是完全沒有這樣的精氣神的。作為底板輸入,對主播的表現力也是有要求的,而只有真實環境下主播的表現力最好,作為下一步生成的輸入效果會更好,我們也據此做了AB數據驗證,證明了這個判斷。
當然,我覺得這里面還有一個關鍵點,就是業務不能拍腦袋提要求,你必須要理解技術的能力和邊界。但這可能需要一些小技巧,比如業務有時候要“逼”一下技術,才能真正了解到當下技術的邊界在哪。以及有的地方,并非靠技術而是要靠業務本身的運營能力和交付能力去彌補提高的。
虎嗅:能感覺出來,PM其實是你團隊里很重要的一撥人,你大概有多少PM參與到數字人里?
平曉黎:大約幾十個。這里面有一些核心是從2023年一路參與數字人項目成長起來的。
虎嗅:你們是怎么設定自己的目標的?百度內部是如何去評估數字人這個項目,它的評估維度是什么?
平曉黎:首先肯定是用戶量維度的,我們現在也不僅僅把數字人用到電商業務里,包括一些數字分身業務,數字人也在做。公司對數字人的期望,也是希望它能成為一個非常有影響力的AI應用,去服務全行業。
另外一個是收入相關的。數字人非常有力地推動了在線營銷廣告收入的增長。它現在起到的作用很明顯,公司對它的預期還是挺高的。
虎嗅:數字人這個項目的成本,是你團隊自己承擔還是?
平曉黎:對,它納入到電商業務事業部里面,電商業務事業部的收入、利潤都有明確的要求。我們數字人做訓練的卡、成本都是我們自己承擔的。我作為這個BU負責人,也會去跟公司財務對每個季度、年度的目標。BU是一直持續盈利的,可以覆蓋數字人的基本成本。
2024年Q3開始,數字人的收入增長就非常快了,當時我們發布低成本克隆這個功能,它的規模就起來了。這里面教育類、大健康類、水果生鮮類客戶都明顯增多。今年我們拓展到了汽車、醫生、律師這些場景。
虎嗅:那下半年,你們關于數字人會有什么新的目標或者考核維度嗎?
平曉黎:主要還是用戶量,這里面還有開播量,就是數字人商家的開播量;以及收入。我們還會增加一些用戶指標,比如說看播量等。
市場熱度起來后,我們今年重點肯定是要把新一代數字人技術Nova平臺化,并開放給全行業。其實今年年初,CEO對數字人的發展就提出了新的要求,我們希望讓盡可能多的人用我們數字人的技術、產品。我們整體上的判斷是,在一些場景和賽道上,數字人是可能超越真人的。我們今年其實整體的方向都是基于這個年初的判斷和規劃。
如對本稿件有異議或投訴,請聯系tougao@huxiu.com
End
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.