羅永浩數(shù)字人再次出圈,這次,“他”竟然拿下世界互聯(lián)網(wǎng)科技領先大獎。
這款由百度突破的擬真度、交互流暢度技術上也首次亮相,榮獲該領域的頂尖科技獎項,也是百度連續(xù)第三年斬獲該獎項。
![]()
那么問題來了,這項技術到底牛在哪里?又取得了什么樣的成就呢?百度是如何做到的?它又會對普通人有什么影響呢?
![]()
2025年618大促期間,百度優(yōu)選和聯(lián)手直播,羅永浩與朱蕭木的數(shù)字人驚艷亮相。
![]()
這場直播之火爆,連羅永浩自己都說“打不過”。
和以往機械式的數(shù)字人直播不同,這兩位數(shù)字人不僅能介紹產(chǎn)品,還能實時與網(wǎng)友互動。
他們配合默契,不會抬杠,也不存在搶話,時不時聊聊段子、爆爆梗,更絕的是,在互動中盡顯自己的人性化。
比如有網(wǎng)友問:“我怎么分辨茅臺真假?”
“他們”回復:“小酌一口,心疼是真,肝疼是假。”
還有網(wǎng)友問:“方便面好不好吃?”
“他們”回復:“好不好吃,要買回去嘗嘗,好吃,就給朋友分一點,不好吃,就全分給朋友。”
![]()
回復中有樂趣,不僅如此,“他們”說話的動作神態(tài),語言組織,語氣轉化,與真人毫無二致。
羅永浩本人也曾發(fā)文坦言,數(shù)字人讓他著實嚇了一跳。
那些眉來眼去的互動神態(tài),還有講段子的風格動作,簡直和自己如出一轍,自己看得都恍惚。
![]()
數(shù)字人的表現(xiàn)堪稱驚艷,不僅吸引超1300萬人次觀看,更創(chuàng)下亮眼戰(zhàn)績,該場次商品交易額直接突破5500萬。
不僅核心品類銷售量可觀,在觀看時長等關鍵數(shù)據(jù)上,更實現(xiàn)了對羅永浩本人的反超。
百度這場高擬真數(shù)字人的直播,讓大眾對數(shù)字人的認知再次刷新,它不再是“形似”,而是真的能達到“神形兼?zhèn)洹薄?/p>
![]()
![]()
人工智能,是如今社會繞不開的話題,而數(shù)字人產(chǎn)生,更是讓討論度一再升高。
畢竟,一開始研究的數(shù)字人,只是看像不像,沒想到,短短時間里,它已經(jīng)能達到“神似”,真的很神奇。
“高擬真”,就是數(shù)字人“神似”的核心技術,支撐它的就是“劇本驅動多模協(xié)同”。
簡單理解,就是讓數(shù)字人具備自主理解、轉化劇本并完成對應表演的能力。
![]()
除此之外,要想數(shù)字人有思想,還需要給它注入“靈魂”。
“劇本”輸入進去之后,還要研究它要“怎么說”、“如何說”以及“需要什么樣的表情和 肢體動作”等等。
比如說到福利相贈,它就要表現(xiàn)出興奮;
比如被夸獎了,它就要表現(xiàn)出謙虛;
再就是兩人互動時,數(shù)字人需精準把握接話時機,既不搶話又能實現(xiàn)無縫銜接。
這正是百度“劇本驅動多模協(xié)同”技術的目標——賦予數(shù)字人協(xié)調多模型、實現(xiàn)自然順暢表達的能力。
![]()
讓數(shù)字人不僅只是按照劇本走,而是能夠根據(jù)直播中的具體場景具體分析。
能夠隨時調整狀態(tài),包括爆梗、互動等多場景的交互。
數(shù)字人擁有了這份如真人的現(xiàn)場判斷力,就能夠快速感知直播間的氛圍,以及理解和處理彈幕評論。
工具人實錘的同時,還能快速回復的各種評論,提升了用戶的參與度,轉化率就能大大提高。
有靈魂、有內容、情緒穩(wěn)定,還不亂鬧脾氣,難怪連羅永浩都甘拜下風。
再看看百度是如何讓數(shù)字人擺脫“機械化”的,它通過大模型“文本自控”機制的設置,實現(xiàn)表達與語言、感情高度合一。
![]()
不僅如此,它還會結合真人的獨特特征,將文本信息處理成不亞于真人的自然流暢,以及所賦予的情感。
數(shù)字人技術核心需攻克超長時間連貫難題,確保表情、動作、聲音等呈現(xiàn)自然無違和效果。
百度又通過融合多模態(tài)視頻理解、跨境態(tài)信號生成等關鍵技術,精準突破這一技術瓶頸,大幅提升數(shù)字人長時間表現(xiàn)穩(wěn)定性。
甚至將AI視頻的應用邊界從“秒級”大幅拓展至“小時級”,滿足超長時間使用需求。
這也就是數(shù)字人羅永浩和朱蕭木直播6個小時,全程動作自然流暢、情感飽滿又精力充沛的成果所在。
![]()
音容相貌,神形具備,一個兼具情感力和表達力的數(shù)字人系統(tǒng)就生成了。
然而,初期的數(shù)字人都對普通人有了影響,升級版的高擬真數(shù)字人,又會帶來怎樣的改變?普通人又該何去何從呢?
![]()
無疑,高擬真數(shù)字人的成功,能夠有效降低企業(yè)直播板塊的成本。
甚至因為它的不知疲倦,還能獲得很高的轉化率。
在山東德州夏津縣,三位平均年齡達65歲的老支書。
他們借助百度“慧播星”數(shù)字人技術打破時間限制,實現(xiàn)了24小時不間斷直播,為鄉(xiāng)村特色傳播賦能。
不僅如此,數(shù)字人在直播間里精準講解產(chǎn)品亮點、及時回復觀眾問題并積極參與互動。
![]()
憑借這份高效的執(zhí)行力,夏津縣的地瓜訂單量大幅增長,總銷售額成功突破15萬,累計售出地瓜3.3萬斤。
百度電商順勢抓住數(shù)字人技術機遇,發(fā)起“一村一品”助農(nóng)項目。
深度賦能鄉(xiāng)村產(chǎn)業(yè),累計帶動全國1000多戶農(nóng)民增收,相關商品交易總額已突破2500萬元。
數(shù)字人的成績喜人,但同樣存在隱憂。
第一個沖擊的就是就業(yè),如口播類自媒體、普通客服等替代性強的崗位,幾乎均會被取代,擠壓普通人的就業(yè)空間
二是存在隱私的侵權風險,據(jù)悉,構建數(shù)字人需采集人臉、聲紋等敏感數(shù)據(jù)。
這些敏感數(shù)據(jù)一旦泄露,危害將極大,且未經(jīng)授權的數(shù)字人復刻,或許還會侵犯他人肖像權、聲音權。
就像最近溫崢嶸上多家平臺直播一樣,經(jīng)溫崢嶸證實,該直播帶貨均是數(shù)字人,壓根就不是本人,想想都可怕。
![]()
三是對情感與認知的影響,部分人會對數(shù)字人產(chǎn)生情感依賴,弱化真實社交能力,時日一長,人們的認知有扭曲風險。
四是維權難度增加,若數(shù)字人直播時夸大產(chǎn)品功效誤導消費,其責任歸屬將難界定,會讓普通人維權陷入困境。
當然,有隱憂,也自然有其積極的一面。
比如在生活上,它能提供更加個性化服務,如教育領域的虛擬教師可定制學習方案,它能迅速整理全國學習方案,選出最適用于自己的,
再比如醫(yī)療領域,虛擬陪護雖然雞肋,但不可否認它能安撫患者情緒,不僅如此,尤其是“AI復活親人”上面,大大地為生者提供了情感慰藉。
而工作上,普通人能用它降低創(chuàng)業(yè)和工作成本,不僅是24小時電商直播,還能讓數(shù)字人處理客服重復咨詢,從而提升效率、拓展收入渠道。
![]()
此外,它還能替代人完成高危場景任務,減少普通人從事高危工作的風險。
AI時代已經(jīng)來臨,數(shù)字人也會普遍存在。
但如何在其中抓住機遇,又如何讓它更好的服務于人?如何破除它的隱憂,加大它的優(yōu)勢?
在不斷突破技術瓶頸之時,也應該把利弊都考慮進去,才能讓人的生存空間不會被一壓再壓!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.