![]()
初冬的上海,云層低垂。
在黃浦江灣流經(jīng)的拐角處,商湯科技大廈的建筑形態(tài)簡潔到近乎抽象,猶如一艘停泊在工業(yè)文明舊址上的未來方舟,以無畏者的姿態(tài),駛向已知又未知的智能世界。
一家以視覺感知立命的AI公司總部大樓,本身也在挑戰(zhàn)著觀看者的視覺常識。《汽車觀察》記者此行目的,是與商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事,商湯絕影董事長王曉剛,共話汽車AI“溫度”與“鐵壁”。
![]()
位于上海漕河涇的商湯科技總部大樓,猶如一艘航行于數(shù)字文明洪流之上的未來方舟
不止視覺霸主,再拓汽車疆土
連續(xù)九年占據(jù)中國計算機視覺市場榜首,GenAI IaaS領(lǐng)域躋身行業(yè)前三,座艙視覺AI軟件市占率連續(xù)五年位居全球第一,城市NOA市場份額位列行業(yè)前三……作為中國“AI四小龍”(商湯科技、曠視科技、依圖科技、云從科技)之首,商湯科技的市場地位不斷向“生態(tài)話語權(quán)”升級。
然而,這家中國最大的人工智能算法供應(yīng)商的“汽車故事”,并非始于對造車風(fēng)口的追逐,而是源自一次全球頂尖汽車制造商的主動叩門。
追溯其智能汽車業(yè)務(wù)布局,始于2016年。當(dāng)時,排名全球前五的汽車制造商——本田來到中國,尋找智能駕駛領(lǐng)域的合作伙伴,經(jīng)歷多輪篩選后,將目光鎖定在商湯科技上。次年12月,本田技研工業(yè)株式會社與商湯科技簽訂了長期的聯(lián)合研發(fā)協(xié)議,共同研發(fā)適合于乘用車場景的L4級自動駕駛技術(shù)。
這次合作,為商湯科技打開了一扇通往智能汽車的大門,同時也開啟了一段技術(shù)理想與商業(yè)現(xiàn)實的碰撞之旅。2021年7月,商湯科技正式發(fā)布智能汽車解決方案獨立品牌——SenseAuto絕影,標(biāo)志著其汽車業(yè)務(wù)從幕后技術(shù)賦能走向臺前品牌化運作。
![]()
商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事,商湯絕影董事長王曉剛接受《汽車觀察》獨家專訪
“此時,自動駕駛前裝量產(chǎn)技術(shù)快速發(fā)展,國際Tier-1巨頭的技術(shù)優(yōu)勢逐漸被本土科技公司超越,智能座艙也從單點功能升級為整體體驗,大模型時代的到來,更加印證了智能化是汽車的未來。”王曉剛肯定道。
2022年,商湯科技成立“絕影智能汽車事業(yè)群”,使其汽車業(yè)務(wù)從內(nèi)部的創(chuàng)新項目升格為與智慧商業(yè)、智慧城市和智慧生活并列的四大核心業(yè)務(wù)之一。時至今日,商湯絕影已經(jīng)完成了從內(nèi)部事業(yè)群到獨立商業(yè)實體的快速成長。
由此可見,商湯絕影以聚焦投入、快速響應(yīng)、專業(yè)深耕市場需求的戰(zhàn)略選擇應(yīng)對智能汽車賽道,同時也讓商湯絕影在汽車領(lǐng)域的定位更加清晰——不做造車的“軀體”,而是與客戶攜手共建賦予汽車“靈魂”的智能座艙、智能駕駛與提供智能汽車云服務(wù)。
在求穩(wěn)與開拓之間
商湯絕影這段“孵化-成長”的商業(yè)故事,亦是中國AI企業(yè)從技術(shù)研發(fā)走向產(chǎn)業(yè)落地的典型樣本。截至目前,商湯絕影合作車企已超30家,既有一汽、東風(fēng)這樣的央國企,也有吉利、奇瑞、長城這類民企,更有跨國車企本田、新勢力車企蔚來等。
“不同車企給了我們不同的幫助,共同促成了商湯絕影的成長。”王曉剛表示,這些不同屬性、不同特質(zhì)、不同體量規(guī)模的主機廠,對于智能駕駛和智能座艙的理解以及合作訴求有著明顯的不同。
![]()
有的車企是科技屬性和創(chuàng)新第一優(yōu)先,更看重技術(shù)的前沿性、定制化與可迭代性。而且敢于在合作中共同探索,并能基于市場需求提供大量寶貴意見。
有的車企對科技發(fā)展的探索成本較為謹(jǐn)慎,核心訴求是穩(wěn)定可靠、成熟落地,更加關(guān)注技術(shù)的安全性和市場驗證度,穩(wěn)步推進、不做炫技式開發(fā)。
再者就是本田這類跨國車企,其顯著特點是技術(shù)前瞻性強,更偏向于長期技術(shù)布局。早在2017年,本田就已提出無圖純視覺端到端的技術(shù)需求,這在當(dāng)時屬于極具前瞻性的技術(shù)方向,為商湯絕影2022年推出UniAD端到端自動駕駛方案提供了重要的方向性指引。這類車企更注重技術(shù)的底層邏輯和可持續(xù)性,而非短期的落地速度。
“單純向主機廠提供技術(shù)服務(wù),并非我們唯一發(fā)展路徑,這種商業(yè)模式并不具備高利潤屬性,我們更希望與主機廠共同推進項目落地。”王曉剛解釋道,與主機廠的合作依然至關(guān)重要,這涉及大規(guī)模量產(chǎn)落地、技術(shù)迭代優(yōu)化以及行業(yè)影響力的構(gòu)建。
但在秉持開放態(tài)度的同時,也要有著自身底氣與自信。在王曉剛看來,隨著智能化技術(shù)的持續(xù)進步,必然會涌現(xiàn)出新的賽道和新的商業(yè)模式:“商湯絕影作為一家科技公司,目標(biāo)是保持技術(shù)的領(lǐng)先性,同時積極探索新的商業(yè)模式、開拓新的賽道,謀求長遠發(fā)展。”
智駕“奧斯卡”得主密鑰
作為行業(yè)首個量產(chǎn)、可交互的世界模型,“開悟”一經(jīng)問世便屢獲國內(nèi)外大獎。2025年8月,還獲得了由汽車觀察傳媒、中國國際貿(mào)易促進委員會汽車行業(yè)分會和中國汽車芯片產(chǎn)業(yè)創(chuàng)新戰(zhàn)略聯(lián)盟共同主辦的“智輅獎”智駕系統(tǒng)解決方案組大獎。
相比華為、英偉達和谷歌等,“開悟”世界模型有哪些差異化優(yōu)勢?眾所周知,世界模型本質(zhì)上是一種大型仿真器,Alpha Zero的案例已說明這一點。其核心價值在于特定規(guī)則框架下,通過自主交互產(chǎn)生突破人類上限的超級智能,這點對自動駕駛領(lǐng)域同樣關(guān)鍵。
![]()
商湯絕影“開悟”世界模型榮獲2025“智輅獎”
“實現(xiàn)這一目標(biāo)的關(guān)鍵難點,在于仿真需精準(zhǔn)契合物理世界規(guī)律、人機行為邏輯及交通規(guī)則,這也是當(dāng)前行業(yè)很多世界模型的短板——僅能生成視覺效果尚可的視頻,但缺乏對物理規(guī)律、因果關(guān)系的深度還原,且精度不足,難以適配自動駕駛實際需求。”王曉剛對“開悟”世界模型技術(shù)亮點進行了三點概括。
亮點一,多模態(tài)輸入融合。區(qū)別于常見的僅以視頻為輸入的模式,“開悟”為模型提供了多攝像頭畫面、相機姿態(tài)、3D點云和人車物3D軌跡等多維度數(shù)據(jù),通過多重約束讓模型從不同模態(tài)中精準(zhǔn)學(xué)習(xí)物理規(guī)律,實現(xiàn)更全面的世界仿真。
亮點二,高質(zhì)量+高可控性。基于多模態(tài)融合的優(yōu)勢,“開悟”生成的高質(zhì)量視頻占比超50%,遠超行業(yè)平均水平,且能精準(zhǔn)控制天氣、光線和道路結(jié)構(gòu)等元素,高度匹配自動駕駛“舉一反三”的靈活需求,只需針對一個問題場景優(yōu)化,就能覆蓋成百上千個相關(guān)衍生場景。
亮點三,長時復(fù)雜仿真能力。當(dāng)前行業(yè)標(biāo)桿特斯拉可生成6min復(fù)雜交通交互視頻,其他廠商多集中在20-30s,“開悟”則已實現(xiàn)兩分半鐘的長時仿真,未來目標(biāo)是看齊并超越特斯拉,實現(xiàn)更長時長、更復(fù)雜場景的模擬。
量產(chǎn)實力派的野心
目前,“開悟”世界模型已經(jīng)量產(chǎn),并賦能上海自動駕駛實訓(xùn)場。關(guān)于“開悟”世界模型的未來規(guī)劃,王曉剛表示,明年的核心目標(biāo)是推動“開悟”世界模型與強化學(xué)習(xí)的深度融合,逐步擺脫對真人駕駛數(shù)據(jù)的依賴,最終實現(xiàn)自動駕駛水平超越人類。
![]()
談及“開悟”世界模型量產(chǎn)落地的最大難點,王曉剛強調(diào),生成數(shù)據(jù)的質(zhì)量與算力適配兩大方面同等重要。若生成數(shù)據(jù)質(zhì)量不達標(biāo),后續(xù)還需額外投入大量人力篩選校驗,將直接導(dǎo)致整體研發(fā)效率大打折扣。
而在算力與芯片適配上,以前行業(yè)普遍依賴英偉達芯片,其成熟的生態(tài)體系大幅降低了適配難度;但如今面對各類不同規(guī)格的國產(chǎn)芯片,需要投入大量精力去完成適配工作,這一過程雖耗時費力,但也是提升模型運行效率的必要環(huán)節(jié)。
另需關(guān)注的是,商湯絕影推出的生成式智駕R-UniAD,引入了獨特的VLAR架構(gòu),這意味著決策邏輯已從“被動模仿”轉(zhuǎn)向“主動生成與試錯”。然而,這套VLAR架構(gòu)更多是依賴“絕影開悟”世界模型生成的海量合成數(shù)據(jù),還是依然需要結(jié)合一部分真實世界采集的高價值人類駕駛數(shù)據(jù)進行混合訓(xùn)練?
王曉剛分別解釋了這兩種數(shù)據(jù)源在解決自動駕駛長尾問題中的權(quán)重:真實數(shù)據(jù)只是“冷啟動”,為VLAR架構(gòu)提供了初始的訓(xùn)練基礎(chǔ);但啟動之后,整個訓(xùn)練過程將進入持續(xù)循環(huán)的強化學(xué)習(xí)階段,則主要依賴“開悟”世界模型生成的海量合成數(shù)據(jù),來完成模型迭代更新,這也是未來自動駕駛技術(shù)的發(fā)展趨勢。
從底層技術(shù)架構(gòu)破局
汽車智能化比拼越來越卷,很多車企甚至把“堆配置”作為一種營銷手段。對于科技公司而言,追求極致參數(shù)更重要,還是優(yōu)先解決用戶場景痛點更重要?
“必然是以用戶為導(dǎo)向、以場景為導(dǎo)向,而非單純追求極致參數(shù)。但用戶往往難以清晰表述自身核心痛點,在全新技術(shù)落地前,缺乏相應(yīng)的認知與體驗,這就需要我們主動挖掘并解決用戶場景痛點。”王曉剛回答道。
實際上,“堆配置”的深層原因在于傳統(tǒng)AI的技術(shù)范式局限:以往AI功能都需要用戶主動打開APP才能使用,本質(zhì)上是“人找功能”,而非“功能找人”,這與用戶對智能化的真實需求脫節(jié)。
“只有先改變底層技術(shù)架構(gòu),擺脫傳統(tǒng)‘激活式AI’的束縛,后續(xù)開發(fā)的各類應(yīng)用才能真正解決用戶痛點。”王曉剛強調(diào),商湯絕影基于“以人為中心”的環(huán)境計算理念,既跳出了“堆配置”的內(nèi)卷,又能讓技術(shù)真正服務(wù)于用戶。
![]()
2025年王曉剛位列全球頂尖1000名計算機科學(xué)家世界第29、中國第1
在他看來,未來的AI不應(yīng)是被動等待激活的工具和冰冷的功能集合,而應(yīng)是融入周圍環(huán)境、時刻關(guān)注用戶需求與狀態(tài)變化、充分感知及理解用戶習(xí)慣與偏好,在用戶需要時主動提供服務(wù),既做到恰如其分,又不冗余打擾。
今年10月,“絕影千機”與奇瑞的深度合作,讓大家看到了智能座艙發(fā)展的第3個階段——走出APP。從過往2D、3D環(huán)境,到強調(diào)從4D時空理解環(huán)境,商湯絕影是如何實現(xiàn)這一技術(shù)躍遷的?
王曉剛始終認為,智能座艙“走出APP”的核心邏輯是“以人為中心”,實現(xiàn)這一目標(biāo)需要三點技術(shù)支撐:第一,多模態(tài)大模型須持續(xù)運行于車端;第二,系統(tǒng)須具備長程記憶能力;第三,須采用更復(fù)雜的架構(gòu)設(shè)計。
“長鏈條閉環(huán)對技術(shù)提出更高要求,任何一個環(huán)節(jié)出錯都會直接影響用戶體驗。商湯絕影通過架構(gòu)層面的優(yōu)化迭代,保障了AI與人在長鏈條復(fù)雜交互過程中的絲滑性與準(zhǔn)確性,即便技術(shù)迭代難度顯著提升,也能確保虛擬世界中的訓(xùn)練策略在遷移至真實物理世界后,安全可靠落地。”王曉剛補充道。
下半場的攻堅清單
智能化下半場競爭已然進入白熱化階段,科技公司與主機廠一樣,也要面臨著殘酷的淘汰賽。未來,商湯絕影如何持續(xù)不斷地激發(fā)自身研發(fā)活力,站穩(wěn)行業(yè)領(lǐng)先地位?
在王曉剛看來,討論焦點應(yīng)跳出“某一領(lǐng)域僅剩幾家企業(yè)”這樣的存量競爭思維,轉(zhuǎn)而聚焦在新賽道的開辟與新機會的挖掘上,若僅局限于供應(yīng)商這種單一角色,未來發(fā)展難免受限。接下來,商湯絕影將在商業(yè)模式與新業(yè)務(wù)方向上主動尋求突破。
與此同時,王曉剛也敏銳洞察到,智駕技術(shù)的演進正催生著全新機遇。自2025年起,無人物流車市場已邁入快速增長期;未來兩三年內(nèi),Robotaxi技術(shù)也將逐步走向成熟。這些都為商湯絕影開辟了全新的商業(yè)模式——直接面向終端用戶提供出行服務(wù)。
![]()
沙利文發(fā)布《2025年中國世界模型發(fā)展白皮書》報告稱,商湯絕影“開悟”世界模型在技術(shù)產(chǎn)品、應(yīng)用能力及生態(tài)建設(shè)三方面綜合評價位居榜單第一。
過去,科技公司提供的多是單點座艙技術(shù)及相關(guān)解決方案,需經(jīng)主機廠整合后才能觸達用戶,這種模式會導(dǎo)致AI功能的激活率與使用率始終處于低位。如今,以商湯絕影為代表的科技公司正突破座艙邊界,使其技術(shù)不再局限于艙內(nèi),還能在艙外與手機、家庭機器人等設(shè)備跨場景聯(lián)動。
那么,智能化下半場還有哪些前沿技術(shù)更具開發(fā)性和市場潛力,或?qū)⒊蔀橄乱浑A段的主流和攻堅方向?商湯絕影是否進行了相應(yīng)的技術(shù)儲備?
王曉剛認為有三點:第一,世界模型與強化學(xué)習(xí)的融合技術(shù);第二,Human 3.0相關(guān)的環(huán)境計算技術(shù);第三,智艙與智駕的融合技術(shù),在無人場景中的重要性愈發(fā)凸顯。針對這些前沿方向,商湯絕影已經(jīng)進行了相應(yīng)的技術(shù)儲備,以順應(yīng)智能化下半場的發(fā)展趨勢。
“智能化發(fā)展已進入全新階段,技術(shù)形態(tài)、產(chǎn)品載體與商業(yè)模式,都發(fā)生了全方位的變革,科技公司也不再局限于供應(yīng)商的角色,而是從B端向C端拓展。其中,以具身智能機器人為載體的C端應(yīng)用,能夠?qū)⒓夹g(shù)更直接地觸達終端消費者,這為下半場競爭開辟了新的賽道。”王曉剛強調(diào),唯有持續(xù)創(chuàng)新、不斷突破原有邊界,才能牢牢把握住蘊藏的機遇。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.