![]()
加州大學伯克利Dr. Allen Yang
當前,人工智能行業正深陷 “GPU 競賽” 的熱潮,在2026年CES(國際消費電子展)現場隨處可見對云端 AI 應用的熱議,“人均GPU 數量” 成為衡量技術實力的熱門指標,從企業到國家層面都在追逐算力的堆砌。
美西時間1月6日-8日,鈦媒體CES 2026「Talk to the World」系列論壇在拉斯維加斯舉辦。會上,加州大學伯克利分校Vive 增強現實中心創始執行主任Dr. Allen Yang提出了一個清醒而關鍵的觀點:我們應超越云端,將目光投向物理世界,探尋物理 AI 的下一個 “AlphaGo時刻”。
作為伯克利 Vive 增強現實中心創始執行主任,Dr. Allen Yang主導著 AR/VR、元宇宙及賽車自動駕駛三大創新方向。過去四年,他帶領伯克利 AI 賽車隊連續征戰 CES 自動駕駛挑戰賽,并在 2025 年斬獲頭對頭超車項目冠軍。這些扎根物理場景的實踐讓他深刻意識到,物理 AI 與依賴云端數據的大型語言模型有著本質區別,其真正的 “分水嶺時刻” 尚未到來。
他指出,雖然以AlphaGo和大型語言模型為代表的AI已取得里程碑式突破,但物理AI仍亟待屬于自己的“分水嶺時刻”。其挑戰并非源于算力不足,而是根植于物理世界獨特的復雜性。
首先,物理AI極度缺乏覆蓋所有極端場景的訓練數據。不同于語言模型可汲取數十年互聯網的養分,現實世界中的“邊緣案例”——如罕見的天氣、突發障礙物、極端的機械故障——難以被窮盡采集。
其次,毫秒級的實時響應是生命線。在高速行駛或緊急救援中,決策延遲意味著失敗甚至災難。一個開源項目“LLM Colosseum”的實驗生動地證明了這一點:在《街頭霸王》游戲中,雖然小模型單次決策精度較低,但其高頻的決策速度能使其戰勝響應緩慢的大型模型。這印證了那句古老的格言:完美是優秀的敵人。
再次,眾多前沿場景中“云端”是缺席的。無論是月球探索、礦難救援,還是火災現場,穩定、高速的網絡連接都是奢望。在這些領域,部署在設備本地的“邊緣AI”是唯一可行的智能。
為攻克這些挑戰,Dr. Allen Yang的團隊選擇在最具挑戰性的賽道上進行實戰——高速自動駕駛賽車。
在 2025 年 CES 自動駕駛挑戰賽中,賽車實現 140 英里 / 小時的全自主行駛,伯克利車隊更是以 163 英里 / 小時的速度完成超車。當普渡大學賽車嘗試反超時,兩車因彎道漂移打破 2-5 米安全距離,雙雙自動緊急制動,這一場景反映出,在動態、高速的物理交互中,AI系統不僅需進行復雜的實時感知與規劃,更必須在安全規則與競爭目標之間做出平衡。此后,他們又將賽道延伸至中國張家界天門山。這條全長10.77公里、擁有99道彎的山路,為自動駕駛系統提供了包含陡坡、急彎與多變天氣的綜合測試場。清華大學、浙江大學等九所國內高校參與了相關項目。
2026年,Dr. Allen Yang進一步宣布,將在原有賽事基礎上增設天門山人形機器人挑戰賽,邀請研發機構測試機器人在非結構化地形——如攀登999級臺階——中的移動與決策能力。他表示,物理AI的進展不僅依賴于算法與硬件的迭代,也有賴于跨學科協作與在真實場景中持續積累的經驗。在極端環境下的技術實踐與人才培養,或將為行業帶來新的啟發。
以下為Dr. Allen Yang演講全文,經鈦媒體編輯:
大家好,歡迎大家來到CES,我是Dr. Allen Yang。首先感謝鈦媒體的邀請,如今 CES 上到處都在談論基于云的人工智能應用。我也聽說,當人們尋找下一個酷炫的人工智能應用時,每個人都在問的一個問題是關于這個叫做GPP的新東西,我剛剛才知道這是指一家公司里人均擁有多少個 GPU。所以擁有的 GPU 越多,似乎就越強大,甚至有人在問一個國家能有多少個 GPU 來推動應用的發展。但今天我想邀請大家把目光超越云端,探尋物理人工智能領域的下一個“AlphaGo時刻”。
先簡單介紹一下我自己。今年 2026 年對我來說也是個不錯的年份,因為我已在加州大學伯克利分校工作了 20 年。在伯克利,我目前是 Vive 增強現實中心創始執行主任,之前曾是馮氏工程領導力研究院的首席科學家。我很自豪能在三個領域引領創新:第一個是增強現實 / 虛擬現實(AR/VR),第二個是元宇宙(Metaphors),第三個是賽車應用中的自動駕駛技術。
今年回到 CES,對我來說是個五味雜陳的時刻,因為這讓我想起,在過去的四年里,我們一直帶領伯克利人工智能賽車隊連續參加自動駕駛挑戰賽。過去四年的 CES 都有我們的身影。特別是在去年 2025 年 CES 上,伯克利人工智能賽車隊贏得了頭對頭超車項目的冠軍。
今天,我想談談物理人工智能。之所以伯克利以及許多與我們競爭的大學會投身其中,是因為我們想培育下一個 “分水嶺時刻”。
這些分水嶺時刻對培養未來的人工智能用戶至關重要,而且大家都知道,到目前為止,人工智能創新無疑是吸引數百萬用戶速度最快的技術,對吧?這其實要歸功于人工智能過去的分水嶺時刻,比如 IBM 研發的 “深藍”、DeepMind 研發的 “AlphaGo”。
現在,每個人都知道強化學習,在過去三年里,大型語言模型也應運而生。所以,在來 CES 準備PPT之前,我本打算說服大家,物理人工智能仍在等待屬于它的黃金時刻,也就是它自己的分水嶺時刻。
為什么這么說呢?第一個原因是,盡管強化學習造就了世界上最厲害的圍棋選手,能擊敗所有圍棋大師。但現在,如果你和自動駕駛公司交流就會發現,僅靠強化學習,還不足以打造出像人類一樣擅長駕駛的自動駕駛系統。
一個關鍵的例子就是我們慘痛經歷過的 “Beta 三時刻”。在這里,我準備了一段短視頻,向大家展示伯克利人工智能賽車隊過去經歷的一個關鍵失敗時刻。
這段視頻會讓大家看到我們學到的東西,以及我們在伯克利和許多大學里,認真教給最優秀學生的知識。當我們把這些理論應用到高速人工智能賽車的現實世界中時,我們發現,課本上的知識往往無法直接奏效。
(視頻播放)
這是 2024 年在印第安納賽車場,伯克利對陣圣母大學(Uni More,結合語境推測)的一段短視頻。接下來,大家就會明白我在說什么了。
當時發生了什么呢?
在這場比賽之前,印第安納賽車場遭遇了特大暴雨,由于云層厚重,GPS 衛星信號丟失。我們的賽車系統在那一刻決定將定位源信號從一個系統切換到另一個系統。這些混合系統的不一致性,導致我們的控制算法選擇了錯誤的行駛曲率,而不是正確的那條。這恰恰說明,當我們談論物理人工智能時,它實際上是理論與實踐、科學與工程的深度結合。
在來 CES 之前,我還準備了第二個理由,想說服大家物理人工智能的分水嶺時刻尚未到來。
我的第二個論點是,行為智能似乎比語言智能更基礎。
在座有孩子的各位可能都能理解,人類嬰兒在學會用母語描述世界之前,就已經會通過行動去探索未知的世界了。但現在,在CES 上,多虧了黃仁勛的主題演講,我們知道英偉達已經全面進軍物理人工智能的新時代。所以,我覺得他們幫我省去了很多說服大家的功夫。
我想,在 CES 上,大家已經聽說了很多很棒的新工具,它們能幫你獲得更多 GPU、更大內存,還能實現更長的思考過程。或許你還會用到混合專家模型(Mixture of Experts)、思維鏈(Chain of Thoughts),讓你的 GPT 模型思考得更聰明、更深入。不過,拋開這些優秀的工具,我想針對物理人工智能補充幾個觀察結論。
第一,物理人工智能需要更多的極端邊緣案例。
為什么這么說呢?當我們為大型語言模型增加更多 GPU 時,強大的計算平臺本身就能讓 GPT 模型變得更聰明。為什么?因為所有的 GPT 模型都從互聯網獲取知識。
自互聯網泡沫以來的 30 年里,互聯網幾乎已經涵蓋了所有的邊緣案例、世界上所有的語言,你只需編寫一個腳本就能爬取互聯網上的這些數據。事實上,你甚至可以說,互聯網為語言模型準備的內容太多了。有時候,我們的人工智能模型會從這些數據中學習到不良內容。這就像我們必須向孩子屏蔽那些不好的語言,避免他們學到一樣。
但如果切換到物理人工智能領域,很容易就能明白,如今沒有任何一家物理人工智能公司能聲稱,他們已經積累了足夠多的物理人工智能數據,涵蓋了所有的極端邊緣案例。
我想分享的第二個觀察結論是,除了需要覆蓋所有邊緣案例,物理人工智能還要求極高的毫秒級低延遲性能。
對于 GPT 模型來說,增加更多 GPU 會消耗更多能源、更多時間,這也會導致訂閱費用更高,對吧?所以,你要為你的算力、云服務、使用時長支付更多費用。但在物理人工智能領域,情況并非如此 —— 為更大的模型支付更多費用,并不一定能帶來成功的解決方案。
我給大家舉個例子。
有一個名為 “LLM Colosseum” 的開源項目,在這個項目中,作者們對接了不同類型的語言模型,讓它們操控游戲角色玩《街頭霸王 3》。比如,在這段視頻中,你可以讓 ChatGPT 操控紅色的角色。你也可以讓另一個可能更小的模型,比如 Mistral,操控綠色的角色。
然而,實驗結果出來后,相當令人驚訝 —— 或者說,取決于你的視角,也可能并不驚訝。“LLM Colosseum” 的實驗發現,雖然小型模型的單次推理精度較低,但它們每秒、每分鐘能進行更快的推理,做出的決策數量也比大型語言模型多得多。
換句話說,英語中有句老話 “完美是優秀的敵人”,在物理人工智能領域,你寧愿每秒獲得 50 次、100 次(或赫茲級)的不完美決策,也不愿用一個龐大的大型模型,每秒只能進行 1 到 2 次完美決策。在這種情況下,小型模型實際上會比大型模型表現更好。
我想分享的第三個觀察結論是,在更多前沿應用場景中,月球上可沒有云端,所以你根本沒有機會為你的云端和互聯網搭建現代化的基礎設施。這些前沿應用包括火災救援。當發生火災、你的房子被燒毀、整個社區都被燒毀時,你怎么可能還能用上互聯網呢?這還包括油氣勘探、采礦作業。
當然,當我們考慮幫助美國國家航空航天局(NASA)將宇航員送往月球和火星時,我們如何打造出能容納整個機構所有知識的智能宇航服?但與此同時,我們不可能先在月球或火星上搭建云端。月球上沒有云端。
總而言之,我今天想和大家分享的觀點是,除了尋找能提供更多 GPU、更大內存、更長思考過程(比如下一個思維鏈技術)的優秀新工具,我們還必須把目光超越云端,將物理人工智能視為下一個前沿領域。
為什么?有三個原因。
第一,邊緣案例與安全對人類用戶至關重要。
因此,當我們部署物理人工智能機器人或汽車,讓它們與我們共享同一個環境時,這些系統必須在邊緣端實現毫秒級延遲的決策。無論你的云端技術多么復雜,至少你必須有一個本地解決方案作為安全備份。
第二,對于許多前沿應用來說,邊緣人工智能就是你唯一能依賴的人工智能 —— 你沒有能力為你的應用、宇航員或作業人員搭建云端。
以上就是我想分享的主要觀點和理由,我試圖說服大家,對于物理人工智能應用,我們必須把目光超越云端。
接下來,我想和大家分享一些我們為探尋物理人工智能下一個分水嶺時刻所做的創新嘗試。
第一個是回顧 2025 年 CES 印第安納自動駕駛挑戰賽,在這場比賽的決賽中,伯克利人工智能賽車隊對陣普渡大學人工智能賽車隊的頭對頭超車項目。五年后,參與自動駕駛挑戰賽的十支隊伍已經實現了 140 英里 / 小時(約 225 公里 / 小時)的全自主行駛基準速度。
140 英里 / 小時,這個基準速度是加州或內華達州高速公路限速的兩倍,在那些地方,超過這個速度就會被開罰單。
除此之外,比賽規則要求進行頭對頭競爭,進攻方需要制定正確的行為和運動規劃,才能超越防守方。作為進攻方,你必須在超過 140 英里 / 小時的速度下,成功選擇一條清晰的路線,超越你的 “對手舞伴”(指防守方賽車)。
大家可以看到,藍色的是伯克利的賽車,金色的是普渡大學的賽車,這是去年在拉斯維加斯賽車場舉辦的 CES 比賽中的場景。伯克利的賽車以 163 英里 / 小時(約 262 公里 / 小時)的最高速度超越了普渡大學的賽車。這比 140 英里 / 小時的基準速度還要快 20 英里。
接下來,很快大家就會看到,按照比賽規則,普渡大學的賽車要嘗試反超伯克利的賽車,但這時發生了一些事情。
普渡大學的賽車還沒準備好,現在他們得加把勁了。所以,決定是跟在后面還是超車,完全是自主進行的。場邊的學生和教職員工什么也做不了。他們唯一能按的按鈕就是放棄,也就是切斷電源。除了切斷電源,他們只能站在一旁,等著看電腦如何運作。兩個系統之間沒有任何通信。
除了要負責自己的駕駛決策,你還必須感知對手的動向,猜測對手要做什么。
普渡大學的賽車來了。
速度飆升到 158 英里 / 小時,他們還沒完成超越,沒完成超越。沒有發生碰撞。所以,如果你想看碰撞的畫面,可能會有點失望。
但當時的情況是,根據比賽規則,兩輛車之間必須保持 2 到 5 米的安全距離。
如果任何一輛車或兩輛車都檢測到安全距離被侵犯,根據規則,車輛應該立即剎車。不幸的是,普渡大學的賽車嘗試超越伯克利賽車的那一刻,正好是在彎道處。如果你在彎道處高速行駛,賽車會向外側漂移。正是因為這種漂移,安全距離被打破了。所以兩輛車實際上同時啟動了緊急剎車。
但因為這是一場比賽,進攻方(普渡大學賽車)剎車就意味著放棄比賽,就在那一刻,兩輛車都做出了正確且智能的決策,保護了安全距離,退出了高速行駛。
也正是在那一刻,去年在 CES 上,伯克利的賽車以 163 英里 / 小時的最高速度,贏得了頭對頭超車項目的冠軍。
我想,作為擁有這輛價值 100 萬美元賽車的教職員工之一,同時也是監督研究生參與這項全年無休的高速方程式風格比賽的導師,對我來說,最寶貴的時刻。
其實并不是我們的賽車超越了其他賽車。而是在那一刻,學生們臉上露出的笑容和滿足感 —— 他們真正學到了如何突破物理人工智能極限的關鍵知識,我認為這就是教育的價值。
而且我認為,對于所有想打造下一個產品的企業家和初創公司來說,這才是最寶貴的資產,這些學生正是你們應該溝通合作的對象。
我很期待能和大家交流,如果你想參與進來,共同創造下一個分水嶺時刻,接下來,我想給大家展示另一個領域的案例。
把賽車推向高速只是邊緣案例中的一種,事實上,這是一種你本不應該遇到的邊緣案例,也就是人類駕駛員非法將自動駕駛汽車開到法定限速以上的情況。
但對于來自中國的觀眾來說,2025 年中國有一個名為 “懂車帝” 的社交媒體平臺,他們創建了六大類邊緣案例,對 20 多款自動駕駛系統的性能進行了測試。
當然,這不是你想和家人一起遇到的邊緣案例,而這實際上是最新的測試結果,無疑是亞洲范圍內最全面的自動駕駛測試,涵蓋了六大類邊緣案例。
這六大類邊緣案例充分表明,至少在自動駕駛領域,物理人工智能的分水嶺時刻尚未到來。
為了解決這個問題,我和我的團隊實際上打造了下一個人工智能賽車核心挑戰賽。
所以,在這個案例中,我們的目標是見證下一個 “AlphaGo時刻”
我們并不是要在一級方程式賽道上追求最高速度,所以我們邀請了九所大學,帶來了最先進的電動汽車平臺,其中一款最頂尖的電動汽車平臺,來到了中國張家界的天門山。
這條賽道是一條山路,全長 10.77 公里,海拔落差超過 1000 米,有 99 個急彎。幾乎都是 180 度的彎道,我們還涵蓋了復雜的雨天和霧天山地氣候。
對于那些還不了解天門山和張家界的人來說,這里是電影《阿凡達》中潘多拉星球取景地的原型。所以在 2025 賽季,我們成功與中國九所頂尖大學合作,共同探尋人工智能的下一個分水嶺時刻。
這些大學包括清華大學、浙江大學、上海交通大學、西安交通大學、湖南大學、武漢理工大學、吉林大學和海南大學。
接下來,我想給大家看一段有趣的視頻。
(天門山比賽視頻)
視頻就到這里。所以,自動駕駛的分水嶺時刻已經到來了嗎?還沒有。
因為對于那些積極參與人工智能賽車的人來說,我們知道,目前最好的人工智能解決方案,首先,據我所知,還沒有端到端的解決方案。沒有任何大學或公司能承受用強化學習去 “懲罰” 一輛價值 100 萬美元的方程式賽車,這永遠行不通。
其次,我們知道,下一個前沿領域可能是將 “從 A 點到 B 點的自動駕駛” 與下一個應用場景相結合,這將引領我們發現那個分水嶺時刻,也就是 “AlphaGo時刻”。
對于 2025 年的物理人工智能來說,我們非常自豪地看到,我們的比賽已經引發了大量關于 “人類與物理人工智能” 的討論,在不久的將來,它可能會成為全球關注的焦點。僅 2025 年的比賽,就吸引了超過 50 萬人在為期 6 周的時間里親臨現場觀看。在線上,比賽的觀看量超過了 10 億次,當然,每所大學都有自己的粉絲。此外,相關的社交媒體討論也超過了 800 萬條,所以這是一個在一年內迅速走紅的頂級賽事之一。
那么,我們接下來要走向何方?
明年,也就是 2026 年 CES,今天我很高興能和大家分享一個消息:在 2026 年的人工智能賽車比賽之外,我們將與天門山國家公園密切合作,邀請所有有能力的人形機器人公司,來嘗試創造他們的分水嶺時刻 —— 也就是他們的 “AlphaGo時刻”,讓機器人從天門山山腳攀登 999 級臺階,抵達山頂的天門。
最后,感謝大家的聆聽。
(文|引擎視角,作者|韓敬嫻,編輯|李玉鵬)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.