網易首頁 > 網易號 > 正文申請入駐

谷歌AlphaGo贏了圍棋，卻在游戲店栽了：人類3小時通關

2026-04-07 18:46:45　來源: 灰度測試中

北京舉報

分享至

1997年，IBM的深藍擊敗國際象棋大師卡斯帕羅夫。2016年，AlphaGo戰勝李世石。2025年，你走進一家游戲店，隨手拿起一款沒玩過的獨立游戲——這時候，人類依然能碾壓最頂尖的AI。

紐約大學計算機科學教授Julian Togelius團隊的最新研究給出了一個反直覺的結論：在"零樣本游戲學習"這個賽道上，人類玩家平均只需要3到10分鐘理解核心機制，而當前最先進的AI模型面對完全陌生的游戲，結果幾乎是確定的失敗。

這不是懷舊情結。研究團隊測試了多款大語言模型（LLM，即支撐ChatGPT等產品的底層技術）在全新游戲環境中的表現。當游戲規則需要實時探索、物理直覺和常識推理時，AI的表現堪稱災難。

AI的"肌肉記憶"陷阱

問題的根源在于訓練方法的差異。強化學習（reinforcement learning）讓AI通過數百萬次試錯迭代，在封閉環境中打磨出超人類表現。DeepMind 2015年征服Atari游戲庫，OpenAI Five在Dota 2中擊敗職業選手，都是這一路徑的勝利。

但Togelius指出，這種"暴力美學"有個致命盲區：AI學到的不是"理解游戲"，而是"記住這個特定游戲的獎勵函數"。換個角度說，AlphaGo能下贏圍棋，是因為它把圍棋的19×19棋盤當成了宇宙的全部真理。你讓它改玩五子棋，它不會覺得"規則類似但更簡單"，而是直接歸零重啟。

人類玩家則完全不同。我們走進游戲店，看到平臺跳躍類游戲，會本能地聯想到重力、慣性、碰撞體積——這些來自現實世界的"遷移知識"。研究團隊觀察到，面對一款從未見過的2D解謎游戲，人類能在幾分鐘內建立假設、驗證機制、調整策略，而AI往往卡在"這個按鈕按下去會發生什么"的基礎探索階段。

「如果你把一個大語言模型扔進它沒見過的游戲，結果幾乎是確定的失敗。」Togelius在論文中寫道。

開放世界 vs. 封閉沙盒

游戲類型決定了AI的狼狽程度。在規則明確、目標單一的競技游戲中（星際爭霸2、Dota 2），AI可以靠算力堆出天花板級的微操。但一旦進入"開放目標"或"物理沙盒"類游戲——比如需要理解"這個箱子可以墊腳""那個杠桿能開門"的場景——AI的認知框架就會暴露短板。

研究團隊設計了一組對比實驗：同一款平臺跳躍游戲，人類玩家平均死亡12次后找到通關路徑；GPT-4級別的模型在相同時間限制內，有73%的概率完全無法觸發關鍵機制，陷入隨機按鍵的循環。

更諷刺的是，當AI被賦予"用自然語言描述當前狀態"的能力時，表現反而下降。模型會生成冗長的場景分析（"我看到一個紅色方塊在藍色平臺上方"），卻延遲了實際操作——這種"想太多"的特質在實時游戲中是致命的。

人類玩家的優勢不是反應速度，而是"常識壓縮"的能力。我們知道火焰危險、重力向下、門通常需要鑰匙或開關——這些來自現實世界的先驗知識，讓游戲學習變成了"模式匹配"而非"從零推導"。

通用智能的試金石

Togelius團隊的研究動機遠不止游戲本身。游戲被AI領域長期視為"通用智能的簡化實驗室"，正是因為它們有清晰的目標、可量化的表現、可重復的環境。如果連這個簡化版都搞不定，AGI（通用人工智能）的路線圖就需要重新校準。

當前大模型的訓練數據包含了海量游戲攻略、直播視頻和論壇討論，但這恰恰制造了"數據污染"的陷阱。當AI在《塞爾達傳說》中表現優異時，很難判斷它是"真正理解了物理謎題"，還是"在訓練集中見過類似布局"。

研究團隊提出的解決方案指向"具身認知"（embodied cognition）——讓AI像人類一樣，通過物理交互積累世界模型，而非僅靠文本和像素預測。這解釋了為什么機器人領域的進展（波士頓動力的Atlas、Figure AI的人形機）與游戲AI形成了有趣的對照：前者笨拙但適應性強，后者華麗卻脆弱。

「游戲測試揭示了一個被忽視的維度：智能不僅是解決問題，更是快速定義問題。」論文合著者、MIT博士后研究員Anurag Banerjee補充道。

玩家的隱藏價值

這項研究對游戲行業有直接的商業含義。 procedurally generated games（程序化生成游戲，如《我的世界》《無人深空》）依賴算法創造無限內容，但測試這些內容的可玩性至今仍需要大量人類QA。如果AI無法像人類一樣"盲玩"新游戲，自動化測試的愿景就存在根本性的天花板。

更深層的問題關乎AI產品的設計哲學。ChatGPT和Claude等工具被包裝為"通用助手"，但游戲測試表明，它們的"通用性"是有邊界的——高度依賴訓練數據的分布，對分布外的任務缺乏人類式的彈性。

Togelius在訪談中打了個比方：「現在的AI像是那種考試前把整本教科書背下來的學生，題目稍微變個花樣就懵。人類玩家則是真正理解了概念，所以能應付沒見過的題型。」

這個類比或許不夠嚴謹，但指向了一個緊迫的研發方向。2024年以來，多家AI實驗室將"智能體"（agent）能力作為優先目標，試圖讓模型不僅能對話，還能在數字環境中自主行動。游戲，作為最豐富、最安全、最便宜的數字環境，正在成為這場競賽的主戰場。

谷歌DeepMind的SIMA項目、OpenAI的"Operator"、Anthropic的"Computer Use"功能，都在嘗試突破"零樣本游戲學習"的瓶頸。但Togelius的論文提供了一個冷靜的基準線：在通用游戲智能這個指標上，人類依然領先至少一個數量級。

下一次當你因為手殘被游戲Boss虐到摔手柄時，可以換個角度安慰自己：你面對陌生機制時的適應速度，仍然是價值數十億美元的AI產業尚未攻克的堡壘。問題是，這個領先優勢，我們還能保持多久？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

免費無限用！谷歌上線了一款AI語音轉寫神器

智東西 2026-04-07 19:09:17
1 跟貼 1
微商入局AI圈：靠賣課、傳銷、空氣幣瘋狂斂財，收割手段全揭秘

雷科技 2026-04-07 21:48:25
0 跟貼 0

內容投毒，工作埋坑，打工人開始用「魔法」對抗Skill煉化？

雷科技 2026-04-07 21:42:51
0 跟貼 0

千人擠爆舊金山！OpenClaw首聚現場，AI龍蝦開始接管現實世界

新智元 2026-02-06 21:39:14
0 跟貼 0
科技巨頭集體押注自研芯，AI芯片戰場正加速向推理端遷移

華爾街見聞官方 2026-04-07 21:48:40
0 跟貼 0

圍棋生死一線：白先逆襲，手筋妙手扭轉乾坤

望眼欲穿x 2026-04-07 08:42:17
0 跟貼 0

李世石談Faker與AI之戰：電競與圍棋不同，他有勝算，我是真贏不了

懂球帝 2026-04-07 22:00:23
0 跟貼 0
圍棋攻防秘籍：弱點即破綻，無堅不摧的戰術解析

日月潭小青 2026-04-05 07:47:21
0 跟貼 0

完球了，GPT-4o之母宣布離職OpenAI

量子位 2026-04-07 17:19:50
5 跟貼 5
圍棋速成秘籍：送吃撞氣殺棋，黑先布局提升棋力技巧

不似經年g 2026-04-05 08:35:41
0 跟貼 0
圍棋定式抉擇：小目大跳守角，三三定式謹慎用

如花似夢m 2026-04-04 08:29:51
0 跟貼 0
這機器人也太過分了吧，居然還上床睡覺，請把她的眼鏡安上！

古德拜街拍 2026-04-04 16:53:33
0 跟貼 0
圍棋黑先絕技：狹地求生，巧破黑白局

彼岸雨露j 2026-04-04 07:56:24
0 跟貼 0
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2008 跟貼 2008
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2612 跟貼 2612
丁浩“溫吞棋”是AI時代最鋒利刀！他的無趣，正是圍棋最殘酷進化

王老師聊圍棋 2026-04-03 16:33:40
3 跟貼 3
馬斯克要用AI挑戰英雄聯盟最強戰隊 Faker回應：我們已經準備好了

快科技 2026-04-07 19:09:04
1 跟貼 1
中國玩家給制作組提建議，怎么歐美玩家先急哭了

游戲動力ATK 2026-04-04 22:35:50
9 跟貼 9
驚險時刻！玩家爆出絕殺牌局！必須學習

歡歡斗地主 2026-04-03 08:54:24
0 跟貼 0
為什么現在夸游戲，要罵它是個垃圾？

3DM游戲 2026-04-07 09:31:26
0 跟貼 0
國產恐怖游戲神作將登Switch！民俗靈異氛圍拉滿

游民星空 2026-04-06 21:29:17
2 跟貼 2
歷史上的宇宙流，從匈奴到蒙古，一經爆發，便是席卷八荒

月滿大江流 2026-04-03 10:47:23
5 跟貼 5
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
901 跟貼 901
索尼4月會免陣容：3款游戲讓Reddit用戶集體破防

閃存獵手 2026-04-07 20:47:33
0 跟貼 0
今日游戲 - 2026-04-07

教你畫像素畫 2026-04-07 13:24:24
0 跟貼 0
《傳說》系列30周年“重磅”公布惹眾怒！被萬代耍了

3DM游戲 2026-04-07 09:42:39
2 跟貼 2
肖恩·默里再發神秘符號《無人深空》或將迎來競技場更新

3DM游戲 2026-04-07 09:31:04
0 跟貼 0
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
4 跟貼 4
【美股盤前】布油突破110美元/桶；Anthropic與谷歌和博通達成千億美元芯片交易；SpaceX計劃6月初進行IPO路演；折疊屏iPhone遭遇工程

每日經濟新聞 2026-04-07 17:38:09
0 跟貼 0
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
他們全員6點下班，卻讓硅谷脊背發涼

獸樓處 2026-04-06 17:12:07
0 跟貼 0
人形機器人穿白紗裙跳芭蕾一整個樂隊現場給其伴奏

薪點看看 2026-04-05 20:19:08
189 跟貼 189
機器人撒謊、發瘋、創造宗教，70年前的科幻小說，竟然預言全中！

九江老渭 2026-04-07 18:00:00
0 跟貼 0
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
182 跟貼 182
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
弈客圍棋，棋風系統上線！

弈客圍棋 2026-04-07 16:31:45
0 跟貼 0
主人和小貓玩游戲，看貓咪的眼神，就知道它動腦子了！

日常逗趣集 2026-04-07 10:47:53
1 跟貼 1
上海一公園內，游客爬上櫻花樹拍照，結果整棵樹倒下！網友：不堪重婦！

上觀新聞 2026-04-07 16:33:38
35 跟貼 35
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
11 跟貼 11
夏航季東航將采用國產大飛機C919執飛上海航線

黑龍江新聞網 2026-04-06 22:32:19
794 跟貼 794

灰度測試中

生活正在重構，目前還在灰度測試階段，暫不全量發布。

889文章數 12關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

數碼

房產

游戲

手機

手機 / 數碼

房產 / 家居

谷歌AlphaGo贏了圍棋，卻在游戲店栽了：人類3小時通關

AI的"肌肉記憶"陷阱

開放世界 vs. 封閉沙盒

通用智能的試金石

玩家的隱藏價值

滿嘴謊言！OpenAI奧特曼黑料大起底

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世 被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

地理教材上五種交通運輸方式的比較是不是過時了？

1999元就能買Mini LED電視 海信Vidda小鋼炮S Mini開售

重磅！三亞擬出安居房新政！

模組救場還是官方重做?GTA4重制版引發玩家激烈爭論

4月21日的手機圈，不敢想象會有多刺激

女首富陳麗華離世被曝生前已分好遺產

不止是大極狐首款MPV問道V9靜態體驗

1999元就能買Mini LED電視海信Vidda小鋼炮S Mini開售