<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<p id="jpp3l"><li id="jpp3l"><pre id="jpp3l"></pre></li></p>

<sub id="jpp3l"><i id="jpp3l"></i></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

谷歌Deep Think八語奧賽屠榜！自主攻克4大未解難題，科研壁壘崩塌

2026-04-08 12:05:15　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】谷歌Deep Think橫掃亞歐多語種競賽，AI科研工具的語言壁壘正在被拆掉，數學與科學發現進入AI驅動新時代。

「Deep Think」在所有競賽中都擊敗/媲美競爭對手」！

剛剛，Google DeepMind高級研究員Conglong Li在X平臺連發12條帖子，甩出了一張前所未見的成績單。

一個AI，同一個大腦，八張不同語言的試卷，全部高分交卷。

在任何一個模型身上，這樣的成績實屬罕見。

從IMO金牌到區域賽全覆蓋

這次Deep Think拿下多個榜單高分，并非突然的單點爆發，而是一條已經持續了近一年的能力演進曲線。

首先登頂最硬核的推理賽場。

2025年7月，Gemini Deep Think首次在國際數學奧林匹克（IMO）達到金牌標準，42分拿下35分。同期在ICPC世界決賽也取得類似高水平表現。

這兩個成績，DeepMind官方博客已經正式公布。

Google DeepMind隨后把這兩項成績都寫進了官方博客，作為Deep Think邁過數學與編程「世界級競賽門檻」的標志。

接著，Deep Think開始從「世界冠軍級單項突破」，走向「跨語言、跨學科、跨場景的系統驗證」。

2026年2月，Google連發三篇博客。

一篇介紹Gemini 3.1 Pro模型本體，一篇介紹Deep Think專用推理模式的重大升級，一篇來自DeepMind科學發現團隊，直接把Deep Think定位成「人類智力倍增器」。

升級后的Deep Think交出了一串硬指標：

Humanity's Last Exam拿下48.4%（無工具輔助），ARC-AGI-2達到84.6%（ARC Prize基金會官方驗證），Codeforces競賽編程Elo評分3455，2025國際物理奧賽和化學奧賽筆試部分達到金牌水平。

這條路線非常清楚：先用IMO、ICPC這樣的世界級競賽，證明它的強大推理能力，然后再用多語種、區域賽和跨學科奧賽成績，證明它的跨語言、跨領域穩定遷移的通用深度推理能力。

Gemini Deep Think從IMO金牌到PhD級科研加速的能力演進

8語言成績單逐項細看

現在，把這張成績單真正攤開來看。

日語最亮眼。

2025年第35回日本數學奧賽本選（JMO Finals），滿分。

ICPC亞洲日本初賽，滿分。

其中，JMO本選這項成績甚至超過了當屆最高得分對應的80%水平，達到官方所說的「金獎相當」標準。

法語同樣滿分，100%。

中文就有意思了。

第41屆中國數學奧林匹克（CMO），Deep Think拿到86.3%，相當出色。但中國信息學奧賽（NOI）只有63.3%。

86.3%和63.3%之間的落差，畫出了AI推理能力的真實邊界。

在數學競賽里，模型面對的是抽象推導、證明構造和多步演繹，這恰好是Deep Think最擅長的能力帶。

但到了信息學競賽，問題就不只是「想明白」，還包括把邏輯翻譯成可執行代碼、控制邊界條件、兼顧復雜度約束，并且在實現層面避免失誤。

前者更接近純推理，后者則要求「推理+算法設計+工程化實現」同時過關。

其它語種，韓語、印地語、越南語、俄語、葡萄牙語對應的競賽結果里，Deep Think 也都實現了擊敗對手或至少持平。

如果把日語、法語、中文再合起來看，這次最不尋常的一點其實不是某一門單科刷到滿分，而是同一個模型、同一種Deep Think推理系統，在多種語言的競賽試卷上，都交出了第一梯隊的成績。

這份成績單可靠嗎？

但這里有一個關鍵的缺失：

Conglong Li并沒有列出競品的具體對比數據：所有成績，全部來自Google內部評測。沒有第三方獨立復現，沒有競賽官方認證，評測方法完全沒有公開。

每道題是做一次還是做很多次取最優？推理時用了多少算力？有沒有人工提示工程介入？

這些直接影響成績含金量的細節，也都沒提。

還有一點容易被忽略：這些考試全部是各國區域選拔賽，不是國際決賽。

區域賽的題目難度和國際決賽之間，隔著一個量級。

研究員明確說了，這些成績「將被納入模型卡」，截至發稿，模型卡尚未正式更新。

所以，目前這仍然好像是一張由考生自己打分、自己公布、尚未交給教務處蓋章的成績單。

多語言科研公平性

被忽視的真正戰場

為什么Google要專門花精力做8種語言的區域賽評測？

當前AI推理能力的評測，幾乎全部基于英語。

MATH、GSM8K、HumanEval、ARC-AGI……這些都是英語。

全世界的數學家、物理學家、工程師，只要母語不是英語，在使用AI科研工具時都要先過一道語言關。

Google選的這8種語言不是隨機的。

日語、韓語、中文覆蓋東亞科研重鎮，印地語、越南語覆蓋新興市場，法語、俄語、葡萄牙語覆蓋歐洲和南美。

加在一起，這是全球科研產出的大半壁江山。

DeepMind在官方博客里把Deep Think定位為「人類智力倍增器」，說它能「處理知識檢索和嚴格驗證，讓科學家專注于概念深度和創造性方向」。

結合這次的多語言成績，這句話的潛臺詞不難理解：這個倍增器，不僅限英語的科學家用。

更值得注意的是Deep Think在科研落地上已經走了多遠。

DeepMind公布了一個叫Aletheia的數學研究智能體，基于Deep Think驅動，能自主生成、驗證、修訂研究級數學問題的解法。

Aletheia由Deep Think驅動，能夠對研究級數學問題進行迭代式生成、驗證與修正

Aletheia已經參與產出了多篇研究論文，其中一篇完全由AI自主完成，計算了算術幾何中的特定結構常數。

另外，在700個開放數學問題的半自主評估中，它還獨立解決了4個此前未解的問題。

Gemini Deep Think模式在計算機科學、物理學、經濟學等領域也展現出巨大潛力。

在計算機科學領域，Deep Think幫助推翻了一個懸而未決十年的猜想，在物理學領域找到了宇宙弦引力輻射的新型解析解，在經濟學領域擴展了一個拍賣理論定理。

AI推理流程的示意圖，展示了在網絡層進行的大規模解空間探索如何被匯聚為結構化推理，并通過自動化與人工驗證加以確認。

通過與專家合作解決18個研究難題，Gemini Deep Think的高級版本幫助突破了算法、機器學習與組合優化、信息論以及經濟學領域長期存在的瓶頸。

這已經遠遠超出了「做競賽題」的范疇。

當競品還在卷英文benchmark排行榜的時候，Google已經在「AI科研加速器」領域找到了新戰場。

這件事請最重要的東西其實不是分數，它背后真正的信號是：AI科研工具的語言壁壘正在被當作一個工程問題來解決。

如果這條路走通了，全世界用日語、韓語、中文、印地語做研究的科學家，將第一次和英語母語者站在同一條起跑線上。

這一次，Google已經把牌攤在了桌上。

至于競爭對手誰會跟牌，相信我們很快也將看到。

參考資料：

https://blog.google/intl/ja-jp/company-news/technology/gemini-31-pro-gemini-31-pro-deep-think/%20

https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/%20

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/%20

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌云年度大會召開在即！錨定企業級AI落地 TPU架構革新成看點

財聯社 2026-04-10 11:02:05
0 跟貼 0
Meta首個“超級智能”模型亮相閉源路線大轉彎

財聯社 2026-04-09 03:43:09
0 跟貼 0

阿里千億 AI 目標：算得過來嗎？芯片、政企、Token 三重卡位決定成敗

鈦媒體APP 2026-04-10 11:58:19
0 跟貼 0

中國AI人才全面趕超：黃仁勛的擔憂正在成為現實

鈦媒體APP 2026-04-10 11:58:07
0 跟貼 0
“SBTI”爆火，所有AI增長都應該回到朋友圈

鈦媒體APP 2026-04-10 11:58:37
0 跟貼 0

手慢無！深圳小學生零基礎選拔活動報名開始

深圳生活圈 2026-04-09 14:11:50
0 跟貼 0

馬上預約｜專家來訪：抓住啟蒙黃金期，激活孩子的數學腦

湛廬閱讀 2026-04-09 22:25:59
0 跟貼 0
數學和英語好的人，成績一定是拔尖的，怎么自學數學和英語？

阿蘭回聲 2026-04-07 00:35:54
1 跟貼 1

072中考數學題，綜合了根式，倒數，相反數的知識

我服子佩 2026-04-07 13:26:06
1 跟貼 1
066當年高考真題，并非出錯題了，根號下互為相反數如何處理

我服子佩 2026-04-07 13:24:43
1 跟貼 1
088小學數學經典題目，小數與分數的轉化

我服子佩 2026-04-09 13:43:13
1 跟貼 1
五年級數學，難倒全班同學

郎老師趣味數學課堂 2026-04-07 09:47:42
0 跟貼 0
比我數學老師教的還明白

生活易易樂 2026-04-09 09:54:05
1 跟貼 1
學生詢問數學專業以后好的就業方向，張雪峰的回答角度耳目一新啊

硬核老高 2026-04-09 02:35:19
4 跟貼 4
小學數學利用中點模型求面積

天天數理學習分享 2026-04-09 09:50:29
1 跟貼 1
小學數學裂項法求分數和

天天數理學習分享 2026-04-06 13:38:45
3 跟貼 3
062小學數學一道很普通的找規律填數字問題

我服子佩 2026-04-07 13:23:49
1 跟貼 1
記住兩個順口溜，數學猛漲30分。聽聽老師怎么說的

告白手工 2026-04-07 04:35:02
0 跟貼 0
099初中數學討論求解一個特殊的指數方程

我服子佩 2026-04-09 13:45:47
1 跟貼 1
星巴克中國“易主”，“新東家”亮相：將開更多新店！星巴克全球CFO：中國將繼續是我們全球業務中非常重要的一部分

每日經濟新聞 2026-04-09 14:19:51
9514 跟貼 9514
080小學數學問題，拆分一個分數成為兩個倒數之差

我服子佩 2026-04-08 17:30:06
1 跟貼 1
裸分進清華和保送進清華，哪個更牛逼？聽老師一語道破真相

萌寵教主 2026-04-08 02:25:00
0 跟貼 0
094趣味數學面試題，用四個0表達24，你能做出來嗎

我服子佩 2026-04-09 13:44:40
2 跟貼 2
050中考數學真題，給定變量之和，求一個高次冪表達式的值

我服子佩 2026-04-06 14:15:17
2 跟貼 2
所謂祝你幸福，翻譯過來就是老死不相往來

兔八哥影視 2026-04-09 10:09:10
1 跟貼 1
詞匯量10分聽力0分，誤會滿分，外國人說英語也有口音

皮皮笑家 2026-04-08 14:32:06
1 跟貼 1
小學奧數培優專題等差數列的應用，注意對于基本性質的了解要透徹

唐老師小課堂 2026-04-08 13:23:16
4 跟貼 4
1103衛臨一句玉福晉新喪解了甄嬛困境，葉瀾依用安小鳥的科研遺產

幻舞電影 2026-04-06 20:01:18
1 跟貼 1
男孩不學英語，反駁媽媽說一頓大道理，媽媽竟一時無話可說！

帕克愛搞笑 2026-04-09 13:53:43
1 跟貼 1
不生病得十條鐵律，簡單到難以置信，看完立馬漲知識了！

奧茲的生活 2026-04-09 10:05:48
0 跟貼 0
2026年“強基計劃”優點、報名方式、39所高校及專業范圍，看這里

軒萱聊教育 2026-04-09 10:42:09
0 跟貼 0
涉霍爾木茲海峽馬來西亞和新加坡吵了起來

澎湃新聞 2026-04-10 08:05:06
7706 跟貼 7706
翻譯界隱藏高手現身，出神入化的翻譯技巧，堪稱翻譯的最高境界

涼爽追劇 2026-04-08 14:18:47
1 跟貼 1
一個數除200余5，除300余1除400余10，這個數是多少

郎老師趣味數學課堂 2026-04-08 10:33:46
0 跟貼 0
“初”字為什么藏著一把刀

Wihatow 2026-04-09 09:25:14
0 跟貼 0
全球AI軍備競賽：7成模型困在英語里，非英語市場正在掀桌

閃存獵手 2026-04-10 09:29:35
0 跟貼 0
小升初奧數培優專題等差數列的應用，直接法或公式法都可以求首項

唐老師小課堂 2026-04-08 13:33:58
1 跟貼 1
《大數讀法大揭秘！趣味數學小學必知，別讀錯啦！讀數》

答嘉瑞 2026-04-10 07:55:42
1 跟貼 1
華東理工大學這間算法實驗室10名學生來自不同專業，同時升學就業大豐收

文匯報 2026-04-10 10:33:22
0 跟貼 0
探索無限：2的根號迭代之旅

文明不過星感冒v 2026-04-08 10:40:09
0 跟貼 0

違規使用劣質螺栓！致13死3失聯！川青鐵路在建大橋重大垮塌事故原因公布

違規使用劣質螺栓！致13死3失聯！川青鐵路在建大橋重大垮塌事故原因公布

閃電新聞

2026-04-09 14:10:58

華為Mate 80 Pro Max 風馳版硬核挑戰：手機風扇從夯到拉誰更強？

華為Mate 80 Pro Max 風馳版硬核挑戰：手機風扇從夯到拉誰更強？

極果酷玩

2026-04-02 18:51:42

難以置信啊！一餐吃掉562339.80元，上海一張消費清單刷爆網絡

難以置信啊！一餐吃掉562339.80元，上海一張消費清單刷爆網絡

火山詩話

2026-04-10 06:49:46

湖人完勝勇士，重回西部第四！詹姆斯父子合砍36分，創NBA歷史

湖人完勝勇士，重回西部第四！詹姆斯父子合砍36分，創NBA歷史

老梁體育漫談

2026-04-10 12:23:27

蓄電池生產企業要求員工體檢前吃排鉛藥“不吃藥不讓上班” 官方確認情況屬實

蓄電池生產企業要求員工體檢前吃排鉛藥“不吃藥不讓上班” 官方確認情況屬實

閃電新聞

2026-04-10 10:21:21

俄烏雙方進行新一輪陣亡軍人遺體交換，俄方向烏方移交了1000具遺體，烏方向俄方移交了41具遺體

俄烏雙方進行新一輪陣亡軍人遺體交換，俄方向烏方移交了1000具遺體，烏方向俄方移交了41具遺體

瀟湘晨報

2026-04-09 19:50:06

不要再向以色列提供一架戰斗機！

不要再向以色列提供一架戰斗機！

武器縱論

2026-04-09 22:35:26

震驚！網傳282群群主是上海經管學校2009屆，網友：必須繩之以法

震驚！網傳282群群主是上海經管學校2009屆，網友：必須繩之以法

火山詩話

2026-04-10 06:20:37

別查了，受不了！巴拿馬外長終于急了：請中國尊重我！

別查了，受不了！巴拿馬外長終于急了：請中國尊重我！

青青子衿

2026-04-10 01:19:51

美軍上校說了大實話！派B2深入中國核心區，就像派出老頭樂

美軍上校說了大實話！派B2深入中國核心區，就像派出老頭樂

風雨與陽光

2026-04-09 18:32:59

湖北一男子涉嫌殺害4歲女兒后報溺水假警被刑拘，細節曝光：案發前5個月曾給女兒投保意外險，事發當天將女兒拋入江中，假意對遺體實施急救

湖北一男子涉嫌殺害4歲女兒后報溺水假警被刑拘，細節曝光：案發前5個月曾給女兒投保意外險，事發當天將女兒拋入江中，假意對遺體實施急救

揚子晚報

2026-04-10 11:22:32

奉陪到底，中方專機抵朝前，朝鮮亮出集束彈頭，日韓防長緊急通話

奉陪到底，中方專機抵朝前，朝鮮亮出集束彈頭，日韓防長緊急通話

共工之錨

2026-04-10 01:25:50

80后，正在成為全社會最隱形的高危人群

80后，正在成為全社會最隱形的高危人群

經濟學教授V

2026-04-09 18:19:13

伊朗媒體：哈拉齊傷重不治

中國基金報

2026-04-10 06:44:44

陳麗華追悼會這天，江湖地位、人情冷暖，在她身上展現的淋漓盡致

陳麗華追悼會這天，江湖地位、人情冷暖，在她身上展現的淋漓盡致

阿纂看事

2026-04-09 17:06:27

庫里缺席今日湖勇大戰，本賽季常規賽詹庫四次交手機會均錯過

庫里缺席今日湖勇大戰，本賽季常規賽詹庫四次交手機會均錯過

懂球帝

2026-04-10 09:20:13

為什么現在的美女都長一個樣？因為她們整容用的都是同一套醫美模版

為什么現在的美女都長一個樣？因為她們整容用的都是同一套醫美模版

三言四拍

2026-04-10 08:36:03

“張雪是初中生，我是清華博士”：我們相互成就，學歷代表不了啥

“張雪是初中生，我是清華博士”：我們相互成就，學歷代表不了啥

江山揮筆

2026-04-10 09:35:30

“留學回來，15次相親失敗”，杭州女孩被拆穿：連繁殖能力都沒有

“留學回來，15次相親失敗”，杭州女孩被拆穿：連繁殖能力都沒有

千言娛樂記

2026-04-09 09:17:50

領袖之路背后的朝鮮權力暗戰

貓智深

2026-04-09 19:43:30

AI產業主平臺領航智能+時代

14939文章數 66763關注度

往期回顧全部

科技要聞

程序員驚喜，每月100美元！OpenAI推新套餐

頭條要聞

牛彈琴：巴基斯坦被以色列激怒了這是一個不祥的信號

頭條要聞

牛彈琴：巴基斯坦被以色列激怒了這是一個不祥的信號

體育要聞

17歲賺了一百萬美元，25歲被CBA裁員

娛樂要聞

夏克立婚內出軌曾參加《爸爸去哪兒》

財經要聞

愛爾眼科一院長被指猥褻總部：已被停職

汽車要聞

全新一代理想 L8 五座旗艦+5C增程系統三季度交付

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

親子

本地

游戲

公開課

數碼要聞

REDMI Book Pro 2026官宣本月發布：酷睿Ultra X7 358H+99Wh巨無霸電池

親子要聞

科普｜孩子反復鼻癢、咳嗽？您需要了解“鼻炎-哮喘綜合征”

本地新聞

12噸巧克力有難，全網化身超級偵探添亂

一邊抗癌一邊玩游戲！患癌玩家收到PSV后找回笑容

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<style id="vfef5"></style>