![]()
今天,我們發(fā)布了Gemini 3 Deep Think的重大升級版本,這是我們專門的推理模式,旨在推進智能前沿并解決科學、研究和工程領域的現(xiàn)代挑戰(zhàn)。
我們與科學家和研究人員密切合作,更新了Gemini 3 Deep Think以應對艱難的研究挑戰(zhàn)——這些問題往往缺乏明確的界限或單一正確解決方案,數(shù)據(jù)通常混亂或不完整。通過將深厚的科學知識與日常工程實用性相結合,Deep Think超越了抽象理論,推動實際應用。
新的Deep Think現(xiàn)已在Gemini應用中向Google AI Ultra訂閱用戶開放,這是我們首次通過Gemini API向特定研究人員、工程師和企業(yè)提供Deep Think。可在此處申請早期訪問權限。
以下是早期測試者使用最新Deep Think的情況:
羅格斯大學數(shù)學家Lisa Carbone專注于高能物理學界所需的數(shù)學結構研究,致力于彌合愛因斯坦引力理論與量子力學之間的鴻溝。在這個訓練數(shù)據(jù)極其稀少的領域,她使用Deep Think審查一篇高度技術性的數(shù)學論文。Deep Think成功識別出一個微妙的邏輯缺陷,這個缺陷此前在人工同行評議中未被發(fā)現(xiàn)。
在杜克大學,Wang實驗室利用Deep Think優(yōu)化復雜晶體生長的制造方法,用于潛在的半導體材料發(fā)現(xiàn)。Deep Think成功設計了生長大于100微米薄膜的配方,達到了以往方法難以實現(xiàn)的精確目標。
Google平臺與設備部門研發(fā)負責人、前Liftware首席執(zhí)行官Anupam Pathak測試了新的Deep Think來加速物理組件設計。
通過數(shù)學和算法嚴密性提升推理能力
去年,我們展示了專門版本的Deep Think能夠成功應對一些最嚴峻的推理挑戰(zhàn),在數(shù)學和編程世界錦標賽上達到金牌標準。最近,Deep Think使專門的智能體能夠進行研究級數(shù)學探索。
更新的Deep Think模式繼續(xù)推進智能前沿,在最嚴格的學術基準測試中達到新高度,包括:
在"人類最后考試"基準測試中創(chuàng)造新標準(無工具輔助下48.4%),該基準測試旨在測試現(xiàn)代前沿模型的極限
在ARC-AGI-2上取得前所未有的84.6%成績,經(jīng)ARC Prize基金會驗證
在Codeforces上獲得驚人的3455 Elo評分,這是一個包含競賽編程挑戰(zhàn)的基準測試
在2025年國際數(shù)學奧林匹克競賽中達到金牌級表現(xiàn)
駕馭復雜科學領域
除了數(shù)學和競賽編程,Gemini 3 Deep Think現(xiàn)在在化學和物理等廣泛科學領域也表現(xiàn)卓越。我們更新的Deep Think模式在2025年國際物理奧林匹克競賽和化學奧林匹克競賽的筆試部分展現(xiàn)出金牌級結果。它還在高級理論物理方面表現(xiàn)出熟練程度,在CMT基準測試中獲得50.5%的分數(shù)。
加速現(xiàn)實世界工程應用
除了最先進的性能表現(xiàn),Deep Think還致力于推動實際應用,使研究人員能夠解釋復雜數(shù)據(jù),工程師能夠通過代碼建模物理系統(tǒng)。最重要的是,我們正在努力將Deep Think帶到研究人員和從業(yè)者最需要的地方——首先從Gemini API等平臺開始。
通過更新的Deep Think,你可以將草圖轉化為可3D打印的現(xiàn)實。Deep Think分析繪圖,建模復雜形狀并生成文件,通過3D打印創(chuàng)造物理對象。
向Google AI Ultra訂閱用戶和Gemini API早期訪問計劃開放
Google AI Ultra訂閱用戶今天開始可以在Gemini應用中訪問更新的Deep Think模式。科學家、工程師和企業(yè)現(xiàn)在也可以申請我們的早期訪問計劃,通過Gemini API測試Deep Think。
我們迫不及待地想看到您的發(fā)現(xiàn)。
Q&A
Q1:Gemini 3 Deep Think是什么?有什么特別功能?
A:Gemini 3 Deep Think是Google推出的專門推理模式,專為解決科學、研究和工程領域的復雜挑戰(zhàn)而設計。它能夠處理缺乏明確答案和混亂數(shù)據(jù)的研究問題,將深厚科學知識與工程實用性結合,甚至能識別人工同行評議未發(fā)現(xiàn)的邏輯缺陷,還可以將草圖轉化為3D打印文件。
Q2:Deep Think在學術測試中表現(xiàn)如何?
A:Deep Think在各項嚴格學術基準測試中表現(xiàn)卓越:在"人類最后考試"中達到48.4%,在ARC-AGI-2上獲得84.6%,Codeforces評分達到3455 Elo,2025年國際數(shù)學奧林匹克達到金牌級表現(xiàn),在國際物理和化學奧林匹克筆試中也展現(xiàn)金牌級結果。
Q3:如何獲得Deep Think的使用權限?
A:Google AI Ultra訂閱用戶可以直接在Gemini應用中使用更新的Deep Think模式。科學家、工程師和企業(yè)用戶可以申請早期訪問計劃,通過Gemini API體驗Deep Think功能。這是首次通過API向研究人員和企業(yè)開放這項技術。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.