Gemini 3 Deep Think推出重大升級：推動科學研究與工程發(fā)展

2026-02-14 20:58:04　來源: 至頂頭條

北京舉報

分享至

今天，我們發(fā)布了Gemini 3 Deep Think的重大升級版本，這是我們專門的推理模式，旨在推進智能前沿并解決科學、研究和工程領域的現(xiàn)代挑戰(zhàn)。

我們與科學家和研究人員密切合作，更新了Gemini 3 Deep Think以應對艱難的研究挑戰(zhàn)——這些問題往往缺乏明確的界限或單一正確解決方案，數(shù)據(jù)通常混亂或不完整。通過將深厚的科學知識與日常工程實用性相結合，Deep Think超越了抽象理論，推動實際應用。

新的Deep Think現(xiàn)已在Gemini應用中向Google AI Ultra訂閱用戶開放，這是我們首次通過Gemini API向特定研究人員、工程師和企業(yè)提供Deep Think。可在此處申請早期訪問權限。

以下是早期測試者使用最新Deep Think的情況：

羅格斯大學數(shù)學家Lisa Carbone專注于高能物理學界所需的數(shù)學結構研究，致力于彌合愛因斯坦引力理論與量子力學之間的鴻溝。在這個訓練數(shù)據(jù)極其稀少的領域，她使用Deep Think審查一篇高度技術性的數(shù)學論文。Deep Think成功識別出一個微妙的邏輯缺陷，這個缺陷此前在人工同行評議中未被發(fā)現(xiàn)。

在杜克大學，Wang實驗室利用Deep Think優(yōu)化復雜晶體生長的制造方法，用于潛在的半導體材料發(fā)現(xiàn)。Deep Think成功設計了生長大于100微米薄膜的配方，達到了以往方法難以實現(xiàn)的精確目標。

Google平臺與設備部門研發(fā)負責人、前Liftware首席執(zhí)行官Anupam Pathak測試了新的Deep Think來加速物理組件設計。

通過數(shù)學和算法嚴密性提升推理能力

去年，我們展示了專門版本的Deep Think能夠成功應對一些最嚴峻的推理挑戰(zhàn)，在數(shù)學和編程世界錦標賽上達到金牌標準。最近，Deep Think使專門的智能體能夠進行研究級數(shù)學探索。

更新的Deep Think模式繼續(xù)推進智能前沿，在最嚴格的學術基準測試中達到新高度，包括：

在"人類最后考試"基準測試中創(chuàng)造新標準（無工具輔助下48.4%），該基準測試旨在測試現(xiàn)代前沿模型的極限

在ARC-AGI-2上取得前所未有的84.6%成績，經(jīng)ARC Prize基金會驗證

在Codeforces上獲得驚人的3455 Elo評分，這是一個包含競賽編程挑戰(zhàn)的基準測試

在2025年國際數(shù)學奧林匹克競賽中達到金牌級表現(xiàn)

駕馭復雜科學領域

除了數(shù)學和競賽編程，Gemini 3 Deep Think現(xiàn)在在化學和物理等廣泛科學領域也表現(xiàn)卓越。我們更新的Deep Think模式在2025年國際物理奧林匹克競賽和化學奧林匹克競賽的筆試部分展現(xiàn)出金牌級結果。它還在高級理論物理方面表現(xiàn)出熟練程度，在CMT基準測試中獲得50.5%的分數(shù)。

加速現(xiàn)實世界工程應用

除了最先進的性能表現(xiàn)，Deep Think還致力于推動實際應用，使研究人員能夠解釋復雜數(shù)據(jù)，工程師能夠通過代碼建模物理系統(tǒng)。最重要的是，我們正在努力將Deep Think帶到研究人員和從業(yè)者最需要的地方——首先從Gemini API等平臺開始。

通過更新的Deep Think，你可以將草圖轉化為可3D打印的現(xiàn)實。Deep Think分析繪圖，建模復雜形狀并生成文件，通過3D打印創(chuàng)造物理對象。

向Google AI Ultra訂閱用戶和Gemini API早期訪問計劃開放

Google AI Ultra訂閱用戶今天開始可以在Gemini應用中訪問更新的Deep Think模式。科學家、工程師和企業(yè)現(xiàn)在也可以申請我們的早期訪問計劃，通過Gemini API測試Deep Think。

我們迫不及待地想看到您的發(fā)現(xiàn)。

Q&A

Q1：Gemini 3 Deep Think是什么？有什么特別功能？

A：Gemini 3 Deep Think是Google推出的專門推理模式，專為解決科學、研究和工程領域的復雜挑戰(zhàn)而設計。它能夠處理缺乏明確答案和混亂數(shù)據(jù)的研究問題，將深厚科學知識與工程實用性結合，甚至能識別人工同行評議未發(fā)現(xiàn)的邏輯缺陷，還可以將草圖轉化為3D打印文件。

Q2：Deep Think在學術測試中表現(xiàn)如何？

A：Deep Think在各項嚴格學術基準測試中表現(xiàn)卓越：在"人類最后考試"中達到48.4%，在ARC-AGI-2上獲得84.6%，Codeforces評分達到3455 Elo，2025年國際數(shù)學奧林匹克達到金牌級表現(xiàn)，在國際物理和化學奧林匹克筆試中也展現(xiàn)金牌級結果。

Q3：如何獲得Deep Think的使用權限？

A：Google AI Ultra訂閱用戶可以直接在Gemini應用中使用更新的Deep Think模式。科學家、工程師和企業(yè)用戶可以申請早期訪問計劃，通過Gemini API體驗Deep Think功能。這是首次通過API向研究人員和企業(yè)開放這項技術。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.