網易首頁 > 網易號 > 正文申請入駐

谷歌深夜發布Gemini，3，Deep，Think碾壓群雄

2026-02-18 14:36:43　來源: 二大爺觀世界

四川舉報

分享至

就在剛剛，Gemini 3 Deep Think重磅升級，以一種恐怖的姿態刷爆了全領域的SOTA（當前最佳技術水平）。這不是一次簡單的版本迭代，而是一次 AI 推理能力的維度跨越——在科學研究和硬核工程領域，它已經不再是“副駕駛”，而是真正的最強大腦。

一個數據足以讓所有開發者沉默：在剛剛結束的 Codeforces 編程比賽中，Gemini 3 Deep Think 拿下了3455Elo的驚人分數。這意味著什么？它不僅達到了世界冠軍級的水準，更直接沖入了人類 TOP 10，排名全球第七！

也就是說，在這個星球上，目前僅有 7 個人類選手能勉強壓制住它。作為對比，一年前被奉為神作的最強OpenAI o3 模型，也僅僅拿下了 2727 Elo。Gemini 3 Deep Think 的出現拿到3455 Elo，讓 AI 編程能力直接斷層領先。

但這只是冰山一角。在人類最后考試（HLE）上，它拿下了48.4%的成績，刷新 SOTA；在最難的 ARC-AGI-2 基準測試中，它一夜之間讓榜單直接飽和，以84.6%的分數一騎絕塵。

與 Gemini 3 Pro 相比，Deep Think 實現了全方位的反超，更是將ClaudeOpus 4.6、GPT-5.2直接踩在了腳下。

目前，Google AI Ultra 訂閱用戶已經可以在后臺直接體驗，API 也已向部分開發者開放。屬于 AI 推理的新紀元，真的來了。

Gemini 3 Deep Think 的強，不是擠牙膏式 5% 提升，是斷崖式的維度打擊。

讓我們看一組讓友商窒息的數據：

全方位反超，絕非虛言。在 Google 官方公布的雷達圖中，Gemini 3 Deep Think 幾乎包圍了所有競爭對手。曾經的邏輯之王Claude Opus 4.6 在它面前顯得反應遲鈍，而 GPT-5.2 更是被遠遠甩在身后。

一位參與測試的開發者在推特上感嘆：以前我們對比模型是用跑分，現在對比 Deep Think，感覺像是在用智商。

它不僅是在做題，它是在思考。官方演示中，Deep Think 展現出的不僅僅是計算能力，更是一種對復雜系統的多維理解力——這也為它在現實物理世界中的驚人表現埋下了伏筆。

如果說前面的跑分只是學霸的自我修養，那么接下來的實戰表現，才真正讓人感受到了Gemini3 Deep Think 對物理世界的降維打擊。

它不再只是一個能聊天的 Bot，它開始具備了工程師的直覺和設計師的手眼。

最令人震撼的一幕，發生在谷歌 VP 的一個副業項目中：他隨手畫了一張極其實際的、甚至有些潦草的筆記本電腦支架草圖，扔給了 Deep Think。 Deep Think 沒有廢話，它不僅僅是“看懂”了這張圖，而是瞬間化身為一名資深工業設計師。它分析了草圖結構，自動補全了物理細節，直接渲染出了一個高保真、可落地的 3D 模型方案。

除了懂物理，它的審美也在線。Simon Willison 為了刁難它，發出了一個離譜指令：“生成一張鵜鶘騎自行車的 SVG 矢量圖”。 Deep Think 并沒有像以往的模型那樣生成一團亂碼，而是畫出了一張線條流暢、結構合理的矢量圖。 Simon 看完直接炸了

既然基礎題難不倒它，Simon 決定加大難度。結果 Deep Think 在處理復雜的幾何圖形和矢量路徑時，依然表現得游刃有余。只需一張圖、一個提示詞，它就能深入思考，提供幾個你從未設想過的設計方案。

對于產品經理和設計師來說，這意味著什么？這意味著“想法即產品”的時代真的來了。AI 開始理解空間、理解結構、理解物理約束——這才是通往 AGI 的必經之路。

畫圖、寫代碼還在我們可以理解的范疇，那么 Gemini 3 Deep Think 在科研領域的表現，則讓人感到一絲畏懼。

而在杜克大學，Wang Lab 的科學家們則被它的“創造力”震驚了。為了優化一種復雜晶體的生長制造方法，Deep Think 不僅分析了現有數據，還成功設計出了一種生長大于 100 μm 薄膜的全新配方。這個精確目標，在此前的方法中幾乎難以實現。它不僅給出了方案，還預測了結果，直接讓物理零部件建模加速了十倍。

這意味著什么？這意味著在科學發現的領域，AI 已經從整理資料進化到了產出新知。對于科研人員來說，它既是最好的搭檔，也是最強的對手。

Google AI Ultra 訂閱用戶即刻起就能在 Gemini 后臺體驗新版 Deep Think。同時，谷歌首次通過 API 向部分研究人員、工程師和企業開放了這一能力。

去年，Deep Think 還需要專門版才能解決數學難題；而今天，通用版的它已經能在 Codeforces 上虐殺人類選手，在實驗室里指導科學家做實驗。

如今，巨大的壓力球被狠狠拋回給了 OpenAI。面對谷歌這記直擊痛點、甚至可以說是“羞辱級”的 SOTA 回擊，Sam Altman 手里還藏著什么牌？傳說中的 GPT-5 或者是那個神秘的“Q*”，如果不能拿出超越“自主科研”級別的能力，恐怕很難再復刻當年的 ChatGPT 時刻了。

2026 年的 AI 戰爭，才剛剛開始。但至少，谷歌 DeepMind 是跑在前方的贏家。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.