![]()
就在剛剛,Gemini 3 Deep Think重磅升級,以一種恐怖的姿態刷爆了全領域的SOTA(當前最佳技術水平)。這不是一次簡單的版本迭代,而是一次 AI 推理能力的維度跨越——在科學研究和硬核工程領域,它已經不再是“副駕駛”,而是真正的最強大腦。
![]()
一個數據足以讓所有開發者沉默:在剛剛結束的 Codeforces 編程比賽中,Gemini 3 Deep Think 拿下了3455Elo的驚人分數。 這意味著什么?它不僅達到了世界冠軍級的水準,更直接沖入了人類 TOP 10,排名全球第七!
也就是說,在這個星球上,目前僅有 7 個人類選手能勉強壓制住它。作為對比,一年前被奉為神作的最強OpenAI o3 模型,也僅僅拿下了 2727 Elo。Gemini 3 Deep Think 的出現拿到3455 Elo,讓 AI 編程能力直接斷層領先。
但這只是冰山一角。 在人類最后考試(HLE)上,它拿下了48.4%的成績,刷新 SOTA; 在最難的 ARC-AGI-2 基準測試中,它一夜之間讓榜單直接飽和,以84.6%的分數一騎絕塵。
與 Gemini 3 Pro 相比,Deep Think 實現了全方位的反超,更是將ClaudeOpus 4.6、GPT-5.2直接踩在了腳下。
![]()
目前,Google AI Ultra 訂閱用戶已經可以在后臺直接體驗,API 也已向部分開發者開放。屬于 AI 推理的新紀元,真的來了。
Gemini 3 Deep Think 的強,不是擠牙膏式 5% 提升,是斷崖式的維度打擊。
讓我們看一組讓友商窒息的數據:
全方位反超,絕非虛言。在 Google 官方公布的雷達圖中,Gemini 3 Deep Think 幾乎包圍了所有競爭對手。曾經的邏輯之王Claude Opus 4.6 在它面前顯得反應遲鈍,而 GPT-5.2 更是被遠遠甩在身后。
一位參與測試的開發者在推特上感嘆:以前我們對比模型是用跑分,現在對比 Deep Think,感覺像是在用智商。
它不僅是在做題,它是在思考。官方演示中,Deep Think 展現出的不僅僅是計算能力,更是一種對復雜系統的多維理解力——這也為它在現實物理世界中的驚人表現埋下了伏筆。
如果說前面的跑分只是學霸的自我修養,那么接下來的實戰表現,才真正讓人感受到了Gemini3 Deep Think 對物理世界的降維打擊。
它不再只是一個能聊天的 Bot,它開始具備了工程師的直覺和設計師的手眼。
最令人震撼的一幕,發生在谷歌 VP 的一個副業項目中:他隨手畫了一張極其實際的、甚至有些潦草的筆記本電腦支架草圖,扔給了 Deep Think。 Deep Think 沒有廢話,它不僅僅是“看懂”了這張圖,而是瞬間化身為一名資深工業設計師。它分析了草圖結構,自動補全了物理細節,直接渲染出了一個高保真、可落地的 3D 模型方案。
![]()
![]()
除了懂物理,它的審美也在線。Simon Willison 為了刁難它,發出了一個離譜指令:“生成一張鵜鶘騎自行車的 SVG 矢量圖”。 Deep Think 并沒有像以往的模型那樣生成一團亂碼,而是畫出了一張線條流暢、結構合理的矢量圖。 Simon 看完直接炸了
![]()
![]()
既然基礎題難不倒它,Simon 決定加大難度。結果 Deep Think 在處理復雜的幾何圖形和矢量路徑時,依然表現得游刃有余。 只需一張圖、一個提示詞,它就能深入思考,提供幾個你從未設想過的設計方案。
對于產品經理和設計師來說,這意味著什么? 這意味著“想法即產品”的時代真的來了。AI 開始理解空間、理解結構、理解物理約束——這才是通往 AGI 的必經之路。
畫圖、寫代碼還在我們可以理解的范疇,那么 Gemini 3 Deep Think 在科研領域的表現,則讓人感到一絲畏懼。
![]()
而在杜克大學,Wang Lab 的科學家們則被它的“創造力”震驚了。為了優化一種復雜晶體的生長制造方法,Deep Think 不僅分析了現有數據,還成功設計出了一種生長大于 100 μm 薄膜的全新配方。 這個精確目標,在此前的方法中幾乎難以實現。它不僅給出了方案,還預測了結果,直接讓物理零部件建模加速了十倍。
![]()
這意味著什么? 這意味著在科學發現的領域,AI 已經從整理資料進化到了產出新知。對于科研人員來說,它既是最好的搭檔,也是最強的對手。
Google AI Ultra 訂閱用戶即刻起就能在 Gemini 后臺體驗新版 Deep Think。同時,谷歌首次通過 API 向部分研究人員、工程師和企業開放了這一能力。
去年,Deep Think 還需要專門版才能解決數學難題;而今天,通用版的它已經能在 Codeforces 上虐殺人類選手,在實驗室里指導科學家做實驗。
如今,巨大的壓力球被狠狠拋回給了 OpenAI。面對谷歌這記直擊痛點、甚至可以說是“羞辱級”的 SOTA 回擊,Sam Altman 手里還藏著什么牌? 傳說中的 GPT-5 或者是那個神秘的“Q*”,如果不能拿出超越“自主科研”級別的能力,恐怕很難再復刻當年的 ChatGPT 時刻了。
2026 年的 AI 戰爭,才剛剛開始。但至少,谷歌 DeepMind 是跑在前方的贏家。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.