![]()
推理能力翻倍,價格不變,這一次 Google 是真的想重新定義 AI 競爭的規(guī)則。
作者|樺林舞王
編輯|靖宇
馬年「AI 春運」賽程過半,OpenAI、Anthropic、阿里等玩家相繼拿出新活兒,現在,Google 也正式加入!
當地時間 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。
這一次,Google 沒有玩什么花哨的概念,直接用數據說話。
在 ARC-AGI-2 這個公認的推理基準測試中,Gemini 3.1 Pro 拿到了 77.1% 的分數。什么概念?它的前輩 Gemini 3 Pro 只有 31.1%,就連專門用來「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。
77.1% 對比 31.1%,這不是漸進式改進,這是推理能力的翻倍突破。
更讓人意外的是,Google 選擇了一個近乎「反商業(yè)」的策略:價格不漲。Gemini 3.1 Pro 保持了與 Gemini 3 Pro 完全相同的定價結構——相當于給所有API用戶免費升級了推理能力。
JetBrains 的 AI 總監(jiān) Vladislav Tankov 在測試后直言:相比之前版本有 15% 的質量改進,「更強、更快……且更高效,需要的輸出 tokens 更少」。
這種「暴力美學」式的升級,讓我想起了早期 Google 的做派——用技術說話,用實力碾壓。
這次,Google 能憑借 Gemini 3.1 Pro,繼續(xù)驚艷世界嗎?
01
「.1」版本號的野心
細心的人可能注意到,這是 Google 第一次使用「.1」這樣的增量版本號。
在軟件行業(yè),「.1」通常意味著重要的功能更新,但不是顛覆性的架構重構。Google 選擇 3.1 而不是 4.0,其實在向市場傳遞一個信號:
我們還有更大的招數沒出。
![]()
Gemini 3.1 Pro 與自家和友商模型數據對比|圖片來源:9to5Google
從企業(yè)客戶的反饋來看,這個「.1」的威力確實不小。
Databricks 的 CTO 報告說,新模型在 OfficeQA 基準上取得了「同類最佳的結果」。Cartwheel 的聯(lián)合創(chuàng)始人更是直接指出,模型對 3D 變換的理解有了「顯著提升」,解決了 3D 動畫管道中長期存在的旋轉順序問題。
Box AI 的企業(yè)評估數據更加直觀:在醫(yī)療和生命科學領域,準確性從 47% 躍升到 67%;在法律任務中,準確性從 57% 提升到 74%。
這些不是實驗室里的跑分游戲,而是真實商業(yè)場景中的能力驗證。
02
AI 競爭進入「推理紀元」
如果說過去一年的 AI 競爭是「誰更聰明」的比拼,那么 Gemini 3.1 Pro 的發(fā)布策略,可能正在把游戲規(guī)則拉向「誰更劃算」。
在大多數基準測試中,Gemini 3.1 Pro 都領先于 Anthropic 的 Opus 4.6 和 OpenAI 的 GPT-5.2,但價格卻是 Opus 4.6 的一半。這種性價比優(yōu)勢,對于大量使用 AI API 的企業(yè)客戶來說,吸引力是致命的。
一位開發(fā)者在社區(qū)分享了一個令人印象深刻的案例:他用單個提示讓 Gemini 3.1 Pro 構建了一個功能完整的 Windows 11 風格網絡操作系統(tǒng),包括文本編輯器、Python 終端、代碼編輯器、文件管理器、繪畫應用和可玩游戲。
這種「一個提示解決復雜問題」的能力,正是推理模型的核心價值所在。
當然,Gemini 3.1 Pro 也不是完美無缺。在 GDPval-AA 這個衡量真實世界經濟任務的基準測試中,它的得分為 1317 分,明顯低于 Anthropic Sonnet 4.6 的 1633 分。這提醒我們,即使是最先進的 AI 模型,在處理復雜現實問題時仍有局限性。
![]()
Gemini 3.1 Pro 在設計上也更有「品味」了|圖片來源:Google
VentureBeat 的分析師一針見血地指出:「Google 加倍投入核心推理和 ARC-AGI-2 等專業(yè)基準,表明 AI 競賽的下一階段,將由能夠思考問題的模型贏得,而不僅僅是預測下一個詞。」
這句話道出了當前 AI 競爭的本質變化。
過去兩年,我們見證了 ChatGPT 從「會聊天的 AI」進化為「會推理的 AI」,見證了 Claude 從「安全的助手」變成「深度思考的伙伴」。
現在,Google 用 Gemini 3.1 Pro 告訴市場:推理能力才,是 AI 模型的核心護城河。
從技術角度看,Gemini 3.1 Pro 與 Google 的新型代理開發(fā)平臺 Antigravity 深度集成,開發(fā)者可以切換不同的「推理預算」,在速度和準確性之間找到平衡。這種靈活性,可能是未來 AI 應用開發(fā)的新范式。
從商業(yè)角度看,Google 選擇「性能翻倍、價格不變」的策略,實際上是在用規(guī)模經濟對抗技術溢價。這背后的邏輯很簡單:我有足夠的資源和效率優(yōu)勢,可以用更低的成本提供更好的服務。
這場 AI 軍備競賽,正在從「技術炫技」回歸到「商業(yè)本質」。
Gemini 3.1 Pro 的發(fā)布,讓我想起了那個曾經「不作惡」的 Google——用技術改變世界,用創(chuàng)新降低門檻。雖然這家公司在過去幾年經歷了不少爭議,但在 AI 這個關鍵戰(zhàn)場上,它似乎正在找回自己最擅長的節(jié)奏。
當然,OpenAI 和 Anthropic 不會坐以待斃。這場推理能力的軍備競賽才剛剛開始。
*頭圖來源:Google
本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO
極客一問
你覺得 Google 能憑借
Gemini 3.1 Pro 重奪 AI 王座嗎?
![]()
Sam Altman:未來物質會極度豐饒,人類的注意力才是稀缺品。
點贊關注極客公園視頻號,
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.