魚羊 夢(mèng)瑤 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
春節(jié)檔國產(chǎn)大模型狂卷,谷歌也突然出手,Gemini 3.1 Pro直接深夜放大招!
相較于去年11月才剛剛發(fā)布的3 Pro,別看只是「.1」的一小步,升級(jí)幅度肉眼可見:
在官方給出的SVG對(duì)比展示中,3.1Pro在多模態(tài)生成和語義理解上都提升了一個(gè)level。

不僅如此,3.1 Pro還能將日常數(shù)據(jù)轉(zhuǎn)為互動(dòng)可視化內(nèi)容,一個(gè)航空航天儀表盤也能輕松roll出:

玩起「模擬城市」來,也是地形生成、道路鋪設(shè)、交通線路,一整套直接成型:

夯,是真夯,這不有網(wǎng)友們手搓體驗(yàn)完真·就只想說一句——其他家模型可以直接over了(doge)
![]()
閑話少敘,技術(shù)報(bào)告、模型卡更多細(xì)節(jié),我們直接開扒——
.1一小步,推理能力一大步
此次升級(jí),官方的說法是把上周發(fā)布的Gemini 3 Deep Think背后的核心智能給公開了:
在Gemini 3的基礎(chǔ)上,3.1 Pro在核心推理能力上更進(jìn)一步。
在ARC-AGI-2基準(zhǔn)測試中,3.1 Pro獲得了77.1%的驗(yàn)證分?jǐn)?shù),在推理表現(xiàn)上達(dá)到3 Pro的2倍之多:
![]()
此外,3.1 Pro支持1M上下文,知識(shí)截止日期為2025年1月,在多模態(tài)理解能力、vibe coding、多語言性能和長上下文方面都同步增強(qiáng)。
在Arena的對(duì)比評(píng)測結(jié)果中,3.1 Pro的整體排名分?jǐn)?shù)也比3 Pro高出13分,文本與代碼維度的表現(xiàn)進(jìn)步也相當(dāng)明顯:
![]()
在官方給出的多模態(tài)效果中,在同一句提示詞下,3.1 Pro在動(dòng)作連貫性和色彩輸出上較3.0 Pro有明顯提升:

在推理能力上,3.1 Pro相比上一代能應(yīng)對(duì)結(jié)構(gòu)更復(fù)雜、步驟更多的提示詞需求。
比如下面這個(gè)案例:3.1 Pro直接生成了一個(gè)3D版“椋鳥群飛”,視覺代碼一次到位,還順手做出了可交互玩法。
用戶可以直接通過手勢(shì)追蹤操控鳥群,而且畫面還能夠根據(jù)鳥群運(yùn)動(dòng)變化而生成的音樂~

整體上來看,在復(fù)雜主題的可視化方面,Gemini 3.1 Pro確有明顯的進(jìn)化。
網(wǎng)友們也在第一時(shí)間對(duì)官方宣傳進(jìn)行了檢驗(yàn)。
比如用3.1 Pro直接生成一個(gè)《我的世界》:

再瞧這位網(wǎng)友,用3.1 Pro搓出來了個(gè)人網(wǎng)站(別說,感覺比Gemini官網(wǎng)效果還好?):

還有網(wǎng)友腦洞大開,讓3.1 Pro開發(fā)了一款教育應(yīng)用,直言模型在模擬光線效果上那叫一個(gè)逼真!

一圈體驗(yàn)下來,大家紛紛表示:
- Gemini沒有在開玩笑。

目前,Gemini 3.1 Pro已經(jīng)在Gemini應(yīng)用和API中上線,Google AI Pro和Ultra用戶還可以在NotebookLM中使用這一最新模型。
智能成本還在呈數(shù)量級(jí)下降
有意思的一點(diǎn)是,此次發(fā)布Gemini 3.1 Pro,是谷歌首次采用「.1」這樣的小版本號(hào)。
具有網(wǎng)友表示:不兒,Gemini 3 Pro不是還在Preview嗎,這就出新模型啦?
![]()
不得不說,大模型的2026,注定還是要卷到飛起。
![]()
另外值得注意的是,谷歌這一小步,還又把大模型向帕累托前沿推了推。
帕累托前沿(Pareto Front),可以簡單理解為最小化成本,最大化性能。
定價(jià)方面,Gemini 3.1 Pro Preview的輸入價(jià)格為2美元(<200k tokens)/4美元(>200k tokens),輸出價(jià)格為4美元(<200k tokens)/18美元(>200k tokens),跟Gemini 3 Pro Preview持平。
從ARC-AGI基準(zhǔn)的視角來看,則是每完成一次ARC-AGI-2任務(wù)花費(fèi)0.96美元(約合人民幣6.63元)——
相較之下,Gemini 3 Deep Think價(jià)格是3.1 Pro的10倍,而兩者性能相差僅幾個(gè)百分點(diǎn)。
![]()
有網(wǎng)友認(rèn)為,這樣的推進(jìn)速度,「完全打破了傳統(tǒng)的成本-智能曲線」。
![]()
相比于基準(zhǔn)榜單上測試成績的變化,對(duì)于高速進(jìn)化中的大模型應(yīng)用而言,成本方面的持續(xù)壓縮更加值得關(guān)注。
并且2026,這才剛剛開始呢。
參考鏈接:
[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
[2]https://deepmind.google/models/gemini/pro/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.