網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌Gemini 3.1 Pro屠榜封神，清華姚順宇出手！Claude和GPT被逼入死角

2026-02-20 05:34:25　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：好困桃子

【新智元導(dǎo)讀】谷歌DeepMind深夜扔出核彈，下一代Gemini 3.1 Pro正式登場(chǎng)。在公認(rèn)的最難ARC-AGI-2測(cè)試中，它拿下最高分直接看呆硅谷，推理狂飆2倍，直接把Claude 4.6拉下王座。

Gemini 3 Pro之后，谷歌DeepMind終于祭出殺招！

剛剛，下一代旗艦?zāi)Ｐ虶emini 3.1 Pro深夜炸場(chǎng)，直接刷爆全領(lǐng)域的SOTA，成為AI新王。

Deep Think之后，清華校友姚順宇也參與了Gemini 3.1 Pro的研發(fā)

這一次，Gemini 3.1 Pro實(shí)現(xiàn)了大模型推理能力的史詩(shī)級(jí)飛躍。

在極為嚴(yán)苛的ARC-AGI-2測(cè)試中，它一舉斬獲77.1%的高分，性能飆升至上一代3.0 Pro的兩倍有余。

外加接近滿分（98%）的ARC-AGI-1，不管是思考拉滿的Claude Opus 4.6，還是特調(diào)版的GPT-5.2，通通都被踩在了腳下。

從下方的SVG對(duì)比測(cè)試中，便能直觀感受到3.1 Pro與3 Pro之間懸殊的實(shí)力代差。

在編程和推理領(lǐng)域，Gemini 3.1 Pro同樣一騎絕塵，全面碾壓Sonnet 4.6、GPT-5.2。

在AAII綜合評(píng)測(cè)中，3.1 Pro強(qiáng)勢(shì)登頂，不僅總分領(lǐng)先Claude Opus 4.6足足4分，API調(diào)用成本更是不到一半。

今天起，Gemini 3.1 Pro已正式在Gemini和NotebookLM中上線。開(kāi)發(fā)者可通過(guò)Google AI Studio、Antigravity以及Android Studio搶先體驗(yàn)。

如今，硅谷的AI戰(zhàn)局已然變天，重量級(jí)玩家僅剩下谷歌DeepMind和Anthropic「硬碰硬」。

此前曾風(fēng)頭無(wú)兩的OpenAI，似乎正逐漸失去在這片主戰(zhàn)場(chǎng)上的主動(dòng)權(quán)。

Gemini 3.1 Pro深夜突襲

全能SOTA成績(jī)翻倍

作為谷歌迄今為止最強(qiáng)悍的模型，3.1 Pro在3 Pro的基礎(chǔ)上實(shí)現(xiàn)了全面跨越。

它不僅具備原生的全模態(tài)輸入能力，更支持高達(dá)100萬(wàn)Token的超長(zhǎng)上下文。

在業(yè)界最為關(guān)注的性能對(duì)標(biāo)中，Gemini 3.1 Pro展現(xiàn)出了令人窒息的統(tǒng)治力。

在人類最后考試（HLE）中，Gemini 3.1 Pro在零工具輔助下拿下了44.4%的成績(jī)，將GPT-5.2（34.5%）和Opus 4.6（40.0%）逼到了墻角。

在ARC-AGI-2測(cè)試中，Gemini 3.1 Pro以77.1%的逆天成績(jī)一騎絕塵，把剛剛登頂沒(méi)兩天的Opus 4.6（68.8%）甩在了身后。

更讓人震撼的，是它在代碼和AI智能體領(lǐng)域的跨越式進(jìn)化。

在LiveCodeBench Pro中，狂砍2887的Elo積分，斷層領(lǐng)先同儕；
在Terminal-Bench 2.0中，憑借68.5%的得分壓制了專攻代碼的GPT-5.3-Codex（64.7%）；
在APEX-Agents中，更是以33.5%的成績(jī)傲視群雄，相比之下，Opus 4.6得分為29.8%，而GPT-5.2僅有23.0%。

除了硬核推理，Gemini 3.1 Pro在長(zhǎng)篇大論的處理上也大秀肌肉。

在MRCR v2的128k長(zhǎng)上下文測(cè)試中，它直接拿下了84.9%的高分。

更可怕的是，它獨(dú)家支持了1M Token的終極測(cè)試并取得26.3%的成績(jī)，而同臺(tái)競(jìng)技的GPT-5.2和Opus 4.6在這個(gè)級(jí)別上甚至直接顯示「不支持」。

更重要的是，相較于上一代，3.1 Pro在幻覺(jué)率上大幅下降。

手搓神級(jí)應(yīng)用，這才是殺手級(jí)AI

3.1 Pro帶來(lái)的不僅是跑分上的碾壓，更是邏輯推理能力的全面進(jìn)化。

現(xiàn)在，它不僅能攻克極度棘手的邏輯難題，更在實(shí)際落地應(yīng)用中展現(xiàn)出了令人驚艷的生產(chǎn)力重塑能力。

不論是將晦澀的概念轉(zhuǎn)化為直觀圖解，把海量數(shù)據(jù)濃縮成清晰的圖表，還是讓天馬行空的創(chuàng)意直接變成現(xiàn)實(shí)，3.1 Pro都能輕松勝任。

基于代碼的動(dòng)畫

只需一段簡(jiǎn)單的文本提示詞，3.1 Pro就能直接生成可無(wú)縫嵌入網(wǎng)頁(yè)的SVG動(dòng)畫。

最絕的是，這些純代碼構(gòu)建的動(dòng)畫不僅支持無(wú)限放大且絕對(duì)清晰，它的文件體積相比傳統(tǒng)視頻更是小得令人難以置信。

整合復(fù)雜系統(tǒng)

強(qiáng)大的推理能力還讓3.1 Pro徹底打破了復(fù)雜API與人性化設(shè)計(jì)之間的壁壘。

比如，它能直接構(gòu)建出一個(gè)實(shí)時(shí)的航天數(shù)據(jù)看板，完美接入公開(kāi)的遙測(cè)數(shù)據(jù)流，將國(guó)際空間站的實(shí)時(shí)運(yùn)行軌跡清晰地展現(xiàn)在你眼前。

交互設(shè)計(jì)

3.1 Pro甚至能用純代碼編寫出極其復(fù)雜的3D椋鳥群舞特效，為你打造一整套沉浸式體驗(yàn)。

在這套系統(tǒng)中，你可以通過(guò)手勢(shì)追蹤技術(shù)實(shí)時(shí)「指揮」鳥群，同時(shí)還能聽(tīng)到隨著鳥群動(dòng)態(tài)實(shí)時(shí)演變的生成式配樂(lè)。

這絕對(duì)是研究人員和設(shè)計(jì)師開(kāi)發(fā)多模態(tài)交互界面原型的一大利器。

創(chuàng)意編程

更有趣的是，3.1 Pro還能將經(jīng)典的文學(xué)主題轉(zhuǎn)化為真正能跑的精美代碼。

比如讓它為《呼嘯山莊》設(shè)計(jì)一個(gè)現(xiàn)代風(fēng)格的個(gè)人主頁(yè)，模型不僅精準(zhǔn)捕捉了原著壓抑深沉的氛圍基調(diào)，還順勢(shì)生成了一個(gè)極簡(jiǎn)且充滿現(xiàn)代感的界面，可謂是完美拿捏了主角的靈魂底色。

全網(wǎng)驚艷首測(cè)，統(tǒng)治SVG

谷歌UX工程師Michael Chang直接上手，用3.1 Pro模擬復(fù)雜的城市規(guī)劃，瞬間生成并設(shè)計(jì)出了一個(gè)全新的城市鳥瞰拓?fù)洹?/p>

僅僅輸入一句話的Prompt，3.1 Pro便在短短3分鐘內(nèi)，搓出了一個(gè)長(zhǎng)達(dá)11秒SVG動(dòng)畫。

在另一個(gè)SVG測(cè)試中，它生成的「海豹頂皮球」在視覺(jué)表現(xiàn)力上也堪稱驚艷。

AI大牛Simon Willison在測(cè)試中，讓3.1 Pro在5分鐘內(nèi)生成了一個(gè)可以清晰勾勒出腿的鵜鶘SVG。

在3D空間推理方面，3.1 Pro也是新SOTA。

3.1 Pro生成的3D像素版寶可夢(mèng)，可比3.0 Pro強(qiáng)太多了。

另外，3.1 Pro還能生成最佳的交互式動(dòng)畫，展示一顆種子從發(fā)芽到長(zhǎng)成大樹(shù)的全過(guò)程。

進(jìn)化沒(méi)有終點(diǎn)，只有更強(qiáng)的下一幕

今天起，Gemini 3.1 Pro預(yù)覽版正式發(fā)布，這僅僅是一個(gè)新的開(kāi)始。

谷歌表示，從去年11月至今，用戶真實(shí)的反饋，都加速了每一次的研發(fā)迭代。

Gemini 3.1 Pro深夜突襲，是對(duì)AI行業(yè)格局的又一次重塑。

谷歌 DeepMind 用這種近乎「肌肉秀」的迭代速度告訴世界——

在通往AGI的深水區(qū)，只有硬件算力與算法深度耦合的玩家，才能拿穩(wěn)下半場(chǎng)的入場(chǎng)券。

參考資料：

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

https://x.com/Google/status/2024519455389192204?s=20

https://deepmind.google/models/model-cards/gemini-3-1-pro/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

中國(guó)常駐聯(lián)合國(guó)代表傅聰重申：日本沒(méi)資格要求入常

央視新聞客戶端 2026-02-21 08:01:36
4554 跟貼 4554
痛心！樹(shù)齡1200年古樟持續(xù)燃燒7小時(shí)，只因倆小孩隨手扔爆竹

環(huán)球網(wǎng)資訊 2026-02-21 10:22:16
643 跟貼 643

人氣火爆！江蘇無(wú)錫一景區(qū)發(fā)布限流公告

現(xiàn)代快報(bào) 2026-02-19 22:42:05
591 跟貼 591

硅谷大佬拒絕握手，印度AI峰會(huì)“槽點(diǎn)”不斷

第一財(cái)經(jīng)資訊 2026-02-20 21:10:47
433 跟貼 433
廣州將迎來(lái)三波返程高峰

新快報(bào)新聞 2026-02-20 20:03:11
118 跟貼 118

南都記者俄羅斯直擊：有同胞稱不敢冒險(xiǎn)，擬取消貝加爾湖行程

南方都市報(bào) 2026-02-20 21:00:44
740 跟貼 740

訂單排到4月！山東福安達(dá)春節(jié)不打烊全力趕生產(chǎn)

齊魯壹點(diǎn) 2026-02-20 18:07:10
239 跟貼 239
柬埔寨向26國(guó)通報(bào)

澎湃新聞 2026-02-21 02:12:47
164 跟貼 164

美國(guó)2025年國(guó)內(nèi)生產(chǎn)總值（GDP）增長(zhǎng)2.2%，低于2024年的2.8%

每日經(jīng)濟(jì)新聞 2026-02-20 21:43:05
197 跟貼 197
一天涌入20.4萬(wàn)人！無(wú)錫到處都在排隊(duì)！

江南晚報(bào) 2026-02-20 18:33:51
355 跟貼 355
大年初五迎財(cái)神，馬年理財(cái)錢投哪？

上觀新聞 2026-02-21 12:09:05
36 跟貼 36
美航天局：載人繞月任務(wù)發(fā)射將于3月6日進(jìn)行

央視新聞客戶端 2026-02-21 07:43:36
681 跟貼 681
特斯拉新車正式下線：無(wú)方向盤、無(wú)踏板、無(wú)后視鏡；定價(jià)不高于3萬(wàn)美元，“不需要人開(kāi)，直接輸入目的地即可”

中國(guó)能源網(wǎng) 2026-02-20 19:18:19
4 跟貼 4
中國(guó)短道速滑隊(duì)創(chuàng)28年來(lái)最差戰(zhàn)績(jī)，“王濛說(shuō)簽生死狀復(fù)出”登上熱搜第一，不是說(shuō)遺憾，是滑得太難看了！

大象新聞 2026-02-21 15:44:03
3 跟貼 3
英媒：英國(guó)政府考慮立法取消安德魯王位繼承權(quán)

環(huán)球網(wǎng)資訊 2026-02-21 07:10:25
82 跟貼 82
俄戰(zhàn)略轟炸機(jī)在白令海完成計(jì)劃飛行有外國(guó)戰(zhàn)機(jī)伴飛

界面新聞 2026-02-20 20:37:08
396 跟貼 396
胖東來(lái)恢復(fù)營(yíng)業(yè)首日客流量爆滿，有顧客凌晨5點(diǎn)開(kāi)車排隊(duì)，周邊道路已堵車，客服：超市已限流，需排隊(duì)2小時(shí)

極目新聞 2026-02-21 11:31:32
1 跟貼 1
韓國(guó)歷史學(xué)家：韓中兩國(guó)需共同調(diào)研抗日斗爭(zhēng)史

澎湃新聞 2026-02-21 11:42:58
6 跟貼 6
iPhone 18 Pro續(xù)航有望再突破：三大升級(jí)加持

環(huán)球網(wǎng)資訊 2026-02-21 09:39:01
86 跟貼 86
溫州景區(qū)一幕！寶馬車主太囂張

溫百君 2026-02-21 16:50:13
0 跟貼 0
33.9萬(wàn)！火鍋店稱把春節(jié)4天盈利分給員工，老板：去年關(guān)了兩家店但春節(jié)福利要堅(jiān)持

紅星新聞 2026-02-21 10:12:08
0 跟貼 0
沒(méi)想到，這事兒驚動(dòng)了新華社！

鈞言堂 2026-02-21 16:45:17
0 跟貼 0
罄！告急！有跨省回上海返程機(jī)票高達(dá)11560元

新民晚報(bào) 2026-02-21 12:30:00
0 跟貼 0

省直機(jī)關(guān)女工程師陷美男計(jì)，拉公職人員丈夫當(dāng)間諜17年，央視披露：將工作中的涉密文件私自帶回家拍照拷貝，伺機(jī)出境，2人均獲刑

新智元

AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代

14565文章數(shù) 66632關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

家居

時(shí)尚

教育

軍事航空

轉(zhuǎn)頭就暈的耳石癥，能開(kāi)車上班嗎？

家居要聞

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

谷歌Gemini 3.1 Pro屠榜封神，清華姚順宇出手！Claude和GPT被逼入死角

開(kāi)蓋版Ryzen 7 9850X3D來(lái)了！價(jià)格小貴 性能釋放暴增20W

在貝加爾湖遇難的3名中國(guó)游客身份已確認(rèn)：系一家人

在貝加爾湖遇難的3名中國(guó)游客身份已確認(rèn)：系一家人

冬奧第一"海王"？一人和13國(guó)選手都有關(guān)系

鏢人反超驚蟄無(wú)聲拿下單日票房第二！

一覺(jué)醒來(lái)，世界大變，特朗普改新打法了

智譜上市1月漲5倍，市值超越京東、快手

態(tài)度原創(chuàng)

轉(zhuǎn)頭就暈的耳石癥，能開(kāi)車上班嗎？

本真棲居 愛(ài)暖伴流年

2026紐約秋冬時(shí)裝周，在春天開(kāi)啟美的新故事！

新春走基層 | 慢飛天使捏出 “年的形狀”

硬核揭秘！福建艦“一馬當(dāng)先”底氣何在

開(kāi)蓋版Ryzen 7 9850X3D來(lái)了！價(jià)格小貴性能釋放暴增20W

本真棲居愛(ài)暖伴流年