網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，Gemini 3.1 Pro 發(fā)布！清華姚順宇站臺(tái)宣傳，Karpathy：應(yīng)用商店的時(shí)代結(jié)束了

2026-02-20 07:44:34　來(lái)源: AppSo

廣東舉報(bào)

分享至

　　剛在印度 AI 峰會(huì)上經(jīng)歷了最尷尬的一幕，Google CEO Sundar Pichai 轉(zhuǎn)頭就在今天凌晨官宣了最新模型 Gemini 3.1 Pro。

　　時(shí)機(jī)選得，相當(dāng)精準(zhǔn)（doge）。

　　OpenAI CEO 和 Anthropic CEO 在合影時(shí)拒絕握手，而是高舉拳頭。

　　雖然距離上周 Gemini 3 Deep Think 的更新沒幾天，但 3.1 Pro 的定位，Google 說(shuō)得很清楚——專為那些「一個(gè)簡(jiǎn)單答案遠(yuǎn)遠(yuǎn)不夠」的任務(wù)而設(shè)計(jì)，是解決復(fù)雜問題的基礎(chǔ)底座。

　　按慣例，0.1 的版本號(hào)更新通常意味著小修小補(bǔ)，然而，在測(cè)試模型解決全新邏輯模式能力的 ARC-AGI-2 基準(zhǔn)上，3.1 Pro 拿下 77.1%，是上代 3 Pro（31.1%）的兩倍多，同時(shí)壓過了 Anthropic 的 Opus 4.6（68.8%）和 OpenAI 的 GPT-5.2（52.9%）。

　　其它方面，科學(xué)知識(shí)測(cè)試 GPQA Diamond 拿了 94.3%，智能體類基準(zhǔn) MCP Atlas 和 BrowseComp 分別拿下 69.2% 和 85.9%。

　　編程能力方面，競(jìng)爭(zhēng)性編程基準(zhǔn) LiveCodeBench Pro 的 Elo 評(píng)分達(dá)到 2887，超過 3 Pro 的 2439 和 GPT-5.2 的 2393。SWE-Bench Verified 上，3.1 Pro 拿了 80.6%，和 Opus 4.6 的 80.8% 基本打平。

　　當(dāng)然，3.1 Pro 也不是處處碾壓。

　　多模態(tài)基準(zhǔn) MMMU Pro 上，上代 3 Pro 反而略勝（81.0% vs 80.5%）；啟用工具支持的 Humanity's Last Exam 里，Opus 4.6 以 53.1% 拿了第一。外界長(zhǎng)期批評(píng) Google 工具使用效率不如對(duì)手，這次還是沒能完全堵上嘴。

　　第三方知名分析機(jī)構(gòu) Artificial Analysis 則給出了相當(dāng)實(shí)在的評(píng)價(jià)。

　　3.1 Pro 在他們的智能指數(shù)里排名第一，比 Opus 4.6 高 4 分；整個(gè)測(cè)試跑下來(lái)總計(jì)使用約 5700 萬(wàn) tokens，完成測(cè)試的成本不到 Opus 4.6 的一半。能打又省錢，這個(gè)組合還是很香的。

　　Google DeepMind 首席科學(xué)家 Jeff Dean 也轉(zhuǎn)發(fā)了一個(gè)是用 3.1 Pro 模擬城市規(guī)劃、設(shè)計(jì)全新城市的應(yīng)用，從零生成可交互的規(guī)劃界面 demo。

　　Google 官方博客則展示了幾個(gè)更日常的方向。代碼動(dòng)畫方面，3.1 Pro 可以直接根據(jù)文字提示生成動(dòng)態(tài) SVG，因?yàn)槭羌兇a生成而非像素，任意縮放都不失真，文件體積也遠(yuǎn)小于傳統(tǒng)視頻。

　　復(fù)雜系統(tǒng)方面，模型直接接入公開遙測(cè)數(shù)據(jù)流，搭出了一個(gè)實(shí)時(shí)追蹤國(guó)際空間站軌道的航天儀表盤。

　　更有意思的是兩個(gè)創(chuàng)意類 demo。

　　一個(gè)是 3D 椋鳥群模擬，不只是生成視覺代碼，還支持用手勢(shì)操控鳥群，并配有隨鳥群動(dòng)態(tài)變化的生成音樂；

　　另一個(gè)是把《呼嘯山莊》的文學(xué)氛圍轉(zhuǎn)化成一個(gè)現(xiàn)代個(gè)人網(wǎng)站，模型沒有簡(jiǎn)單概括情節(jié)，而是分析了小說(shuō)的整體基調(diào)，設(shè)計(jì)出了貼合主人公氣質(zhì)的界面風(fēng)格。

　　此外，網(wǎng)友們也貢獻(xiàn)了不少精彩的案例。有人讓 3.1 Pro 生成一個(gè)「鬼怪獵人穿越鬼屋」的動(dòng)態(tài) SVG 循環(huán)動(dòng)畫，結(jié)果直接看呆，評(píng)價(jià)是「Google 這次是認(rèn)真的」。

　　還有網(wǎng)友認(rèn)為讓它生成種子破土、根系延伸、莖稈冒出、葉片展開、直到長(zhǎng)成完整大樹的交互動(dòng)畫，每個(gè)生長(zhǎng)階段的過渡都順滑自然，說(shuō)這是見過最好的同類效果。

　　去年從 Anthropic 轉(zhuǎn)投 Google DeepMind 的清華物理系特獎(jiǎng)得主姚順宇也站臺(tái)宣傳：「Gemini 不僅是一個(gè)優(yōu)秀的模型，而且更好的模型正以不可阻擋的方式到來(lái)。」

　　當(dāng)然，這些 demo 加在一起說(shuō)的是同一件事：模型能做的事，已經(jīng)從單純的回答問題延伸到完成一整套專業(yè)或創(chuàng)意工作流了。

　　價(jià)格方面，API 按分級(jí)付費(fèi)，整體和上代 3 Pro 保持一致，但跟 Anthropic Opus 系列比還是相對(duì)便宜的。

　　20 萬(wàn) tokens 以內(nèi)，輸入 2 美元 / 每百萬(wàn) tokens，輸出 12 美元；超過 20 萬(wàn) tokens，輸入漲到 4 美元，輸出 18 美元。搜索功能每月前 5000 次免費(fèi)，之后每 1000 次查詢收費(fèi) 14 美元。

　　現(xiàn)在，開發(fā)者可以在 AI Studio、Gemini API、Gemini CLI、智能體開發(fā)平臺(tái) Google Antigravity 以及 Android Studio；企業(yè)用戶在 Vertex AI 和 Gemini Enterprise；普通用戶在 Gemini 應(yīng)用和 NotebookLM 都能用，后者僅限 Pro 和 Ultra 訂閱。

　　值得注意的是，3.1 Pro 目前只是預(yù)覽版，Google 大概率是要繼續(xù)打磨好智能體工作流再推正式版，向外界展示出一副還沒使全力的姿態(tài)。

　　至于這種能力滲透到個(gè)人層面會(huì)發(fā)生什么，這讓我聯(lián)想到了 OpenAI 聯(lián)創(chuàng) Andrej Karpathy 剛剛發(fā)布的推文：

　　他想用 8 周時(shí)間把靜息心率從 50 降到 45，計(jì)劃是設(shè)定 Zone 2 有氧總時(shí)長(zhǎng)目標(biāo)，配合每周一次 HIIT。為了追蹤進(jìn)展，他花了 1 小時(shí)用 vibe coding 做了一個(gè)專屬儀表盤。

　　上下滑動(dòng)查看更多內(nèi)容

　　過程比想象中麻煩，Claude 需要對(duì) Woodway 跑步機(jī)的云 API 進(jìn)行逆向工程，提取原始數(shù)據(jù)，處理篩選，搭出 Web 前端界面，中間還有公制英制單位混用、日歷日期對(duì)不上這些 bug 需要手動(dòng)發(fā)現(xiàn)并要求修復(fù)。

　　Karpathy 的感嘆很直接，兩年前這事得花 10 小時(shí)，現(xiàn)在 1 小時(shí)。但他更在意的是：這本來(lái)應(yīng)該只需要 1 分鐘。

　　他的判斷是，應(yīng)用商店模式正在過時(shí)。

　　300 行代碼、LLM 幾秒生成的專屬工具，沒必要變成一個(gè)正經(jīng) App 讓你去搜索下載。他同時(shí)也點(diǎn)了行業(yè)的問題：99% 的產(chǎn)品仍然沒有 AI 原生的 CLI，還在維護(hù)給人看的前端界面，而不是直接提供便于 Agent 調(diào)用的 API。

　　Woodway 跑步機(jī)本質(zhì)上就是個(gè)傳感器，結(jié)果還得讓 LLM 去逆向工程它，完全沒必要。

　　把 Jeff Dean 的城市規(guī)劃 demo 和 Karpathy 的跑步儀表盤放在一起看，其實(shí)是同一件事的兩面。當(dāng)普通人花 1 小時(shí)就能為自己做一個(gè)高度定制的專屬工具，由 AI 原生傳感器和執(zhí)行器構(gòu)成、LLM 負(fù)責(zé)編排、即興生成高度定制專屬應(yīng)用的時(shí)代，就已經(jīng)近在眼前了。

附官方博客：

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.