<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌Gemini 3.1 Pro新王登場!一口氣手搓Win11操作系統

      0
      分享至



      性能暴增價格不變。

      作者 |程茜 江宇

      編輯 |心緣

      智東西2月20日消息,谷歌正式發布其新一代旗艦模型Gemini 3.1 Pro。根據谷歌放出的基準測試,谷歌最強復雜任務處理模型Gemini 3.1 Pro在12項測試中超過Gemini 3 Pro、Claude Opus 4.6、Claude Sonnet 4.6、GPT-5.2等模型,拿下第一。



      谷歌DeepMind主要提升了Gemini 3.1 Pro的推理能力。面對業界公認高難度的ARC-AGI-2通用智能基準測試,Gemini 3.1 Pro斬獲77.1%的高分,超越Claude、GPT模型,且成績相較Gemini 3 Pro實現翻倍提升。

      去年9月加入谷歌DeepMind的清華物理系傳奇人物姚順宇(Shunyu Yao)也發文官宣了新模型發布,并稱“更好的Gemini模型正以勢不可擋的速度涌現”



      下面這一經典的“鵜鶘騎自行車SVG動畫”對比,直觀體現了新模型的能力提升,右側Gemini 3.1 Pro生成的鵜鶘身體結構、騎行姿態自然合理,且自行車的車架、鏈條、腳踏、座椅等細節完整,相比Gemini 3 Pro的生成結果符合物理常識,更像一個完整的動畫場景。



      為Gemini 3.1開發SVG生成功能的清華校友Jiao Sun,在X上評論說“無比自豪”。

      從今日起,Google AI Pro、Ultra訂閱用戶可以在Gemini應用、AI助手NotebookLM中使用Gemini 3.1 Pro,免費用戶可向Gemini 3.1 Pro提問2次。開發者和企業用戶可以在AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI及Android Studio的Gemini API預覽版中使用Gemini 3.1 Pro。

      Gemini 3.1 Pro預覽版的API價格采用分級計費模式,與上一代Gemini 3 Pro預覽版保持一致,提示詞在20萬token以內,每百萬token輸入價格2美元(約合人民幣14元),輸出價格12美元(約合人民幣83元),提示詞超過20萬token,每百萬token輸入價格4美元(約合人民幣28元),輸出價格18美元(約合人民幣124元)。



      01.

      能搭WebOS、能做《我的世界》

      還能拆視覺錯覺

      Gemini 3.1 Pro的核心升級集中在復雜任務處理能力上。其博客透露,新模型在高級推理、多模態理解和復雜項目生成方面進一步強化,能夠更好應對高難度工作場景。模型發布后,社區實測迅速跟進。

      知名AI博主Chetaslua展示了其用Gemini 3.1 Pro一次性安裝Windows 11 WebOS的結果。

      Chetaslua在帖中直言:“上次我分享類似案例時還非常困難,現在已經變成常態。有了智能體系統,我們幾乎可以用這個模型做任何事。”



      他之前也發過用Gemini 3.0 Pro生成Windows Web操作系統的視頻,兩個視頻放一起對比,提升效果非常明顯。

      Gemini 3.1 Pro生成的系統界面有完整應用圖標、開始菜單樣式布局以及基礎窗口交互邏輯,整體形態更接近一個可運行的輕量級操作系統。

      相比之下,之前3.0 Pro生成的系統形態相對簡陋,一些基礎桌面交互和系統級應用缺失。

      另一組更偏工程化的案例顯示,有開發者用Gemini 3.1 Pro在瀏覽器中直接生成并運行了一個可交互的VoxelWeb項目,形態類似“我的世界”式3D沙盒。

      界面已包含啟動按鈕、移動控制、方塊交互以及基礎合成邏輯,具備完整的輕量沙盒雛形。



      在前端生成與動畫細節方面,也有開發者要求模型生成一段完整的交互式生長動畫,覆蓋種子發芽、根系形成、枝干生長到樹葉展開的全過程。



      實測結果顯示,模型在生長階段銜接與葉片細節上表現較為完整。該開發者評價稱:“這是我在這個提示詞下見過最好的樹葉效果。”

      視覺理解方向的測試則進一步拉高了難度。有網友專門驗證“AgenticVision”能力,輸入素材是一張看似普通的街頭垃圾桶照片。

      模型不僅完成了基礎識別,還進一步指出:當瞇眼或拉遠觀看時,畫面中的垃圾、陰影與輪廓會在視覺上拼合成兩個并排而坐的卡通角色。模型還逐項拆解了這一視覺錯覺的形成機制,解釋不同布料、垃圾袋與陰影分別對應角色的頭部、身體與外輪廓關系,體現出多步視覺推理能力。



      整體來看,Gemini 3.1 Pro已經開始觸及空間關系理解、形狀映射和視覺錯覺解釋等更高階視覺認知任務。開發者給出的綜合判斷是,其表現已進入當前第一梯隊水平。

      我們還用“開車還是步行去距離100米的洗車店洗車”、“父母能否結婚”等陷阱題考了考Gemini 3.1 Pro,結果它都成功避坑答對。



      02.

      手搓《模擬城市》

      創意編程、交互式設計分分鐘搞定

      谷歌DeepMind的官方X賬號展示了谷歌UX工程師Michael Chang用Gemini 3.1 Pro開發了一個逼真的城市規劃應用程序。Gemini 3.1 Pro能自己處理復雜地形、繪制基礎設施圖、模擬交通,最后生成高質量的可視化效果。

      除了上面提到的鵜鶘騎自行車,Gemini 3.1 Pro在生成青蛙騎老式高輪自行車、長頸鹿駕駛微型汽車、鴕鳥穿著旱冰鞋等各種抽象畫面的SVG動畫上,表現也毫不遜色。相比Gemini 3 Pro,Gemini 3.1 Pro的生成效果整體場景更生動、更有故事感,細節表現力大幅提升。

      如Gemini 3.1 Pro可以直接根據文本提示生成可用于網站的動畫SVG,并且由于這些動畫是用純代碼而非像素構建的,因此在任何尺寸下都能保持清晰,并且文件體積相比傳統視頻非常小

      Gemini 3.1 Pro的復雜推理能力,能幫助用戶使用復雜API完成設計。如下面案例,該模型構建了一個實時航空航天儀表盤,成功配置了公共遙測數據流,以可視化國際空間站的軌道運行軌跡。

      在交互式設計方面,Gemini 3.1 Pro可以編寫代碼,生成一個復雜的3D椋鳥群飛模擬。并且其還能構建沉浸式體驗,用戶可以通過手勢追蹤操控鳥群,同時聆聽一段生成式配樂,音樂會隨著鳥群的動態變化而改變。

      Gemini3.1 Pro還能進行創意編程, 將文學主題轉化為可運行的代碼。當被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》構建一個現代個人作品集網站時,該模型深入分析了小說的氛圍基調,設計出一個簡潔現代的界面,打造出一個能捕捉主角精神內核的網站。

      03.

      編程、推理、多模態樣樣行

      數項測試超Claude、GPT模型

      研究人員在一系列基準測試中對Gemini 3.1 Pro進行了評估,包括推理、多模態能力、智能體工具使用、多語言性能和長上下文。

      相比Gemini 3 Pro、Claude Sonnet 4.6、Claude Opus 4.6、GPT-5.2、GPT-5.3-Codex,Gemini 3.1 Pro在12項基準測試中拿下第一

      在需要更強推理能力的測試中,Gemini 3.1 Pro在人類最后的考試、ARC-AGI-2、GPQA Diamond 3項測試中,表現都優于Claude、GPT模型。

      編程能力測試中,Gemini 3.1 Pro在SWE-Bench Pro(公開版)和SWE-Bench Verified中得分相對較低,這兩大測試集考驗的是模型在真實項目中理解需求、定位問題、修改代碼、保證可用的端到端工程能力。

      GDPval-AA Elo是當前衡量大模型在高價值知識工作中綜合能力的相對評分體系,Gemini 3.1 Pro的表現優于GPT-5.2、GPT-5.3-Codex,僅次于Sonnet 4.6。

      衡量大模型工具使用能力的τ2-bench、MCP Atlas、BrowseComp、多語言性能的MMLU、長上下能力的MRCR v2測試集中,新模型的表現同樣優于其他模型。

      在多模態大模型學術評測基準MMMU-Pro上,Gemini 3.1 Pro的表現比Claude、GPT模型更好,但略遜于Gemini 3 Pro。

      04.

      結語:大模型競賽焦點

      轉向復雜任務落地能力

      當前大模型行業正從通用能力比拼,轉向真實世界復雜任務的實戰能力競爭,海內外各家模型在推理、工程化、多模態理解等核心能力上不斷發力突破,力求讓大模型真正落地應用,與真實業務場景相結合。

      谷歌近期的加速布局也是如此,其上周發布了Gemini 3 Deep Think模型升級、一周后又推出Gemini 3.1 Pro,都將模型的升級重點放在專業領域加速技術研發、解決實際工作中的復雜問題上。可以看出,當下大模型已經讓更智能的大模型真正具備解決真實世界復雜任務能力,AI成為專業領域核心生產力的潛力增加。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2028年的AI世界:AI在各方面都超出預期,但經濟面目全非

      2028年的AI世界:AI在各方面都超出預期,但經濟面目全非

      知識圈
      2026-02-23 13:14:49
      春天,使勁吃這菜,一通便,二利尿,三止咳,教你一個做法

      春天,使勁吃這菜,一通便,二利尿,三止咳,教你一個做法

      阿龍美食記
      2026-02-21 09:17:21
      貝加爾湖墜車事件:活下來的江蘇爸爸,往后的每一天都是煎熬

      貝加爾湖墜車事件:活下來的江蘇爸爸,往后的每一天都是煎熬

      社會日日鮮
      2026-02-23 14:05:41
      李連杰為《鏢人》孫藝洲叫屈:這哥們慘,整部戲演完了都沒露臉

      李連杰為《鏢人》孫藝洲叫屈:這哥們慘,整部戲演完了都沒露臉

      大鐵貓娛樂
      2026-02-22 18:15:03
      64歲香港知名男星近況曝光!暴瘦臉頰凹陷,頸紋明顯,引網友擔憂

      64歲香港知名男星近況曝光!暴瘦臉頰凹陷,頸紋明顯,引網友擔憂

      深圳晚報
      2026-02-23 21:57:26
      華為確實是出現了嚴重的問題,只是至今官方還沒有公開承認

      華為確實是出現了嚴重的問題,只是至今官方還沒有公開承認

      雪中風車
      2026-02-22 20:18:26
      挪威僅565萬人為何冬奧18金霸榜? 澳媒:他們不搞體育特種兵體制

      挪威僅565萬人為何冬奧18金霸榜? 澳媒:他們不搞體育特種兵體制

      勁爆體壇
      2026-02-23 12:02:06
      最讓大齡剩女崩潰的是什么?網友:為啥我一個單身狗看的津津有味

      最讓大齡剩女崩潰的是什么?網友:為啥我一個單身狗看的津津有味

      帶你感受人間冷暖
      2026-02-22 16:13:39
      奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

      奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

      品牌營銷報
      2026-02-23 11:31:10
      谷愛凌發布會落淚:剛得知外婆去世,我向她保證過會勇敢

      谷愛凌發布會落淚:剛得知外婆去世,我向她保證過會勇敢

      澎湃新聞
      2026-02-22 23:24:28
      烏克蘭無人機侵襲莫斯科空域致航班大面積延誤,多位中國游客滯留莫斯科機場10小時,有乘客稱趕著回國上班,延誤航班正陸續起飛

      烏克蘭無人機侵襲莫斯科空域致航班大面積延誤,多位中國游客滯留莫斯科機場10小時,有乘客稱趕著回國上班,延誤航班正陸續起飛

      極目新聞
      2026-02-23 12:06:50
      東北姑娘遠嫁上海沒回娘家過年,媽媽寄了120個“單間餃子”:防止餃子會坨,四個一袋餃子之間用繩子系上;網友:媽媽的愛無聲卻震耳欲聾

      東北姑娘遠嫁上海沒回娘家過年,媽媽寄了120個“單間餃子”:防止餃子會坨,四個一袋餃子之間用繩子系上;網友:媽媽的愛無聲卻震耳欲聾

      極目新聞
      2026-02-23 13:41:59
      戰斗民族至暗時刻:撒錢求人帶飛機來飛,奈何全球航司無人敢應!

      戰斗民族至暗時刻:撒錢求人帶飛機來飛,奈何全球航司無人敢應!

      民航觀點匯
      2026-02-22 10:00:13
      恭喜持股過節的朋友

      恭喜持股過節的朋友

      債市邦
      2026-02-23 18:54:01
      中國第一監獄:關的幾乎全是高官,為防止泄密,牢房內有特殊布置

      中國第一監獄:關的幾乎全是高官,為防止泄密,牢房內有特殊布置

      瓦倫西亞月亮
      2026-02-20 17:37:18
      張本遭世排37逼入絕境!又暫停又換衣整活兒 逆轉后又模仿樊振東

      張本遭世排37逼入絕境!又暫停又換衣整活兒 逆轉后又模仿樊振東

      顏小白的籃球夢
      2026-02-23 15:37:23
      上海高速,司機突然四肢癱軟,120因擁堵無法抵達

      上海高速,司機突然四肢癱軟,120因擁堵無法抵達

      看看新聞Knews
      2026-02-23 19:44:06
      關于政治最深度最精辟的解釋

      關于政治最深度最精辟的解釋

      深度報
      2026-02-22 22:47:30
      媽祖巡游換童后續:多人證實10歲女童無辜,17歲媽祖女孩吃相難看

      媽祖巡游換童后續:多人證實10歲女童無辜,17歲媽祖女孩吃相難看

      古希臘掌管松餅的神
      2026-02-23 17:20:21
      這就是赤裸裸的現實!部分央國企副職領導已經管不住下屬了!

      這就是赤裸裸的現實!部分央國企副職領導已經管不住下屬了!

      時尚的弄潮
      2026-02-22 00:18:07
      2026-02-23 22:15:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11246文章數 116976關注度
      往期回顧 全部

      數碼要聞

      Pico攜“Project Swan”XR頭顯亮相GDC大會!

      頭條要聞

      德國總理默茨周三訪華:將訪兩市 30位企業家或隨行

      頭條要聞

      德國總理默茨周三訪華:將訪兩市 30位企業家或隨行

      體育要聞

      哈登版騎士首敗:雷霆的冠軍課

      娛樂要聞

      那藝娜賬號被禁止關注,視頻已清空!

      財經要聞

      美國海關將停止征收被裁定違法的關稅

      科技要聞

      智譜、MiniMax合計蒸發近千億市值,為何?

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      本地
      親子
      藝術
      手機
      公開課

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      親子要聞

      春季長高黃金期,孩子踢被子隱患大!

      藝術要聞

      十大名家畫春,送給春天的你!

      手機要聞

      榮耀Magic V6電池容量揭曉,北斗版超常規版!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版