<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Gemini 3.1:小小小小更新壓過對手大迭代,Google卷飛了

      0
      分享至


      作者 | 王兆洋和他的 Kimi 2.5 Agent集群
      郵箱 | wangzhaoyang@pingwest.com

      1

      Gemini 3.1 來了

      2026年2月19日,Google發(fā)布Gemini 3.1 Pro。這是Google首次以".1"作為版本增量發(fā)布Gemini模型——此前的版本迭代均為0.5遞進(1.0→1.5→2.0→2.5→3.0)。

      Google將此次更新定位為"核心推理能力的進步"(a step forward in core reasoning),其技術基礎是上周Gemini 3 Deep Think更新中引入的"核心智能"(core intelligence)架構。

      在兩項關鍵基準測試中,Gemini 3.1 Pro呈現(xiàn)顯著性能提升。ARC-AGI-2測試得分77.1%,較Gemini 3 Pro的31.1%提升超過一倍。在Humanity's Last Exam測試中,Gemini 3.1 Pro得分44.4%,高于Gemini 3 Pro的37.5%和GPT-5.2的34.5%。


      Artificial Analysis獨立評測顯示:整體智能維度Gemini 3.1 Pro以57分居首,Claude Opus 4.6以53分位列第二;編碼能力Gemini 3.1 Pro以56分排名第一;Agentic任務方面Claude Opus 4.6以68分領先,Gemini 3.1 Pro為59分。


      訪問渠道已同步開放。開發(fā)者可通過Gemini API、Google AI Studio、Gemini CLI、Google Antigravity及Android Studio(預覽版)調用;企業(yè)用戶可使用Vertex AI和Gemini Enterprise;普通消費者可在Gemini App和NotebookLM中使用,其中Pro和Ultra訂閱用戶享有更高額度。

      此次更新最“嚇人”的地方是,Google一個“超級小”版本的迭代,達到了其他家模型大迭代的效果。

      當然版本號隨便定,但這個信號背后,Google這樣處理版號策略的調整——從0.5增量改為0.1增量——直接意味著Google將加快模型迭代節(jié)奏,以更細粒度的方式推送能力改進。

      也就是,此前一段時間多少還比較淡定的Google,也要開卷了!

      1

      官方給出的驚艷案例:更智能,更美,更全面

      在官方發(fā)布的演示中,四個案例展示了Gemini 3.1 Pro的代碼生成能力。

      第一個案例是將文學風格轉化為網(wǎng)站設計。系統(tǒng)以《呼嘯山莊》為靈感,假設書中角色是一位風景攝影師,生成了一套完整的個人作品集網(wǎng)站。視覺上,網(wǎng)站采用了與小說氛圍相符的色調和排版,將文學意境直接映射為界面元素。

      第二個案例是3D椋鳥群飛模擬。用戶可以通過界面交互控制鳥群的運動方向,鳥群的飛行動態(tài)會實時生成對應的音景,聲音隨鳥群密度和運動狀態(tài)變化。這是一個將視覺、交互和音頻整合在一起的完整演示。

      第三個案例是國際空間站位置可視化。系統(tǒng)生成了一個HTML儀表盤,集成了第三方API獲取的實時數(shù)據(jù),在地圖上顯示空間站的當前位置和運行軌跡。這展示了模型處理外部數(shù)據(jù)接口的能力。

      第四個案例是動畫SVG生成。模型直接輸出了可在網(wǎng)頁中使用的動畫SVG文件,這種矢量格式可以任意縮放而不損失畫質,適合需要響應式設計的項目。

      這些案例的共同特點是:它們都是完整的、可直接運行的代碼產(chǎn)物,而非片段或偽代碼。從文學作品到交互模擬,從數(shù)據(jù)可視化到圖形生成,覆蓋了不同的應用場景。模型在這些任務中的表現(xiàn)如何,讀者可以自行判斷。

      Gemini 3.1 Pro的技術迭代,體現(xiàn)了一條務實的路徑:在顛覆式重構不太會經(jīng)常出現(xiàn)后,要追求對現(xiàn)有架構的精細化打磨。



      架構層面延續(xù)了MoE(混合專家)路線,100萬token的上下文窗口和64,000 token的輸出上限維持不變。這個規(guī)模在當前的模型梯隊中仍屬頭部,足以支撐長文檔分析、代碼庫理解等場景。真正值得關注的,是推理機制的重構。

      三層思考模式(Low/Medium/High)的引入,本質上是對"計算-質量-成本"三角關系的顯式化管理。Low模式追求響應速度,適合高并發(fā)場景;High模式則調用完整推理能力,處理復雜問題可能需要數(shù)分鐘——這種設計讓用戶能夠根據(jù)任務難度主動權衡成本,而非被動接受統(tǒng)一計價。Medium層級的加入填補了此前的空白,為日常任務提供了更經(jīng)濟的中間選項。

      同時,Deep Think技術也出現(xiàn)了“下放”,上周Gemini 3 Deep Think在ARC-AGI-2測試中取得84.6%成績所依賴的"并行思考技術",已被整合進基礎模型。這意味著模型能夠同時探索多條解題路徑,再通過內部評估篩選最優(yōu)解。與此同時,原本用于Flash模型的強化學習技術也被遷移至Pro版本,這種技術棧的橫向打通,比單純的參數(shù)堆疊更有價值。

      幻覺控制方面的進步也很關鍵。AA-Omniscience Index從13分躍升至30分,在主流模型中排名第一。這一指標衡量的是模型對自身知識邊界的認知能力——知道"不知道什么",比知道"知道什么"更難,也更重要。

      總體而言,Gemini 3.1 Pro的升級邏輯清晰:不追求單項指標的驚艷,而是在可控成本下,系統(tǒng)性地提升模型的可用性和可靠性。

      1

      榜單之外,更重要是Google也開始卷了

      Gemini 3.1 Pro發(fā)布后,技術社區(qū)的聲音呈現(xiàn)出明顯的分化。

      樂觀派將目光投向了數(shù)據(jù)。ARC-AGI-2基準77.1%的得分被視為實質性突破——這不僅是上一代31.1%的兩倍以上,也意味著模型在處理全新邏輯模式時的能力躍升。

      幻覺抗性指標(AA-Omniscience Index)從Gemini 3 Pro的13躍升至30,遠超Claude Opus 4.6的11,這一進步被開發(fā)者群體頻繁提及。三層思考模式的設計也受到好評——讓用戶根據(jù)任務復雜度自主選擇"快速/深度/深度+"模式,被認為是對控制權的合理讓渡。

      但質疑聲同樣值得傾聽。Gartner分析師William McKeon-White的評價代表了一種審慎態(tài)度:"這是好的持續(xù)進步,但沒有什么根本性的游戲規(guī)則改變者。"華盛頓大學教授Chirag Shah則提出了更深層的問題:更好的推理能力確實是處理復雜任務的必要條件,但并非充分條件——"更何況,'復雜'本身的定義就不明確。"LMArena的盲測數(shù)據(jù)也提供了另一種視角:3.1 Pro相比Gemini 3 Pro的提升幅度有限,在擴展文本和代碼任務上仍落后于Claude。

      中立觀察者更關注宏觀趨勢。AI模型排行榜被形容為"搶椅子游戲"——Claude、Gemini、GPT輪流登頂,每次領先周期只有數(shù)周。發(fā)布節(jié)奏的密集同樣引人注目:Anthropic Sonnet 4.6于2月17日發(fā)布,Google Gemini 3.1 Pro緊隨其后于2月19日登場。一個被反復提及的觀察是:基準分數(shù)與真實用戶體驗之間存在落差,排行榜上的領先不等于實際工作流中的優(yōu)勢。

      其實,相比于在榜單上幾個小數(shù)點的提升,更重要的是Google自己策略的更加激進化。

      Gemini 3.1 Pro的發(fā)布,首先標志著Google產(chǎn)品策略的微妙轉向。首次采用".1"版本號,意味著從過去追求"大版本震撼"的發(fā)布節(jié)奏,轉向更貼近工程實際的持續(xù)迭代模式。

      這種轉變本身說明:AI競賽已進入長跑階段,單次爆發(fā)的窗口期正在收窄。在高端推理市場,Google終于拿出了與GPT-5.2和Claude正面交鋒的產(chǎn)品,而其真正的護城河或許不在于模型本身,而在于Cloud和Workspace構成的企業(yè)基礎設施——這是OpenAI和Anthropic短期內難以復制的。

      從行業(yè)視角看,推理能力正在成為模型競爭的新高地。Gemini 3.1 Pro與Anthropic的發(fā)布時間間隔僅兩天,這種以天為單位的跟進速度,反映出頭部廠商的技術差距正在收窄。更具信號意義的是定價策略:最高性能模型的價格反而更低,這意味著價格戰(zhàn)已從"性價比競爭"升級為"性能溢價消失"的新階段。

      Gemini 3.1 Pro定價為$4.50/百萬token(混合價格),低于GPT-5.2的$4.80、Claude Sonnet 4.6的$6和Claude Opus 4.6的$10。API定價分檔:≤200K tokens時輸入$2、輸出$12;>200K tokens時輸入$4、輸出$18。

      免費用戶可直接在Gemini Web UI使用Gemini 3.1 Pro,無需訂閱Gemini Advanced。


      點個愛心,再走 吧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      很多人以為殉葬就是把活人關進地宮,門一關,他們只能哭喊著等死

      很多人以為殉葬就是把活人關進地宮,門一關,他們只能哭喊著等死

      忠于法紀
      2026-01-18 17:42:24
      一個令人驚訝的現(xiàn)象:今年過年同學聚會消失了

      一個令人驚訝的現(xiàn)象:今年過年同學聚會消失了

      新國學文化
      2026-02-19 18:58:25
      比恒大更慘?王健林3年還債6000億,如今再賣48座萬達廣場

      比恒大更慘?王健林3年還債6000億,如今再賣48座萬達廣場

      科學發(fā)掘
      2026-02-14 12:05:09
      全票通過!委內瑞拉歷史性大赦:27年政治恩怨,一朝和解

      全票通過!委內瑞拉歷史性大赦:27年政治恩怨,一朝和解

      老馬拉車莫少裝
      2026-02-20 15:13:49
      錢再多也沒用,林子祥葉倩文如今現(xiàn)狀,給“老少戀”夫妻提了個醒

      錢再多也沒用,林子祥葉倩文如今現(xiàn)狀,給“老少戀”夫妻提了個醒

      查爾菲的筆記
      2026-01-24 20:06:02
      美全國州長協(xié)會宣布退出白宮會議

      美全國州長協(xié)會宣布退出白宮會議

      財聯(lián)社
      2026-02-20 13:24:09
      恭喜俄羅斯和烏克蘭,打了3年,終于打成了全世界都喜歡的樣子!

      恭喜俄羅斯和烏克蘭,打了3年,終于打成了全世界都喜歡的樣子!

      來科點譜
      2026-02-18 07:14:39
      手氣爆棚!河南52歲男子打麻將連續(xù)自摸胡牌,興奮過度,突然栽倒牌桌,送醫(yī)時血壓飆升至201/115mmHg

      手氣爆棚!河南52歲男子打麻將連續(xù)自摸胡牌,興奮過度,突然栽倒牌桌,送醫(yī)時血壓飆升至201/115mmHg

      芒果都市
      2026-02-20 16:07:55
      報復一個人最狠的方法,不是翻臉,不是打壓,而是佛家三句話

      報復一個人最狠的方法,不是翻臉,不是打壓,而是佛家三句話

      瓜哥的動物日記
      2026-02-14 00:59:40
      楊紫告別白菊長文,楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

      楊紫告別白菊長文,楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

      鄉(xiāng)野小珥
      2026-02-21 19:38:37
      表面德藝雙馨,實則德不配位,這四位老藝術家翻車沒一個值得同情

      表面德藝雙馨,實則德不配位,這四位老藝術家翻車沒一個值得同情

      小熊侃史
      2026-02-11 12:58:47
      意大利知名地標“愛情拱門”突然崩塌,永久消失,當?shù)厥虚L:曾有成千上萬的情侶來打卡,旅游業(yè)遭“毀滅性打擊”

      意大利知名地標“愛情拱門”突然崩塌,永久消失,當?shù)厥虚L:曾有成千上萬的情侶來打卡,旅游業(yè)遭“毀滅性打擊”

      大風新聞
      2026-02-17 19:26:03
      攻防兩端都被掘金各種打爆,開拓者鋒線大將突然打出了災難級表現(xiàn)

      攻防兩端都被掘金各種打爆,開拓者鋒線大將突然打出了災難級表現(xiàn)

      稻谷與小麥
      2026-02-22 01:48:03
      中俄關系拉響警報?俄方扣下中國集裝箱,里面的東西驚動了莫斯科

      中俄關系拉響警報?俄方扣下中國集裝箱,里面的東西驚動了莫斯科

      文史達觀
      2024-06-30 14:16:07
      王濛表態(tài):只要祖國需要,我隨時到場,敢簽保2塊金牌的生死狀

      王濛表態(tài):只要祖國需要,我隨時到場,敢簽保2塊金牌的生死狀

      風過鄉(xiāng)
      2026-02-21 09:09:53
      俄羅斯政府已批準與中國共同建設外貝加爾斯克至滿洲里鐵路段的項目

      俄羅斯政府已批準與中國共同建設外貝加爾斯克至滿洲里鐵路段的項目

      俄羅斯衛(wèi)星通訊社
      2026-02-21 16:09:30
      印度不裝了!當中國武統(tǒng)臺灣時,印度不僅要奪取西藏還要吞噬新疆

      印度不裝了!當中國武統(tǒng)臺灣時,印度不僅要奪取西藏還要吞噬新疆

      開著車去流浪
      2026-02-12 05:35:21
      大年初六,老人說:“初六5不吃,一年不受窮”,5不吃指啥?

      大年初六,老人說:“初六5不吃,一年不受窮”,5不吃指啥?

      阿龍美食記
      2026-02-21 20:43:14
      賽季雙殺!科莫自1951年以來首次在意甲客場擊敗尤文

      賽季雙殺!科莫自1951年以來首次在意甲客場擊敗尤文

      懂球帝
      2026-02-22 00:09:23
      香港導演怒噴《夜王》上映場次多:霸王排片,說好的港片共贏呢?

      香港導演怒噴《夜王》上映場次多:霸王排片,說好的港片共贏呢?

      陌識
      2026-02-21 15:50:01
      2026-02-22 03:04:49
      硅星人 incentive-icons
      硅星人
      硅(Si)是創(chuàng)造未來的基礎,歡迎來到這個星球。
      2877文章數(shù) 10438關注度
      往期回顧 全部

      數(shù)碼要聞

      Only Apple Can Do?蘋果23年前發(fā)布的iBook竟還能聯(lián)網(wǎng)更新

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個吉祥物

      娛樂要聞

      黃曉明澳門賭博輸十幾億 本人親自回應

      財經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      游戲
      本地
      數(shù)碼
      房產(chǎn)
      公開課

      卡婊總算玩明白了,《安魂曲》雙主角盤活生化30周年

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      數(shù)碼要聞

      物理銷毀SSD:結果根本沒貫穿PCB!直接就扔到垃圾桶了

      房產(chǎn)要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版