<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Gemini 3.1 Pro低調(diào)上場:谷歌的“小版本更新”與AI競賽的“長跑邏輯”

      0
      分享至

        【CNMO】馬年春節(jié)的熱鬧勁兒還沒完全過去,國內(nèi)的大模型戰(zhàn)場正打得火熱,硅谷那邊也沒閑著。就在行業(yè)還在消化上周Gemini 3 Deep Think、Claude Sonnet 4.6等一系列密集更新時(shí),北京時(shí)間2月19日深夜,谷歌又毫無預(yù)兆地?cái)S出了一枚“核彈”——Gemini 3.1 Pro正式上線。



        對于關(guān)注AI動態(tài)的人來說,這個(gè)消息來得既突然,又在情理之中。畢竟,距離去年11月Gemini 3 Pro發(fā)布才剛過三個(gè)月。但真正耐人尋味的,不是發(fā)布節(jié)奏的加快,而是谷歌這次打出的牌:一個(gè)“.1”的小版本迭代,卻實(shí)現(xiàn)了讓競爭對手大版本更新都汗顏的性能躍升。

      “.1”背后的野心:推理能力翻倍與“思考模式”的進(jìn)化

        Gemini 3.1 Pro的官方敘事非常聚焦:專為復(fù)雜任務(wù)而生,將機(jī)器的核心推理能力推向新高度。

        數(shù)據(jù)是最直觀的佐證。在衡量AI應(yīng)對全新邏輯問題能力的 ARC-AGI-2 基準(zhǔn)測試中,Gemini 3.1 Pro拿下了77.1% 的實(shí)測得分。這是什么概念?上一代Gemini 3 Pro的得分是31.1%。雖然業(yè)內(nèi)對于ARC-AGI測試集是否可能出現(xiàn)在訓(xùn)練數(shù)據(jù)中仍存有謹(jǐn)慎的討論,但超過一倍的增長,即便剔除“刷題”水分,其底層邏輯能力的精進(jìn)也是不容小覷的。

        另一個(gè)值得關(guān)注的維度是幻覺控制。在AA-Omniscience Index(衡量模型對自身知識邊界認(rèn)知能力的指標(biāo))上,Gemini 3.1 Pro從前代的13分躍升至30分,在主流模型中排名第一。這或許比單純的跑分更具現(xiàn)實(shí)意義——在大模型從“玩具”走向“工具”的過程中,知道“我不知道”往往比強(qiáng)行生成一個(gè)似是而非的答案更重要。

        如果說跑分只是紙上談兵,那么“三層思考模式”(Low/Medium/High)的引入,則是谷歌在工程落地層面的一次精妙設(shè)計(jì)。這相當(dāng)于給模型裝了一個(gè)可調(diào)節(jié)的“算力旋鈕”。

        過去的模型是“一勺燴”,簡單問答和復(fù)雜推理消耗的資源一樣,成本和效率都不經(jīng)濟(jì)。現(xiàn)在,用戶可以根據(jù)任務(wù)難度自主選擇:日常閑聊用Low模式追求極速響應(yīng);復(fù)雜的數(shù)據(jù)分析或代碼調(diào)試用High模式,讓模型進(jìn)入類似Deep Think的狀態(tài),花幾分鐘時(shí)間進(jìn)行深度推理。這種對“計(jì)算-質(zhì)量-成本”三角關(guān)系的顯式化管理,體現(xiàn)的正是AI進(jìn)入生產(chǎn)環(huán)境后的成熟度思維。

      不止于“手搓”Demo:從代碼生成到“氛圍編程”

        當(dāng)然,技術(shù)參數(shù)的進(jìn)步最終要回歸到用戶體驗(yàn)。這次谷歌及其合作方展示的一系列案例,比以往任何時(shí)候都更具“殺傷力”。

        最直觀的進(jìn)化體現(xiàn)在視覺生成上。同樣是生成“鵜鶘騎自行車”的SVG動畫,Gemini 3 Pro生成的結(jié)果可能只是元素的堆砌,而Gemini 3.1 Pro生成的畫面中,鵜鶘的身體結(jié)構(gòu)、騎行姿態(tài)不僅更符合物理常識,甚至連自行車的鏈條、腳踏這些細(xì)節(jié)都清晰可見。

        但這不僅僅是畫質(zhì)的提升,更是對復(fù)雜指令理解能力的躍遷。開發(fā)者們用實(shí)測證明了這一點(diǎn):

        有人讓Gemini 3.1 Pro生成一個(gè)Windows 11風(fēng)格的Web操作系統(tǒng),結(jié)果它直接返回了一個(gè)包含完整圖標(biāo)、開始菜單和基礎(chǔ)交互邏輯的可運(yùn)行界面,與之前3.0 Pro生成的簡陋形態(tài)形成鮮明對比。

        還有人要求它為《呼嘯山莊》設(shè)計(jì)一個(gè)現(xiàn)代風(fēng)格的個(gè)人作品集網(wǎng)站。模型不僅完成了代碼編寫,更令人驚嘆的是,它似乎“讀懂了”小說中那種陰郁、狂野的文學(xué)氛圍,并將其轉(zhuǎn)化為了網(wǎng)站的色彩、排版和整體視覺語言。這被一些開發(fā)者稱為“氛圍編程”的開始——模型不再只是執(zhí)行指令的工具,而是能理解意圖的創(chuàng)意伙伴。

        在更硬核的工程領(lǐng)域,Gemini 3.1 Pro也展示了其接入現(xiàn)實(shí)世界的能力。無論是直接接入公開遙測數(shù)據(jù)流,實(shí)時(shí)追蹤國際空間站軌道的儀表盤,還是可交互的3D椋鳥群飛模擬,都證明了它在處理復(fù)雜API、構(gòu)建完整應(yīng)用方面的成熟度。

      競賽進(jìn)入下半場:谷歌開始“卷”了,但卷的是“長跑”

        面對Gemini 3.1 Pro的發(fā)布,技術(shù)社區(qū)的評價(jià)呈現(xiàn)出有趣的分化。樂觀派看到了它在硬核基準(zhǔn)上的全面領(lǐng)先:在Artificial Analysis的綜合智能維度以57分居首,超越Claude Opus 4.6的53分;在科學(xué)知識測試GPQA Diamond上更是拿下94.3%的高分。

        但質(zhì)疑聲同樣存在。Gartner分析師William McKeon-White的評價(jià)代表了一種審慎態(tài)度:“這是好的持續(xù)進(jìn)步,但沒有什么根本性的游戲規(guī)則改變者。 ” 華盛頓大學(xué)教授Chirag Shah則進(jìn)一步指出,更好的推理能力是處理復(fù)雜任務(wù)的必要條件,但并非充分條件,更何況“復(fù)雜”本身就是一個(gè)模糊的定義。

        然而,如果我們跳出單純的性能對比,從行業(yè)戰(zhàn)略層面審視這次發(fā)布,會發(fā)現(xiàn)一個(gè)更值得關(guān)注的信號:谷歌的迭代策略開始變得空前激進(jìn)。

        這是谷歌首次在Gemini系列中使用“.1”作為版本增量。此前無論是從1.0到1.5,還是2.0到2.5,都是0.5的跨度?,F(xiàn)在改為0.1的細(xì)粒度更新,意味著谷歌放棄了過去追求“大版本震撼”的發(fā)布模式,轉(zhuǎn)向更貼近工程實(shí)際、更快速的持續(xù)迭代。

        這種轉(zhuǎn)變本身就說明了AI競賽的殘酷性:單次爆發(fā)的窗口期正在急劇收窄。 在Anthropic發(fā)布Sonnet 4.6僅兩天后,谷歌就攜3.1 Pro正面回?fù)?。頭部廠商的技術(shù)差距正在肉眼可見地縮小,大家拼的不再是誰能憋出“王炸”,而是誰能以更快的速度、更穩(wěn)的步伐進(jìn)行“長跑”。

        更耐人尋味的是定價(jià)。Gemini 3.1 Pro預(yù)覽版的API價(jià)格與上一代完全持平:輸入每百萬tokens 2美元起,輸出12美元起。這在一眾漲價(jià)的競品中顯得尤為突出。Artificial Analysis算了一筆賬:跑完其智能指數(shù)測試集,Gemini 3.1 Pro的花費(fèi)還不到Claude Opus 4.6的一半。

      當(dāng)最強(qiáng)的模型不再伴隨最高的溢價(jià),這意味著大模型行業(yè)的競爭已經(jīng)從“性能溢價(jià)”階段,進(jìn)入了“性能普惠”的新階段。

      結(jié)語:重新定義“王座”

        有人說Gemini 3.1 Pro是來“搶王座”的。但在我看來,在這樣一個(gè)每周都有新王登基的時(shí)代,“王座”本身的概念正在被消解。

        過去,我們習(xí)慣于用一兩個(gè)基準(zhǔn)測試的榜首來定義王者。但今天,當(dāng)谷歌用一個(gè)“.1”版本就實(shí)現(xiàn)了推理能力翻倍、幻覺率大幅下降,并將最強(qiáng)能力以最低價(jià)格推向市場時(shí),它傳遞的信息其實(shí)是:AI競賽的下一程,比的不是誰在領(lǐng)獎(jiǎng)臺上站得更高,而是誰能構(gòu)建一個(gè)讓開發(fā)者和企業(yè)真正愿意扎根的生態(tài)。

        Gemini 3.1 Pro或許不是一個(gè)顛覆性的“游戲規(guī)則改變者”,但它清晰地劃出了谷歌的賽道:憑借Google Cloud和Workspace構(gòu)成的企業(yè)基礎(chǔ)設(shè)施,以及對核心推理能力的持續(xù)打磨,谷歌正在向外界證明,它要做的是那個(gè)能滿足企業(yè)所有模型需求的“一站式商店”。

        AI的2026年,就這樣在硅谷的你追我趕中拉開了序幕。DeepSeek們何時(shí)會再次出場“殺死比賽”仍是未知數(shù),但可以確定的是,這場游戲的節(jié)奏,已經(jīng)快到讓所有人都必須屏住呼吸。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      朝鮮開九大,金正恩為什么戴上了前代像章?

      朝鮮開九大,金正恩為什么戴上了前代像章?

      IN朝鮮
      2026-02-22 16:06:41
      開心!朱芳雨杜鋒給球員發(fā)紅包,奎因、薩林杰樂開了花

      開心!朱芳雨杜鋒給球員發(fā)紅包,奎因、薩林杰樂開了花

      體育哲人
      2026-02-21 19:57:49
      一場2-2,上演補(bǔ)時(shí)絕平,德甲第2掉鏈子,被拜仁甩開,爭冠難了

      一場2-2,上演補(bǔ)時(shí)絕平,德甲第2掉鏈子,被拜仁甩開,爭冠難了

      足球狗說
      2026-02-22 03:37:25
      “中國人滾出蒙古!”為何外蒙古對中國人充滿敵意

      “中國人滾出蒙古!”為何外蒙古對中國人充滿敵意

      南權(quán)先生
      2025-09-16 10:02:18
      他是原副總理,1975年被永遠(yuǎn)開除黨籍,1979年當(dāng)選為副主席

      他是原副總理,1975年被永遠(yuǎn)開除黨籍,1979年當(dāng)選為副主席

      老范談史
      2026-02-13 08:38:33
      13歲“敦煌少女”驚艷全網(wǎng)!媽媽回應(yīng):一毛錢沒花,堅(jiān)決不炒作

      13歲“敦煌少女”驚艷全網(wǎng)!媽媽回應(yīng):一毛錢沒花,堅(jiān)決不炒作

      觀察鑒娛
      2026-02-15 19:57:21
      美國華人直言:中國手機(jī)掃碼支付是最不智能的發(fā)明!

      美國華人直言:中國手機(jī)掃碼支付是最不智能的發(fā)明!

      阿傖說事
      2026-01-20 12:53:01
      湯唯大學(xué)時(shí)期的照片,難怪當(dāng)年李安梁朝偉會選她當(dāng)女主角!

      湯唯大學(xué)時(shí)期的照片,難怪當(dāng)年李安梁朝偉會選她當(dāng)女主角!

      南方城市網(wǎng)
      2026-01-06 12:08:30
      沒人發(fā)拜年微信了,這是一個(gè)危險(xiǎn)的信號

      沒人發(fā)拜年微信了,這是一個(gè)危險(xiǎn)的信號

      茉莉聊聊天
      2026-02-18 10:48:40
      北京一教師被罰6728萬!

      北京一教師被罰6728萬!

      感覺會火
      2026-02-22 12:07:21
      曲婉婷疑似已經(jīng)回國,注冊的抖音賬號ip顯示在江蘇

      曲婉婷疑似已經(jīng)回國,注冊的抖音賬號ip顯示在江蘇

      映射生活的身影
      2026-02-22 11:57:19
      美伊大戰(zhàn)在即,美軍卻忽然撤出中東基地,美軍慫了還是在玩花樣?

      美伊大戰(zhàn)在即,美軍卻忽然撤出中東基地,美軍慫了還是在玩花樣?

      擊你的心靈深處
      2026-02-22 17:47:09
      特朗普態(tài)度大轉(zhuǎn)彎!美媒直言:想贏中國,只剩下一條路可走

      特朗普態(tài)度大轉(zhuǎn)彎!美媒直言:想贏中國,只剩下一條路可走

      不畏山海a
      2026-02-22 18:18:27
      活了30多年:才知道滾筒洗衣機(jī)的6個(gè)正確用法,難怪衣服洗不干凈

      活了30多年:才知道滾筒洗衣機(jī)的6個(gè)正確用法,難怪衣服洗不干凈

      裝修秀
      2026-02-17 10:45:03
      “見過最廉價(jià)的兜底”,家長讓兒子在購物車?yán)锍钥倦u,被全網(wǎng)嘲笑

      “見過最廉價(jià)的兜底”,家長讓兒子在購物車?yán)锍钥倦u,被全網(wǎng)嘲笑

      妍妍教育日記
      2026-02-13 16:34:42
      錢再多有什么用?52歲劉強(qiáng)東上千億身家,兒子卻是他一生的遺憾

      錢再多有什么用?52歲劉強(qiáng)東上千億身家,兒子卻是他一生的遺憾

      墨印齋
      2026-01-31 16:37:48
      關(guān)鍵裝備到位, 伊朗又中招! 美以談判拖延時(shí)間: 現(xiàn)在美軍準(zhǔn)備好了

      關(guān)鍵裝備到位, 伊朗又中招! 美以談判拖延時(shí)間: 現(xiàn)在美軍準(zhǔn)備好了

      星辰大海路上的種花家
      2026-02-22 16:48:01
      解密《驚蟄無聲》最大的意難平:睡了女特務(wù)為什么必須死

      解密《驚蟄無聲》最大的意難平:睡了女特務(wù)為什么必須死

      人格志
      2026-02-20 20:12:58
      第1變第3!中國隊(duì)?wèi)?zhàn)術(shù)失敗葬送金牌,冬奧會獎(jiǎng)牌榜更新:日本第10

      第1變第3!中國隊(duì)?wèi)?zhàn)術(shù)失敗葬送金牌,冬奧會獎(jiǎng)牌榜更新:日本第10

      侃球熊弟
      2026-02-21 19:38:36
      長沙“互啃”后續(xù):沒實(shí)錘,婚離了!中年人的體面,真輸不起!

      長沙“互啃”后續(xù):沒實(shí)錘,婚離了!中年人的體面,真輸不起!

      王楔曉
      2026-01-08 11:31:21
      2026-02-22 19:59:00
      CNMO科技 incentive-icons
      CNMO科技
      專業(yè)、有態(tài)度的手機(jī)門戶
      111957文章數(shù) 316223關(guān)注度
      往期回顧 全部

      數(shù)碼要聞

      Omdia數(shù)據(jù):三星電子2025Q4重奪全球DRAM內(nèi)存市占第一

      頭條要聞

      中國第五金 谷愛凌U型場地技巧決賽奪金李方慧摘銀

      頭條要聞

      中國第五金 谷愛凌U型場地技巧決賽奪金李方慧摘銀

      體育要聞

      自由式滑雪U型池 谷愛凌成功衛(wèi)冕

      娛樂要聞

      裴世矩養(yǎng)侄為刃 看懂兩次放行裴行儼!

      財(cái)經(jīng)要聞

      特朗普新加征關(guān)稅稅率從10%提升至15%

      科技要聞

      馬斯克:星艦每年將發(fā)射超過10000顆衛(wèi)星

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級電混2026年上市

      態(tài)度原創(chuàng)

      旅游
      家居
      游戲
      數(shù)碼
      公開課

      旅游要聞

      趁興漫游品年韻 樂山樂水度閑暇丨萬馬奔騰中國年·樂游

      家居要聞

      本真棲居 愛暖伴流年

      實(shí)體盤黃昏!玩家無奈:現(xiàn)在的PS5實(shí)體盤還有意義嗎

      數(shù)碼要聞

      小米17系列全球發(fā)布會定檔2月28日:多款生態(tài)新品同步登場

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版