<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Gemini 3 Flash 倒反天罡了:關鍵性能居然超過了 Pro!

      0
      分享至


      作者 | 周一笑
      郵箱 | zhouyixiao@pingwest.com

      12 月 17 日,Google 正式發布 Gemini 3 Flash。一個定價只有 Claude 1/5、GPT 1/4 的“輕量模型”,在編碼上超過 Claude Sonnet 4.5,在推理和多模態上全面碾壓,和 GPT-5.2 也互有勝負。


      MMMU-Pro,多模態的評估效果:


      更夸張的是,它甚至超過了自家旗艦:在 SWE-bench 上,Gemini 3 Flash 78%,Gemini 3 Pro 76.2%,這也是 Flash 系列誕生以來超過同代 Pro 模型的第一次。


      數據可能還是有點抽象,直接看它能干什么:

      Gemini 3 Flash 單次生成完整動畫 3D 程序化房間


      用Gemini 3 Flash 一句話生成可玩游戲


      Resemble AI 用Gemini 3 Flash 實時分析 deepfake 視頻:他們的產品需要把復雜的音視頻取證數據即時轉化為普通人能理解的分析結果。在測試中,他們發現 3 Flash 的多模態分析速度比 2.5 Pro 快了 4 倍,能夠在不拖慢關鍵工作流的情況下處理原始的技術輸出數據

      一個月前,Gemini 3 Pro 和 Deep Think 的發布讓 Google 重新站回 AI 第一梯隊,Gemini 3 Pro 登頂 LMArena,Deep Think 在 ARC-AGI 上打出其他模型三倍的成績。發布以來,Gemini API 日均處理量突破 1 萬億 tokens。現在,Flash 的到來補齊了 Gemini 3 家族的最后一塊拼圖。

      但這次的 Gemini 3 Flash 和以往不一樣。過去我們對 Flash 的認知很清晰,快、便宜、但能力打折。想要速度,就得接受智能上的妥協。然而Gemini 3 Flash 打破了這個慣例,它用輕量模型的價格,打出了旗艦級的能力。

      1

      1/5 的價格,憑什么打旗艦?

      先說和其他家的對比。

      在博士級科學推理基準 GPQA Diamond 上,Gemini 3 Flash 拿到 90.4%,大幅領先 Claude Sonnet 4.5 的 83.4%,接近 GPT-5.2 的 92.4%。在多模態理解基準 MMMU-Pro 上,Flash 81.2%,超過 GPT-5.2 的 79.5%,更是甩開 Claude Sonnet 4.5 十幾個百分點。

      在人類最后考試 Humanity's Last Exam 上(無工具),Gemini 3 Flash 33.7%,Claude Sonnet 4.5 只有 13.7%——差距接近 20 個百分點。


      編碼能力同樣亮眼。在 SWE-bench Verified 上,Gemini 3 Flash 78%,超過了 Claude Sonnet 4.5 的 77.2%,頭一次超過了自家 3 Pro 的 76.2%。

      把價格因素放進來看就更夸張了,Flash 的價格大約是 Claude 的 1/5、GPT 的 1/4,但在多項指標上打平甚至領先。 如果說以前選 Flash 是快、省錢但有所妥協,現在選 Flash 是省錢還省心。

      么一個問題自然出現,Gemini 3 Pro 還有什么用?

      極限推理場景。GPQA Diamond 上 Pro 91.9% vs Flash 90.4%,Humanity's Last Exam 上 Pro 37.5% vs Flash 33.7%,加上只有Gemini 3 Pro才有的 Deep Think 模式。Pro 適合極限推理,Flash 適合高頻 agent 任務,這是 Google 給出的新分工。

      但對大多數場景來說,Flash 不僅夠用,而且性價比炸裂。

      效率層面同樣顯著。根據 Artificial Analysis 測試,Gemini 3 Flash 比 2.5 Pro 快 3 倍,處理日常任務平均節省 30% token 消耗。定價方面,輸入 $0.50/百萬 tokens,輸出 $3/百萬 tokens,只有 3 Pro 的四分之一。


      Gemini 3 Flash 在性能、成本與速度的權衡關系上推進了最優邊界

      Google 的官方說法是:“速度和規模,不必以犧牲智能為代價。” 放在以前的 Flash 上可能是句口號,但這次數據確實撐得起來。

      1

      免費用戶,旗艦體驗

      Gemini 3 Flash 的發布不只是 API 層面的事,它會直接改變普通用戶的日常體驗。

      在 Gemini App 里,Gemini 3 Flash 會替代原來的 2.5 Flash,成為新的默認模型。這意味全球所有的 Gemini 用戶,包括免費用戶,都將自動升級到 Gemini 3 級別的體驗,不需要付費,不需要做任何設置。

      升級后的 App 會提供三種模式供用戶選擇:

      • Fast(極速):默認由Gemini 3 Flash 驅動,秒回日常問題。

      • Thinking(思考):同樣由 Flash 3 驅動,但激活了它的“深度思考”能力,專門處理復雜邏輯。

      • Pro(專業):繼續保留 Gemini 3 Pro,作為處理高難度數學和代碼問題的首選。

      在 Google Search 里,AI Mode 的默認模型也會在全球范圍內升級到 3 Flash。Google 表示,得益于 3 Flash 強大的推理和多模態能力,AI Mode 現在能更精準地理解用戶意圖,處理更復雜、更有多重約束條件的問題,同時生成結構清晰、易于消化的回答。

      對于美國用戶,Google 還開放了更多選項,可以在 AI Mode 里選擇"Thinking with 3 Pro"來獲得更深度的幫助,圖像生成模型 Nano Banana Pro 也向更多美國用戶開放了。

      對于普通用戶來說,這可能是感知最明顯的一次升級。你打開 Gemini,它已經是前沿級別的模型了;你在 Google 搜索里問復雜問題,背后跑的是一個融入了頂級大模型能力的引擎。換句話說,免費用戶現在用的默認模型,能力已經不輸其他家的付費旗艦。

      1

      開發者:省錢還賺到

      以前做 agentic 應用,想用旗艦級模型就得付旗艦級價格。Gemini 3 Flash 改變了這個局面。

      過去開發者面臨一個兩難選擇,要么用快但笨的小模型,犧牲任務完成質量;要么用聰明但慢且貴的大模型,面對延遲和成本的雙重壓力。尤其是在需要多輪調用、高頻迭代的 agent 場景里,這個取舍幾乎是綁死的。Gemini 3 Flash 提供了一個新選項,足夠快、足夠聰明、成本可控。在 SWE-bench 上 78% 的成績說明它完全有能力處理復雜的編碼任務,同時 3 倍于 2.5 Pro 的速度讓它能勝任對延遲敏感的實時場景,而 1/5 于競品的價格讓大規模部署成為可能。

      目前,Gemini 3 Flash 已經在以下平臺上線(preview):

      • Google AI Studio 和 Gemini API

      • Gemini CLI

      • Android Studio

      • Vertex AI(面向企業)

      • Google Antigravity:這是 Google 新推出的 agentic 開發平臺,專門為 AI 主導的軟件開發流程設計,讓 AI Agent 可以直接操作編輯器、終端和瀏覽器

      在高頻調用場景,Google 還提供了配套的成本優化方案。Context Caching 功能可以在重復 token 使用達到一定閾值時降低 90% 的成本;Batch API 支持異步批量處理,成本可以再降 50%,同時提供更高的調用配額。對那些需要在生產環境里大規模跑 agent 任務的團隊,這套組合拳相當有吸引力。

      1

      Flash 的含義變了

      Gemini 3 Flash 的發布,某種程度上重新定義了“Flash”這個品類的含義。

      Flash,終于不只是快速和效率了。

      過去,Flash 或者說輕量級模型的定位非常明確:用能力換取速度和成本優勢。你選擇 Flash,就意味著接受它在智能上的折扣。但 Gemini 3 Flash 證明了另一種可能,當底層的基礎模型足夠強大時,輕量版本不一定要做太多能力閹割,它可以只是“更高效的滿配版”。

      Google 在博客里提到,Gemini 3 Flash 的核心模型能力已經強到一個程度:在很多任務上,關掉思考模式的 3 Flash,比開著思考模式的 2.5 版本表現還好。 以前你需要犧牲速度來換準確,現在不用了。

      這次發布也讓 Gemini 3 家族陣容正式成型:Gemini 3 Pro、Gemini 3 Deep Think、Gemini 3 Flash 三個版本,覆蓋了從輕度用戶到硬核開發者的完整需求譜系。想要極致推理深度,用 Deep Think;想要最強綜合能力,用 Pro;想要又快又好還便宜,用 Flash。各取所需,不再是單選題。

      從數據來看,Google 在 AI 產品化這條路上跑得相當穩。Gemini App 的月活已經突破 6.5 億,開發者數量達到 1300 萬,API 調用量同比增長 3 倍。上季度到這季度,用戶數從 4.5 億猛增到 6.5 億。

      目前,普通用戶可以直接在 Gemini App 和 Google Search 的 AI Mode 中體驗新模型;開發者可以通過 Google AI Studio 和 Gemini API 開始構建應用。

      當 Google 用 Flash 模型 1/5 的價格打出旗艦級能力,Flash 這個品類的想象空間被徹底打開了。


      點個愛心,再走 吧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普通告全球,稱美國將替代聯合國,認為中方在臺海虛張聲勢

      特朗普通告全球,稱美國將替代聯合國,認為中方在臺海虛張聲勢

      掉了顆大白兔糖
      2025-12-31 07:50:55
      穩中求進每月看|決勝收官奮力沖刺——12月全國各地經濟社會發展觀察

      穩中求進每月看|決勝收官奮力沖刺——12月全國各地經濟社會發展觀察

      新華社
      2025-12-30 20:41:50
      英超之夜:阿森納4-1維拉 曼聯1-1助狼隊終結12連敗 切爾西7輪1勝

      英超之夜:阿森納4-1維拉 曼聯1-1助狼隊終結12連敗 切爾西7輪1勝

      狍子歪解體壇
      2025-12-31 06:52:09
      開房發生5次性關系,男子被勒索4萬8,報警被抓才知女友只有13歲

      開房發生5次性關系,男子被勒索4萬8,報警被抓才知女友只有13歲

      胖胖侃咖
      2025-12-30 08:00:04
      越南政府:確保南北高鐵項目在2026年底前開工建設

      越南政府:確保南北高鐵項目在2026年底前開工建設

      界面新聞
      2025-12-30 16:58:11
      著名作曲家病逝!作品家喻戶曉,最后露面在家中,客廳又小又窄

      著名作曲家病逝!作品家喻戶曉,最后露面在家中,客廳又小又窄

      李健政觀察
      2025-12-30 09:18:34
      學生偷拍并舉報課堂內容,教師被解雇,教授坦言:“我開始害怕我的學生”

      學生偷拍并舉報課堂內容,教師被解雇,教授坦言:“我開始害怕我的學生”

      化學人生
      2025-12-30 21:03:29
      解放軍繞臺軍演,特朗普淡淡表態:不擔心

      解放軍繞臺軍演,特朗普淡淡表態:不擔心

      揚子晚報
      2025-12-30 11:02:10
      中方反制不到24小時,美國務院宣布反對,甩出三句話簡直不可理喻

      中方反制不到24小時,美國務院宣布反對,甩出三句話簡直不可理喻

      楊門灼見
      2025-12-31 09:55:20
      皮蛋再次成為關注對象!張文宏發現:常吃皮蛋的人有5大變化

      皮蛋再次成為關注對象!張文宏發現:常吃皮蛋的人有5大變化

      普陀動物世界
      2025-12-29 08:52:33
      還原王博沖冠一怒!周琦耍小伎倆成功,中國頭號新銳裁判遭怒噴

      還原王博沖冠一怒!周琦耍小伎倆成功,中國頭號新銳裁判遭怒噴

      體壇野秀才
      2025-12-30 23:42:42
      中國古代單日陣亡最高的戰役:香積寺互砍,4個時辰11萬人陣亡!

      中國古代單日陣亡最高的戰役:香積寺互砍,4個時辰11萬人陣亡!

      小豫講故事
      2025-12-29 06:00:03
      廣東強援傷勢曝光,杜鋒松了一口氣,下一場對陣北京男籃責任巨大

      廣東強援傷勢曝光,杜鋒松了一口氣,下一場對陣北京男籃責任巨大

      萌蘭聊個球
      2025-12-31 08:27:43
      殷秀梅:遺憾沒生孩子,一心培養弟弟,替弟弟養女兒值嗎?

      殷秀梅:遺憾沒生孩子,一心培養弟弟,替弟弟養女兒值嗎?

      細品名人
      2025-12-11 07:16:50
      確認膝蓋受傷!約基奇檢查結果公布!恐無緣常規賽MVP

      確認膝蓋受傷!約基奇檢查結果公布!恐無緣常規賽MVP

      籃球教學論壇
      2025-12-31 08:00:35
      災難級表現!紐卡世界級球星全場夢游 名宿怒批:毫無斗志

      災難級表現!紐卡世界級球星全場夢游 名宿怒批:毫無斗志

      瀾歸序
      2025-12-31 08:13:09
      3-0!非洲杯頭號奪冠熱門誕生:20場比賽獲18勝2平!改寫68年歷史

      3-0!非洲杯頭號奪冠熱門誕生:20場比賽獲18勝2平!改寫68年歷史

      球場沒跑道
      2025-12-30 10:07:25
      山東最“難嫁”姑娘:顏值驚呆媒人,相親桌成小伙“勸退”現場!

      山東最“難嫁”姑娘:顏值驚呆媒人,相親桌成小伙“勸退”現場!

      記錄生活日常阿蜴
      2025-12-31 05:42:04
      詹姆斯41歲生日當天,湖人隊新秀阿杜·蒂耶羅為他演唱生日歌

      詹姆斯41歲生日當天,湖人隊新秀阿杜·蒂耶羅為他演唱生日歌

      好火子
      2025-12-31 08:26:46
      “福州長樂機場第二高速項目致5死”高墜事故調查報告公布

      “福州長樂機場第二高速項目致5死”高墜事故調查報告公布

      澎湃新聞
      2025-12-30 17:04:27
      2025-12-31 10:39:00
      硅星人 incentive-icons
      硅星人
      硅(Si)是創造未來的基礎,歡迎來到這個星球。
      2758文章數 10424關注度
      往期回顧 全部

      數碼要聞

      2025年度數碼好物大賞【年度評選】

      頭條要聞

      70后飛行員翻臉將22歲情人告上法庭 讓其歸還700多萬

      頭條要聞

      70后飛行員翻臉將22歲情人告上法庭 讓其歸還700多萬

      體育要聞

      聯盟第一人倒下了!掘金還有底牌嗎?

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      科技要聞

      老羅,演砸了,也封神了?

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      房產
      手機
      數碼
      旅游
      公開課

      房產要聞

      瘋了!2025海南拿地榜巨變:榜首狂砸80億,民企火力全開!

      手機要聞

      三星Galaxy S26 Ultra手機機模曝光:圓角邊框、藥丸狀相機凸起

      數碼要聞

      華為FreeClip一代耳夾耳機獲HarmonyOS 6.0.0.296更新

      旅游要聞

      西盟佤山 云海翻涌如詩如畫

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 丝袜?亚洲?另类?国产?另类| 国产精品久久久久久人妻精品| 久久精品熟妇丰满人妻99| 国产免费午夜福利在线播放| 九九成人精品| 万全县| 日日操夜夜| 3P无码| 人妻口爆| 欧美肥妇多毛bbw| 四川少妇大战4黑人| 人妻熟女欲求不满在线 | 左云县| 精品人妻中文无码| 色窝AV| 亚洲熟女综合色一区二区三区| 午夜性刺激在线观看| 国产精品人妻系列21p| 国产精品人妻一区二区高| 97亚洲色欲色欲综合网| 日韩不卡手机视频在线观看| 波多野结衣一区二区三区高清av| 国产精品人妻一区二区高 | 亚洲?无码?成人| 人妻中文网| 欧美音影成人在线一级片| 夜夜国自一区| 亚洲精品自拍| 搜索| 天天色欲网| 成人九九| 日本牲交大片免费观看| 亚洲无人区一区二区三区| 欧美性猛交xxxx黑人| 呼伦贝尔市| 巴楚县| www.91xxx| 国产黄片视频在线| 精品国产三级A∨在线| 国产永久免费高清在线观看| 婷婷在线视频|