網易首頁 > 網易科技 > IT業界 > 正文

谷歌凌晨炸場，Pro級智商只賣“白菜價”，OpenAI還怎么玩？

2025-12-18 10:58:09　來源: 網易科技報道

北京舉報

分享至

作者 | 小小

出品 | 網易科技

推理強、速度快、還省錢，谷歌這次真的“殺瘋了”。

就在旗艦模型Gemini 3 Pro發布僅一個月、死對頭GPT-5.2發布僅僅5天后，今天凌晨，谷歌祭出大殺器 Gemini 3 Flash。

大家驚訝地發現，這款新模型不講武德：不僅在GPQA（博士級推理）上拿到了90.4% 的高分，更以Pro級的推理智能，跑出了Flash級的逆天延遲。

谷歌CEO桑達爾·皮查伊（Sundar Pichai）高呼：“我們又回來了！” 他直言，新模型突破了性能和效率的帕累托極限——性能超越2.5 Pro，速度提升3倍，價格卻低得多。

這種“加量不加價”的暴力美學，試圖徹底改寫大模型市場的性價比規則。正如DeepMind創始人哈薩比斯所言：“這是目前市面上性價比最高的模型，沒有之一。”

一、帕累托邊界的極限跨越：它是怎么做到的？

（圖片由AI生成）

Gemini 3 Flash的核心邏輯簡單粗暴：保留Gemini 3 Pro級別的推理底色，同時注入Flash系列的極致響應速度。

Google DeepMind負責人杰夫·迪恩（Jeff Dean）指出，Gemini 3 Flash標志著以往僅在超大型模型中具備的推理能力，如今能以Flash級的延遲運行。

這種“小而強”的進化并非犧牲了智能，而是通過調節“思考程度”實現了質量與成本的平衡。 對于日常任務，它比2.5 Pro平均節省30%的Token使用量，但在準確率上反而更勝一籌。

DeepMind研究科學家阿里·伊斯拉米（Ali Eslami）也感慨道：“距Pro版發布僅29天，Flash版同樣智能，價格卻便宜4倍，速度快得多！”

二、硬核測評：屠榜級表現，Pro級靈魂

在AI圈，不跑分的測評都是耍流氓。Gemini 3 Flash在多個權威基準測試中展現了“屠榜”姿態：

· 博士級推理（GPQA Diamond）： 準確率達到90.4%，足以匹敵頂尖的前沿大模型。

· 多模態理解（MMMU Pro）： 獲得81.2% 的優異成績，與“大哥”Gemini 3 Pro持平。

· 編碼智能體（SWE-bench Verified）： 取得了78% 的驚人分數，不僅橫掃2.5全系列，甚至超越了剛剛發布不久的Gemini 3 Pro。

（圖片由AI生成）

獨立測評機構Artificial Analysis的預發布測試更是為這些數據注入了“現實感”：Gemini 3 Flash的原始吞吐量達到每秒218個輸出Token，顯著快于OpenAI GPT-5.1 high（125 Token/秒）。

（圖片由AI生成）

更令人振奮的是，該機構將其冠以AA-Omniscience知識基準測試的新領導者，其知識準確率達到了目前所有測試模型的巔峰。

盡管這種智能帶來了一定的“推理稅”（處理復雜索引時Token量比2.5 Flash多一倍），但谷歌通過極激進的定價策略（輸入Token 0.50美元/100萬，輸出Token 3美元/100萬）完美對沖了這一成本。

三、給復雜應用，裝上一顆“閃電大腦”

憑借在推理、工具調用及多模態維度的全線爆發，Gemini 3 Flash堪稱復雜視頻分析、海量數據提取與視覺問答（VQA）領域的全能型選手。

它不僅重塑了開發者對輕量化模型的認知，更讓那些既追求極致響應、又渴望深度推理的智能應用，從此告別了在速度與智商之間的兩難抉擇。

舉例來說，

· 在手部追蹤的彈球益智游戲中，Gemini 3 Flash展現了驚人的多模態推理速度，能夠毫秒級識別操作意圖并提供近乎實時的AI戰術輔助。

· 告別漫長等待： Gemini 3 Flash能夠近乎實時地構建并自動化執行加載動畫的A/B測試，極大地壓縮了從創意設計到生產環境代碼部署的轉化鏈路。

· 邏輯推理能力的下放： 僅憑一段簡單的自然語言提示，Gemini 3 Flash即可瞬間編寫出三種風格迥異的設計變體代碼，為開發者提供了極高的迭代效率。

· 依托深厚的多模態底座，Gemini 3 Flash通過圖像分析自動生成帶有上下文感知的UI覆蓋層字幕，一鍵將枯燥的靜態圖像轉化為可感知的交互式數字化體驗。

四、降本增效的終極殺招：思考層級與上下文緩存

為了讓企業更放心地投入預算，谷歌在Gemini 3 Flash中引入了精細的“思考層級”參數。開發者可以在“低”（簡單任務降延遲）和“高”（復雜任務升深度）之間自由切換，實現“可變速度”的應用程序。

（圖片由AI生成）

此外，上下文緩存（Context Caching）技術讓處理海量靜態數據集（如法律庫或大型代碼庫）時，重復查詢的成本可直接降低90%。

Gemini 3 Flash的發布，標志著前沿智能正在進入“Flash化”時代。通過將Pro級推理下放到Flash級定價區間，谷歌不僅為速度較慢的競爭對手設下了伏擊（trap），更向全球開發者展示了：前沿AI能力正變得前所未有的廉價與高效。

目前，Gemini 3 Flash已作為搜索AI模式和Gemini App的默認模型向全球數百萬用戶推出。

五、早期用戶體驗：這不只是升級，這是重塑

對于開發者和企業而言，Gemini 3 Flash的到來意味著原本因“高延遲、高成本”而被封印的場景，現在可以規模化落地了。

1. 法律與金融：復雜索引的專家

AI法律平臺Harvey應用研究負責人尼科·格魯彭（Niko Grupen）表示，在內部“BigLaw Bench”基準測試中，其推理能力較前代提升了7% 。這對于從海量合同中提取定義條款、交叉引用等高吞吐量法律任務具有重要影響。

Bridgewater Associates首席科學家賈斯吉特·塞孔（Jasjeet Sekhon）也對此表示贊賞：“我們需要處理海量非結構化數據且不犧牲深度。Gemini 3 Flash首次以工作流所需的速度，提供了專業級的推理。它在長上下文表現上尤為出色。”

2. 軟件開發：智能體編程的新紀元

JetBrains AI開發工具生態系統負責人丹尼斯·希里亞耶夫（Denis Shiryaev）評價道：“在我們的Junie智能編碼評估中，Gemini 3 Flash的質量已接近Pro級，但延遲和成本顯著降低。它讓復雜的多步驟智能體在生產環境中變得快速且可預測。”

Warp創始人扎克·勞埃德（Zach Lloyd）透露，其“建議代碼變更”功能在升級后，修復準確率提升了8% 。

Replit總裁米歇爾·卡塔斯塔（Michele Catasta）指出，Gemini 3 Flash首次將速度、經濟性與足夠強大的能力相結合，足以驅動一個編碼智能體的核心循環。

Cursor開發者體驗副總裁李·羅賓遜（Lee Robinson）反饋，Flash在調查問題、定位Bug根本原因時既快速又準確。

3. 多模態與游戲：毫秒級的響應

Astrocade聯合創始人阿里·薩德吉安（Ali Sadeghian）表示，該模型的速度使他們能通過單次提示生成完整的游戲關卡計劃。

Latitude首席執行官尼克·沃特森（Nick Waltson）的評價是：Gemini 3 Flash以低成本達到了過去只有頂級收費模型才能實現的高質量輸出。

六、社交媒體炸鍋：開發者們的“真香”時刻

模型好不好，社交媒體上的開發者最有發言權。Gemini 3 Flash發布后的反饋幾乎是一邊倒的驚嘆：

網友@omarsar0被Gemini 3 Flash徹底“拿捏”了。他感嘆，這可不是什么小打小鬧的升級，而是一個“要啥有啥”的六邊形戰士：推理強、速度快、還省錢。

@AliShazil_認為，Flash版本帶來的“速度-成本-質量”新平衡，其意義遠超性能榜單上的跑分結果，將真正改變實際應用場景。

Hyperbolic聯合創始人Yuchen Jin從更宏觀的角度評價稱，這種“更小、更快、更強”的趨勢并非個例，它標志著技術迭代的節奏正在急劇加快。他還認為強大的設備端AI已觸手可及，目標直指蘋果！

有網友驚嘆谷歌在LLM領域的設計依然是王者。它保留了Gemini 3的所有設計理念，但速度快得多！

當然，硬幣也有另一面。

有網友指出Gemini 3 Flash在AA-Omniscience基準測試中的幻覺率引發了關注，LisanBench的數據也暗示其平均有效性仍有提升空間。

但正如Warp創始人勞埃德所言，對于需要“低延遲和成本效率”的功能，Gemini 3 Flash依然是無可爭議的最佳選擇。

結語：是圣誕禮物，也是行業戰書

對于全球開發者而言，Gemini 3 Flash無疑是2025年末收到的一份厚重的圣誕禮物。它打破了“智能與成本”的悖論，讓AI應用的落地變得前所未有的簡單。

（圖片由AI生成）

這對于用戶是福音，但對于那些技術壁壘不高、成本控制不力的競爭對手來說，卻是滅頂之災。

隨著價格戰的槍聲打響，2026年注定將是AI行業的“大洗牌”之年。當潮水退去，究竟是谷歌重回王座，還是會有新的黑馬殺出重圍？答案，就在下一個版本的迭代里。

本文來源：網易科技報道責任編輯：王鳳枝_NT2541

相關推薦

熱點推薦

剛剛，讓谷歌翻身的Gemini 3，上線Flash版

機器之心Pro 2025-12-18 10:26:54
3 跟貼 3
504后宮三大貴妃推理皇后殺了皇后

奎哥電影 2025-12-17 16:43:54
1 跟貼 1

福建艦、山東艦的兩個相同點

新民周刊 2025-12-18 09:13:33
14125 跟貼 14125

早報｜曝iPhone 18 Pro將采用打孔屏/前OpenAI大神姚順雨入職騰訊/又快又便宜，Gemini 3 Flash發布

愛范兒 2025-12-18 09:17:33
3 跟貼 3
副市長、市教育局局長、縣委書記、縣長等25人被處理

南方都市報 2025-12-17 19:50:20
799 跟貼 799

“天才少女”羅福莉首秀：小米MiMo大模型，比DeepSeek更便宜、推理速度快三倍

鈦媒體APP 2025-12-17 15:09:09
165 跟貼 165

經驗記憶黑科技：LightSearcher讓AI工具調用減39.6%推理快48.6%

機器之心Pro 2025-12-17 14:49:43
0 跟貼 0
近十年懸疑日劇 TOP10！部部燒腦反轉，〈非自然死亡〉僅排第二

愛分享的TIARA 2025-12-17 14:35:21
1 跟貼 1

是個公司都在用AI Agent，但大家真用明白了嗎| MEET2026圓桌論壇

量子位 2025-12-17 13:06:09
0 跟貼 0
歐盟內部嚴重分歧高級官員談會議氣氛：我都想哭了

澎湃新聞 2025-12-18 11:32:28
1331 跟貼 1331
天才少女首秀！MiMo-V2-Flash具備模擬世界能力

每日經濟新聞 2025-12-17 16:07:28
0 跟貼 0
2000萬騎手的電動車，危險了

中國新聞周刊 2025-12-18 07:30:09
2828 跟貼 2828
公園回應永歷帝趴泥中雕塑引爭議

現代快報 2025-12-15 17:39:59
3743 跟貼 3743
破鏡難重圓，好聚就好散！徐正源終止與成都蓉城續約談判

齊魯壹點 2025-12-18 12:31:11
46 跟貼 46
深圳16歲“烤雞少年”火出圈！燒烤攤每天爆滿，靠努力實現逆襲人生

極目新聞 2025-12-17 21:22:10
592 跟貼 592
中國女排前隊長惠若琪，擬任新職

極目新聞 2025-12-17 17:51:59
1427 跟貼 1427
美方宣布110億對臺軍售外交部回應

界面新聞 2025-12-18 15:24:16
96 跟貼 96
吳夢潔獨木難支，江蘇女排還得為年輕交學費，上海女排已露冠軍相？

上觀新聞 2025-12-18 05:07:07
220 跟貼 220
993二年級數學下冊第九單元測試卷：簡單的數獨能訓練孩子的推理

我服子佩 2025-12-17 11:45:51
1 跟貼 1
不做大模型的追隨者，360 選擇“All In Agent"，給企業疊上Al“Buff”

智東西 2025-12-18 17:41:09
0 跟貼 0
重慶：到2027年，新一代智能終端、智能體等應用普及率超過80%

界面新聞 2025-12-17 14:02:36
0 跟貼 0
上海一高層居民樓有186個充電艙居民稱睡"炸藥包"上

新聞坊 2025-12-18 15:20:20
1 跟貼 1
智能體基礎設施是AI時代操作系統，真正的智能體要能思考、能分析，能行動

量子位 2025-12-11 03:38:22
0 跟貼 0
ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0
英偉達拿出推理版VLA：Alpamayo-R1讓自動駕駛AI更會動腦子

機器之心Pro 2025-12-02 14:07:01
0 跟貼 0
嵩山少林景區推50元接駁車引發游客吐槽，?景區回應：新方案已暫緩

上游新聞 2025-12-15 15:48:13
2396 跟貼 2396
午評：創業板指半日跌近2% 商業航天概念集體上漲

財聯社 2025-12-18 11:34:07
154 跟貼 154
日經225指數跌幅迅速擴大至1.6%

每日經濟新聞 2025-12-18 08:07:06
838 跟貼 838
Hassabis最新爆料：AGI將融合三大AI利器！Gemini+Genie+Nano Banana...

新智元 2025-12-17 15:59:16
0 跟貼 0
海南洋浦港第一批次入關貨物已經抵達

央視新聞客戶端 2025-12-18 10:21:15
356 跟貼 356
SWIFT：11月人民幣位居全球第六大支付貨幣占比2.94%

財聯社 2025-12-18 09:10:07
63 跟貼 63
“走讀中柬”系列文化活動在柬埔寨成功舉辦

參考消息 2025-12-18 09:41:08
143 跟貼 143
十多萬人將排隊和它們告別！日本民眾：非常難過

南方都市報 2025-12-17 19:52:34
206 跟貼 206
火山引擎FORCE大會直擊：豆包大模型1.8正式發布，擁有更強多模態Agent能力，豆包日均使用量超過50萬億

華爾街見聞官方 2025-12-18 10:51:32
0 跟貼 0
山東破獲炒作新能源汽車網絡水軍案——今日辟謠（2025年12月18日）

今日辟謠 2025-12-18 17:10:29
34 跟貼 34
史學界“福爾摩斯”，16年8版，常銷不衰的歷史推理開山之作！

尚曦讀史 2025-12-18 07:10:34
0 跟貼 0
比亞迪第1500萬輛新能源車下線，車型為騰勢N8L

大象新聞 2025-12-18 12:01:07
81 跟貼 81
海南封關首日實探三亞免稅城：免稅價疊加消費券，蘋果手機最高可減1000元

極目新聞 2025-12-18 12:08:09
0 跟貼 0
HAIC2025 AI開放計算成果與規劃全景呈現

智東西 2025-12-18 18:40:15
0 跟貼 0
行啊AI PC！現在都能隔空測血壓、檢測皮膚了

量子位 2025-12-18 18:15:15
0 跟貼 0

網易新聞

iOS

Android

科技要聞

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

藝術

手機

健康

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
明末究竟有多難，無法阻止的歷史進程
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

谷歌凌晨炸場，Pro級智商只賣“白菜價”，OpenAI還怎么玩？

2025新一代人工智能創業大賽

南京博物院稱受贈5幅畫被鑒定為"假" 捐贈者后人回應

南京博物院稱受贈5幅畫被鑒定為"假" 捐贈者后人回應

巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

絲芭放大招了！實名舉報鞠婧祎經濟犯罪

尹艷林：呼吁加快2.5億新市民落戶進程

在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

態度原創

深圳羅湖口岸驚現哈爾濱？這冰雪的浪漫誰懂啊

卡洛斯·杜蘭：不只是薩金特的老師！

消息稱某廠驍龍8 Gen5新機配備8K級電池，預計為真我Neo8

這些新療法，讓化療不再那么痛苦

巴黎首奪世界級冠軍加冕6冠王比肩巴薩拜仁

在零下30℃的考場里凡爾賽C5 X和508L拿到了"穩"的證明