![]()
機(jī)器之心編輯部
OpenAI 還在卷跑分,谷歌已經(jīng)打穿應(yīng)用層了。
北京時(shí)間周四零點(diǎn),Google 發(fā)布了高速、低成本模型 Gemini 3 Flash,作為其今年大模型領(lǐng)域的收官之作。
該模型基于上個(gè)月發(fā)布的 Gemini 3,明顯帶有搶 OpenAI 風(fēng)頭的意味。與此同時(shí),Google 還將 Gemini 3 Flash 設(shè)為 Gemini 應(yīng)用和搜索 AI 模式中的默認(rèn)模型。
這款新的 Flash 模型距離 Google 發(fā)布 Gemini 2.5 Flash 僅過(guò)去六個(gè)月,但在性能上實(shí)現(xiàn)了顯著躍升。基準(zhǔn)測(cè)試顯示,Gemini 3 Flash 相比前代模型有大幅提升,并在部分指標(biāo)上達(dá)到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。
在智能 / 成本上,它成為了全球性價(jià)比最高的模型。
![]()
例如,在 Humanity’s Last Exam 基準(zhǔn)測(cè)試中(該測(cè)試旨在評(píng)估模型在不同專業(yè)領(lǐng)域的綜合能力),在不使用工具的情況下,Gemini 3 Flash 取得了 33.7% 的成績(jī)。作為對(duì)比,Gemini 3 Pro 的得分為 37.5%,Gemini 2.5 Flash 為 11%,而新發(fā)布的 GPT-5.2 則為 34.5%。
與此同時(shí),谷歌也將這款新模型在全球范圍內(nèi)向數(shù)以百萬(wàn)計(jì)的用戶開(kāi)放,覆蓋以下渠道:
- 開(kāi)發(fā)者:通過(guò) Google AI Studio 中的 Gemini API、Gemini CLI,以及全新的智能體開(kāi)發(fā)平臺(tái) Google Antigravity
- 所有用戶:通過(guò) Gemini 應(yīng)用,以及搜索中的 AI 模式(AI Mode in Search)
- 企業(yè)用戶:通過(guò) Vertex AI 和 Gemini Enterprise
Gemini 3 Flash 發(fā)布后,大家第一時(shí)間進(jìn)行了使用測(cè)試,發(fā)現(xiàn)這個(gè) AI 回答問(wèn)題的響應(yīng)速度基本都在 1 秒以內(nèi),的確是跟搜索引擎一樣快。而且它在回答問(wèn)題的時(shí)候相比以前更加詳細(xì),知識(shí)的覆蓋面、準(zhǔn)確性也很高,看起來(lái)像是默認(rèn)聯(lián)網(wǎng)的。
網(wǎng)友們猜測(cè),Gemini 3 Flash 可以被谷歌用來(lái)代替搜索引擎,或是逐漸移植到移動(dòng)端側(cè)。不論如何,新模型都預(yù)示著 AI 模型的新時(shí)代正在到來(lái)。
Gemini 3 Flash:規(guī)模化的前沿智能
Gemini 3 Flash 證明了,速度與規(guī)模并不必然以犧牲智能為代價(jià)。在多項(xiàng)博士級(jí)推理與知識(shí)基準(zhǔn)測(cè)試中,例如 GPQA Diamond(90.4%) 和 Humanity’s Last Exam(在不使用工具的情況下為 33.7%),Gemini 3 Flash 均展現(xiàn)出前沿級(jí)性能,可與更大規(guī)模的前沿模型相媲美,并在多項(xiàng)基準(zhǔn)測(cè)試中顯著超越了此前最強(qiáng)的 2.5 代模型 ——Gemini 2.5 Pro。
同時(shí),在多模態(tài)推理基準(zhǔn) MMMU Pro 上,Gemini 3 Flash 以 81.2% 的高分達(dá)到了當(dāng)前最先進(jìn)水平,其表現(xiàn)與 Gemini 3 Pro 不相上下。
![]()
從基準(zhǔn)測(cè)試上可以看到,Gemini 3 Flash 性能強(qiáng)大,在各方面都超越了 Gemini 2.5 Pro,甚至在 ARC-AGI-2 和 SWE-Bench Verified 測(cè)試中勝過(guò)了 Gemini 3 Pro。
現(xiàn)在,精簡(jiǎn)后的模型(體積縮小 3-4 倍)已經(jīng)超越了 6 個(gè)月前的「前沿」模型。
除了具備前沿級(jí)的推理能力和多模態(tài)能力之外,Gemini 3 Flash 在設(shè)計(jì)之初就以極高的效率為目標(biāo),進(jìn)一步推動(dòng)了質(zhì)量與成本、速度之間的帕累托前沿。
在最高思考等級(jí)下運(yùn)行時(shí),Gemini 3 Flash 能夠動(dòng)態(tài)調(diào)節(jié)自身的思考深度:面對(duì)更復(fù)雜的使用場(chǎng)景,它會(huì)投入更長(zhǎng)時(shí)間進(jìn)行推理;而在處理日常任務(wù)時(shí),則能以更高性能完成目標(biāo),同時(shí)在典型業(yè)務(wù)流量下,平均使用的 token 數(shù)量比 Gemini 2.5 Pro 減少約 30%。
這使得 Gemini 3 Flash 能夠在保證準(zhǔn)確性的同時(shí),以更低的成本和更高的效率完成日常任務(wù)。
![]()
Jeff Dean 表示:「我們?cè)俅瓮黄屏诵逝c智能之間的帕累托邊界。」
Gemini 3 Flash 的核心優(yōu)勢(shì)在于其極致的原生速度,延續(xù)并強(qiáng)化了開(kāi)發(fā)者和消費(fèi)者早已青睞的 Flash 系列特性。根據(jù) Artificial Analysis 的基準(zhǔn)測(cè)試結(jié)果,Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同時(shí),速度提升達(dá)到 3 倍,而成本僅為其一小部分。
在定價(jià)方面,Gemini 3 Flash 的費(fèi)用為:
- 輸入:每 100 萬(wàn) token 收費(fèi) 0.50 美元
- 輸出:每 100 萬(wàn) token 收費(fèi) 3 美元
- 音頻輸入:仍為每 100 萬(wàn) token 收費(fèi) 1 美元
![]()
Gemini 3 Flash 在速度和效率上均顯著優(yōu)于 Gemini 2.5 Pro。在上一代模型尚未完成處理之前,Gemini 3 Flash 已經(jīng)生成了復(fù)雜圖形、3D 模型以及一個(gè) Web 應(yīng)用。
面向開(kāi)發(fā)者:始終跟得上節(jié)奏的智能
Gemini 3 Flash 專為高頻迭代開(kāi)發(fā)而打造,在保持低延遲的同時(shí),提供 Gemini 3 Pro 級(jí)別的代碼能力,能夠在高并發(fā)、快節(jié)奏的工作流中迅速進(jìn)行推理并解決問(wèn)題。
在用于評(píng)估代碼智能體能力的基準(zhǔn)測(cè)試 SWE-bench Verified 上,Gemini 3 Flash 取得了 78% 的成績(jī),不僅超越了 2.5 系列模型,也優(yōu)于 Gemini 3 Pro。
這使 Gemini 3 Flash 在智能體編程(agentic coding)、生產(chǎn)級(jí)系統(tǒng)以及高響應(yīng)性的交互式應(yīng)用場(chǎng)景中,實(shí)現(xiàn)了性能、速度與成本之間的理想平衡。
Gemini 3 Flash 在推理能力、工具使用以及多模態(tài)能力方面的強(qiáng)勁表現(xiàn),使其非常適合希望開(kāi)展更復(fù)雜的視頻分析、數(shù)據(jù)抽取和視覺(jué)問(wèn)答(Visual Q&A) 的開(kāi)發(fā)者。這也意味著,它能夠支撐更具智能水平的應(yīng)用場(chǎng)景 —— 例如游戲內(nèi)助手或 A/B 測(cè)試實(shí)驗(yàn),在這些場(chǎng)景中,既需要快速響應(yīng),又要求深度推理能力。

Gemini 3 Flash 在一款手勢(shì)追蹤的投球解謎游戲中實(shí)現(xiàn)了多模態(tài)推理,提供了近乎實(shí)時(shí)的 AI 輔助。

Gemini 3 Flash 能夠近乎實(shí)時(shí)地構(gòu)建和進(jìn)行 A/B 測(cè)試新的加載指示器設(shè)計(jì),從而簡(jiǎn)化了從設(shè)計(jì)到編碼的流程。
采用 Gemini 3 Flash 的企業(yè)反饋非常積極。包括 JetBrains、Bridgewater Associates 和 Figma 在內(nèi)的多家公司,已經(jīng)開(kāi)始使用該模型推動(dòng)業(yè)務(wù)轉(zhuǎn)型,并認(rèn)可其在推理速度、效率以及推理能力方面的表現(xiàn),能夠與更大規(guī)模的模型相媲美。
目前,Gemini 3 Flash 已通過(guò) Vertex AI 和 Gemini Enterprise 正式向企業(yè)客戶開(kāi)放。
Cursor 開(kāi)發(fā)者體驗(yàn)副總裁表示,他們的工程師發(fā)現(xiàn),Gemini 3 Flash 與 Cursor 的 Debug Mode 配合使用效果非常出色。該模型在問(wèn)題排查和定位 Bug 根本原因方面表現(xiàn)出速度快、準(zhǔn)確性高的優(yōu)勢(shì)。
![]()
面向所有人:Gemini 3 Flash 全球上線
Gemini 3 Flash 現(xiàn)已成為 Gemini 應(yīng)用的默認(rèn)模型,取代了 2.5 Flash。這意味著全球 Gemini 用戶都已能免費(fèi)體驗(yàn) Gemini 3,從而大幅提升日常任務(wù)的處理效率。
憑借 Gemini 3 Flash 卓越的多模態(tài)推理能力,你可以利用它更快地查看、聆聽(tīng)和理解各種類型的信息。例如,你可以讓 Gemini 理解視頻和圖像,并在短短幾秒鐘內(nèi)將這些內(nèi)容轉(zhuǎn)化為實(shí)用且可行的計(jì)劃。
![]()
或者,你無(wú)需任何編程知識(shí),即可使用語(yǔ)音快速?gòu)牧汩_(kāi)始構(gòu)建實(shí)用的應(yīng)用程序。只需隨時(shí)隨地向 Gemini 發(fā)出語(yǔ)音指令,它就能在幾分鐘內(nèi)將人們零散的想法轉(zhuǎn)化為功能完善的應(yīng)用程序。
使用 Gemini 3 Flash 描述一個(gè)想法,并在幾分鐘內(nèi)將其轉(zhuǎn)化為可行的原型。
Gemini 3 Flash 也正在逐步推廣,谷歌希望它能成為全球用戶使用的搜索功能中 AI 模式的默認(rèn)模型。
基于 Gemini 3 Pro 的推理能力,搭載 Gemini 3 Flash 的 AI 模式能夠更有效地理解你問(wèn)題的細(xì)微之處。它會(huì)考慮查詢的各個(gè)方面,提供全面的回復(fù),以易于理解的方式呈現(xiàn) —— 從網(wǎng)絡(luò)上提取實(shí)時(shí)本地信息和有用的鏈接。最終結(jié)果有效地將研究與實(shí)際行動(dòng)相結(jié)合:生成條理清晰的分析以及具體的建議。最后,一切都以搜索的速度完成。
在處理需要考慮多個(gè)因素的復(fù)雜目標(biāo)時(shí),例如計(jì)劃一次說(shuō)走就走的旅行,或快速學(xué)習(xí)復(fù)雜的教育概念,這項(xiàng)功能尤其出色。
谷歌表示,Gemini 3 Flash 現(xiàn)已通過(guò) Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預(yù)覽版。你還可以通過(guò)其他開(kāi)發(fā)者工具(例如 Gemini CLI 和 Android Studio)訪問(wèn)新模型。此外,它也已開(kāi)始在 Gemini 應(yīng)用和搜索的 AI 模式中面向所有用戶推出。
參考鏈接:https://blog.google/products/gemini/gemini-3-flash/
文中視頻鏈接:
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.