網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，讓谷歌翻身的Gemini 3，上線Flash版

2025-12-18 10:26:54　來(lái)源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心編輯部

OpenAI 還在卷跑分，谷歌已經(jīng)打穿應(yīng)用層了。

北京時(shí)間周四零點(diǎn)，Google 發(fā)布了高速、低成本模型 Gemini 3 Flash，作為其今年大模型領(lǐng)域的收官之作。

該模型基于上個(gè)月發(fā)布的 Gemini 3，明顯帶有搶 OpenAI 風(fēng)頭的意味。與此同時(shí)，Google 還將 Gemini 3 Flash 設(shè)為 Gemini 應(yīng)用和搜索 AI 模式中的默認(rèn)模型。

這款新的 Flash 模型距離 Google 發(fā)布 Gemini 2.5 Flash 僅過(guò)去六個(gè)月，但在性能上實(shí)現(xiàn)了顯著躍升。基準(zhǔn)測(cè)試顯示，Gemini 3 Flash 相比前代模型有大幅提升，并在部分指標(biāo)上達(dá)到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。

在智能 / 成本上，它成為了全球性價(jià)比最高的模型。

例如，在 Humanity’s Last Exam 基準(zhǔn)測(cè)試中（該測(cè)試旨在評(píng)估模型在不同專業(yè)領(lǐng)域的綜合能力），在不使用工具的情況下，Gemini 3 Flash 取得了 33.7% 的成績(jī)。作為對(duì)比，Gemini 3 Pro 的得分為 37.5%，Gemini 2.5 Flash 為 11%，而新發(fā)布的 GPT-5.2 則為 34.5%。

與此同時(shí)，谷歌也將這款新模型在全球范圍內(nèi)向數(shù)以百萬(wàn)計(jì)的用戶開(kāi)放，覆蓋以下渠道：

開(kāi)發(fā)者：通過(guò) Google AI Studio 中的 Gemini API、Gemini CLI，以及全新的智能體開(kāi)發(fā)平臺(tái) Google Antigravity
所有用戶：通過(guò) Gemini 應(yīng)用，以及搜索中的 AI 模式（AI Mode in Search）
企業(yè)用戶：通過(guò) Vertex AI 和 Gemini Enterprise

Gemini 3 Flash 發(fā)布后，大家第一時(shí)間進(jìn)行了使用測(cè)試，發(fā)現(xiàn)這個(gè) AI 回答問(wèn)題的響應(yīng)速度基本都在 1 秒以內(nèi)，的確是跟搜索引擎一樣快。而且它在回答問(wèn)題的時(shí)候相比以前更加詳細(xì)，知識(shí)的覆蓋面、準(zhǔn)確性也很高，看起來(lái)像是默認(rèn)聯(lián)網(wǎng)的。

網(wǎng)友們猜測(cè)，Gemini 3 Flash 可以被谷歌用來(lái)代替搜索引擎，或是逐漸移植到移動(dòng)端側(cè)。不論如何，新模型都預(yù)示著 AI 模型的新時(shí)代正在到來(lái)。

Gemini 3 Flash：規(guī)模化的前沿智能

Gemini 3 Flash 證明了，速度與規(guī)模并不必然以犧牲智能為代價(jià)。在多項(xiàng)博士級(jí)推理與知識(shí)基準(zhǔn)測(cè)試中，例如 GPQA Diamond（90.4%）和 Humanity’s Last Exam（在不使用工具的情況下為 33.7%），Gemini 3 Flash 均展現(xiàn)出前沿級(jí)性能，可與更大規(guī)模的前沿模型相媲美，并在多項(xiàng)基準(zhǔn)測(cè)試中顯著超越了此前最強(qiáng)的 2.5 代模型 ——Gemini 2.5 Pro。

同時(shí)，在多模態(tài)推理基準(zhǔn) MMMU Pro 上，Gemini 3 Flash 以 81.2% 的高分達(dá)到了當(dāng)前最先進(jìn)水平，其表現(xiàn)與 Gemini 3 Pro 不相上下。

從基準(zhǔn)測(cè)試上可以看到，Gemini 3 Flash 性能強(qiáng)大，在各方面都超越了 Gemini 2.5 Pro，甚至在 ARC-AGI-2 和 SWE-Bench Verified 測(cè)試中勝過(guò)了 Gemini 3 Pro。

現(xiàn)在，精簡(jiǎn)后的模型（體積縮小 3-4 倍）已經(jīng)超越了 6 個(gè)月前的「前沿」模型。

除了具備前沿級(jí)的推理能力和多模態(tài)能力之外，Gemini 3 Flash 在設(shè)計(jì)之初就以極高的效率為目標(biāo)，進(jìn)一步推動(dòng)了質(zhì)量與成本、速度之間的帕累托前沿。

在最高思考等級(jí)下運(yùn)行時(shí)，Gemini 3 Flash 能夠動(dòng)態(tài)調(diào)節(jié)自身的思考深度：面對(duì)更復(fù)雜的使用場(chǎng)景，它會(huì)投入更長(zhǎng)時(shí)間進(jìn)行推理；而在處理日常任務(wù)時(shí)，則能以更高性能完成目標(biāo)，同時(shí)在典型業(yè)務(wù)流量下，平均使用的 token 數(shù)量比 Gemini 2.5 Pro 減少約 30%。

這使得 Gemini 3 Flash 能夠在保證準(zhǔn)確性的同時(shí)，以更低的成本和更高的效率完成日常任務(wù)。

Jeff Dean 表示：「我們?cè)俅瓮黄屏诵逝c智能之間的帕累托邊界。」

Gemini 3 Flash 的核心優(yōu)勢(shì)在于其極致的原生速度，延續(xù)并強(qiáng)化了開(kāi)發(fā)者和消費(fèi)者早已青睞的 Flash 系列特性。根據(jù) Artificial Analysis 的基準(zhǔn)測(cè)試結(jié)果，Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同時(shí)，速度提升達(dá)到 3 倍，而成本僅為其一小部分。

在定價(jià)方面，Gemini 3 Flash 的費(fèi)用為：

輸入：每 100 萬(wàn) token 收費(fèi) 0.50 美元
輸出：每 100 萬(wàn) token 收費(fèi) 3 美元
音頻輸入：仍為每 100 萬(wàn) token 收費(fèi) 1 美元

Gemini 3 Flash 在速度和效率上均顯著優(yōu)于 Gemini 2.5 Pro。在上一代模型尚未完成處理之前，Gemini 3 Flash 已經(jīng)生成了復(fù)雜圖形、3D 模型以及一個(gè) Web 應(yīng)用。

面向開(kāi)發(fā)者：始終跟得上節(jié)奏的智能

Gemini 3 Flash 專為高頻迭代開(kāi)發(fā)而打造，在保持低延遲的同時(shí)，提供 Gemini 3 Pro 級(jí)別的代碼能力，能夠在高并發(fā)、快節(jié)奏的工作流中迅速進(jìn)行推理并解決問(wèn)題。

在用于評(píng)估代碼智能體能力的基準(zhǔn)測(cè)試 SWE-bench Verified 上，Gemini 3 Flash 取得了 78% 的成績(jī)，不僅超越了 2.5 系列模型，也優(yōu)于 Gemini 3 Pro。

這使 Gemini 3 Flash 在智能體編程（agentic coding）、生產(chǎn)級(jí)系統(tǒng)以及高響應(yīng)性的交互式應(yīng)用場(chǎng)景中，實(shí)現(xiàn)了性能、速度與成本之間的理想平衡。

Gemini 3 Flash 在推理能力、工具使用以及多模態(tài)能力方面的強(qiáng)勁表現(xiàn)，使其非常適合希望開(kāi)展更復(fù)雜的視頻分析、數(shù)據(jù)抽取和視覺(jué)問(wèn)答（Visual Q&A）的開(kāi)發(fā)者。這也意味著，它能夠支撐更具智能水平的應(yīng)用場(chǎng)景 —— 例如游戲內(nèi)助手或 A/B 測(cè)試實(shí)驗(yàn)，在這些場(chǎng)景中，既需要快速響應(yīng)，又要求深度推理能力。

Gemini 3 Flash 在一款手勢(shì)追蹤的投球解謎游戲中實(shí)現(xiàn)了多模態(tài)推理，提供了近乎實(shí)時(shí)的 AI 輔助。

Gemini 3 Flash 能夠近乎實(shí)時(shí)地構(gòu)建和進(jìn)行 A/B 測(cè)試新的加載指示器設(shè)計(jì)，從而簡(jiǎn)化了從設(shè)計(jì)到編碼的流程。

采用 Gemini 3 Flash 的企業(yè)反饋非常積極。包括 JetBrains、Bridgewater Associates 和 Figma 在內(nèi)的多家公司，已經(jīng)開(kāi)始使用該模型推動(dòng)業(yè)務(wù)轉(zhuǎn)型，并認(rèn)可其在推理速度、效率以及推理能力方面的表現(xiàn)，能夠與更大規(guī)模的模型相媲美。

目前，Gemini 3 Flash 已通過(guò) Vertex AI 和 Gemini Enterprise 正式向企業(yè)客戶開(kāi)放。

Cursor 開(kāi)發(fā)者體驗(yàn)副總裁表示，他們的工程師發(fā)現(xiàn)，Gemini 3 Flash 與 Cursor 的 Debug Mode 配合使用效果非常出色。該模型在問(wèn)題排查和定位 Bug 根本原因方面表現(xiàn)出速度快、準(zhǔn)確性高的優(yōu)勢(shì)。

面向所有人：Gemini 3 Flash 全球上線

Gemini 3 Flash 現(xiàn)已成為 Gemini 應(yīng)用的默認(rèn)模型，取代了 2.5 Flash。這意味著全球 Gemini 用戶都已能免費(fèi)體驗(yàn) Gemini 3，從而大幅提升日常任務(wù)的處理效率。

憑借 Gemini 3 Flash 卓越的多模態(tài)推理能力，你可以利用它更快地查看、聆聽(tīng)和理解各種類型的信息。例如，你可以讓 Gemini 理解視頻和圖像，并在短短幾秒鐘內(nèi)將這些內(nèi)容轉(zhuǎn)化為實(shí)用且可行的計(jì)劃。

或者，你無(wú)需任何編程知識(shí)，即可使用語(yǔ)音快速?gòu)牧汩_(kāi)始構(gòu)建實(shí)用的應(yīng)用程序。只需隨時(shí)隨地向 Gemini 發(fā)出語(yǔ)音指令，它就能在幾分鐘內(nèi)將人們零散的想法轉(zhuǎn)化為功能完善的應(yīng)用程序。

使用 Gemini 3 Flash 描述一個(gè)想法，并在幾分鐘內(nèi)將其轉(zhuǎn)化為可行的原型。

Gemini 3 Flash 也正在逐步推廣，谷歌希望它能成為全球用戶使用的搜索功能中 AI 模式的默認(rèn)模型。

基于 Gemini 3 Pro 的推理能力，搭載 Gemini 3 Flash 的 AI 模式能夠更有效地理解你問(wèn)題的細(xì)微之處。它會(huì)考慮查詢的各個(gè)方面，提供全面的回復(fù)，以易于理解的方式呈現(xiàn) —— 從網(wǎng)絡(luò)上提取實(shí)時(shí)本地信息和有用的鏈接。最終結(jié)果有效地將研究與實(shí)際行動(dòng)相結(jié)合：生成條理清晰的分析以及具體的建議。最后，一切都以搜索的速度完成。

在處理需要考慮多個(gè)因素的復(fù)雜目標(biāo)時(shí)，例如計(jì)劃一次說(shuō)走就走的旅行，或快速學(xué)習(xí)復(fù)雜的教育概念，這項(xiàng)功能尤其出色。

谷歌表示，Gemini 3 Flash 現(xiàn)已通過(guò) Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預(yù)覽版。你還可以通過(guò)其他開(kāi)發(fā)者工具（例如 Gemini CLI 和 Android Studio）訪問(wèn)新模型。此外，它也已開(kāi)始在 Gemini 應(yīng)用和搜索的 AI 模式中面向所有用戶推出。

參考鏈接：https://blog.google/products/gemini/gemini-3-flash/

文中視頻鏈接：
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.