當地時間 4 月 2 日,谷歌 DeepMind 正式發布 Gemma 4,這是一個全新的開放權重模型系列。谷歌還做出了一個關鍵決定:采用 Apache 2.0 許可證,徹底放棄了之前備受爭議的限制性條款。作為外部人士的 Hugging Face 聯合創始人兼 CEO Clément Delangue 評價稱:“Gemma 4 以 Apache 2.0 許可證發布是一個重要的里程碑。”
這意味著企業可以自由部署、修改和商用,不用擔心谷歌哪天改規則。在谷歌迄今為止所有的模型中,Gemma 4 是目前最強大的開放權重模型系列,繼承了前沿多模態、長上下文和高級推理能力,被谷歌官方稱之為是“在逐字節比較下性能最強的”開放模型(Byte for byte, the most capable open models),填補了本地前沿智能的空白,與追求極致性能的 Gemini 云端模型共同構成了完整生態。
![]()
(來源:谷歌)
Gemma 4 一口氣發布了四個版本,覆蓋了從手機到工作站的全部場景。
工作站這邊有兩個大模型:一個是 310 億參數的稠密模型,追求最高輸出質量;另一個是 260 億參數的混合專家模型,它里面有 128 個小型專家,每次推理只激活其中一小部分,實際只跑 38 億參數,跑起來時速度更快,適合對于速度要求較高的場景。兩個大模型都支持圖像輸入,上下文窗口達到 25.6 萬 tokens,可以一次性處理一整份長文檔或一個代碼倉庫。
邊緣設備這邊有兩個小模型,叫 E2B 和 E4B。E2B 實際上有 51 億參數,但是通過一種叫做每層嵌入的技術,在運行時只發揮 23 億參數的計算量,效率和速度跟小模型一樣,但其智能水平遠超同尺寸模型;E4B 同理,80 億參數能夠跑出 45 億參數的效果。這兩個小模型還特別增加了音頻輸入能力,可以直接做語音識別和翻譯,全部在設備本地運行,不需要聯網。
![]()
(來源:谷歌)
所有四個模型都原生支持函數調用和結構化輸出。這意味著開發者可以讓模型自己決定調用哪個 API、執行哪個工具,非常適合搭建那些能夠自動完成任務的智能體。Gemma 4 的代碼生成能力也很強,把模型裝在自己的電腦上,它就能變成一個本地化的 AI 編程助手,不需要把代碼傳到云端,兼具速度和安全。
在視覺能力上,Gemma 4 比上一代有著明顯進步。它支持可變分辨率的圖像輸入,你可以根據任務需求來調整圖像到底要被切分為多少個小塊,塊數從 70 到 1120 個不等。做簡單分類任務的話,使用小塊就夠了;做 OCR 識別或者文檔解析,就可以使用大塊。它還支持多圖輸入和視頻輸入,可以一次性分析多張截圖,也能分析一整個視頻的幀序列。
谷歌還公布了詳細的跑分數據。310 億參數的稠密模型在 AIME 2026 數學測試中得分 89.2%,在 LiveCodeBench 編程測試中得分 80.0%,在 Codeforces ELO 算法競賽編程測試達到了 2150 分。
混合專家模型緊隨其后,分別拿下 88.3% 和 77.1%。這兩個分數放在幾年前已經是閉源頂級模型的水平。邊緣小模型也不遑讓,E4B 在同樣的測試中拿到了 42.5% 和 52.0%,比上一代 270 億參數的 Gemma 3 還強。有網友給出了“這么小,這么牛”的評價。
![]()
(來源:谷歌)
這次許可證的變更可能是 Gemma 4 最重要的決策。之前的 Gemma 模型雖然性能不錯,但用的是谷歌自己的許可證,里面有使用限制,條款還可以隨時修改。很多大公司用戶在法律審查這一步就被卡住了。
Apache 2.0 是開源社區最常用的許可證之一,安卓系統用的就是它,阿里的 Qwen、法國的 Mistral 也都用這個。現在谷歌終于跟上,這讓企業可以放心地微調模型,然后把微調后的模型拿去商用,不用擔心法律風險。谷歌對此表示:“(這是因為)我們認真傾聽了創新者的需求。”
谷歌還強調,Gemma 4 與 Gemini 系列共享同一條技術生產線。換言之,谷歌把最前沿的模型研究成果,以開放權重的方式交給了開發者。
你可以把模型下載到自己的電腦上,只需使用消費級顯卡就能跑起來,數據全程在本地處理。260 億的混合專家模型經過 4 位量化后,可以裝進一張 24GB 的顯卡里,使用 llama.cpp 或 Ollama 這類工具就能跑。310 億的稠密模型未量化版本需要一張 80GB 的 H100,但量化后也能在消費級顯卡上運行。
谷歌還同步推出了量化感知訓練檢查點,確保模型在降低精度后依然能夠保持高質量。目前,模型已經在 Hugging Face、Kaggle、Ollama 等平臺上線,vLLM、SGLang、llama.cpp 等主流推理框架已經提供支持。
在業界合作上,谷歌已經和高通以及聯發科合作,針對小模型做了硬件級優化,確保在手機上跑得又快又省電。安卓開發者現在就可以在 AICore 開發者預覽版里試用 Gemma 4 的智能體工作流,未來將和 Gemini Nano 4 無縫兼容。
回顧 Gemma 系列的發展歷程,從 Gemma 1 到 Gemma 3,開發者下載量超過 4 億次,社區衍生出 10 萬多個變種。而 Gemma 4 的目標很明確,那就是讓開發者在自己的硬件上就能跑出接近前沿閉源模型的智能水平,把選擇權完全交還給了開發者。
參考資料:
https://ai.google.dev/gemma/terms
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
https://www.theregister.com/2026/04/02/googles_gemma_4_open_weights/
https://www.theverge.com/ai-artificial-intelligence/906062/googles-gemma-4-open-ai-model
https://venturebeat.com/technology/google-releases-gemma-4-under-apache-2-0-and-that-license-change-may-matter
排版:胡巍巍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.