![]()
鳳凰網(wǎng)科技 出品
作者|姜凡
編輯|董雨晴
![]()
Gemma 4拿出了谷歌壓箱底的技術(shù)
4月2日凌晨,谷歌DeepMind CEO Demis Hassabis在社交平臺(tái)X上發(fā)了四顆鉆石的emoji,幾個(gè)小時(shí)后,謎底揭曉,谷歌正式發(fā)布了旗下最新開源大模型家族Gemma 4,這是谷歌入局開源AI賽道兩年多來,拿出的最有誠意、也最具殺傷力的作品。
Gemma 4不是單一模型,而是一套覆蓋手機(jī)到工作站全場(chǎng)景的完整產(chǎn)品矩陣,四個(gè)版本各有明確的定位,徹底打破了“性能強(qiáng)就必須體積大、門檻高”的行業(yè)慣性。
![]()
最小的E2B和E4B兩款端側(cè)模型,名字里的“E”代表“有效參數(shù)”,通過谷歌自研的每層嵌入(PLE)技術(shù),把模型“干活的核心算力”和“輔助的記憶存儲(chǔ)”模塊做了拆分,讓它在運(yùn)行時(shí)只調(diào)用最少的資源。
其中E2B總參數(shù)51億,運(yùn)行時(shí)有效參數(shù)僅23億,極端情況下內(nèi)存占用能壓到1.5GB以下,普通安卓手機(jī)就能完全離線運(yùn)行,不用聯(lián)網(wǎng)、不用上傳數(shù)據(jù),還原生支持圖片、語音輸入,相當(dāng)于把一個(gè)具備基礎(chǔ)推理能力的AI助手,完整塞進(jìn)了用戶的口袋里。
E4B則在性能和功耗之間做了平衡,45億有效參數(shù)就能跑出接近上一代Gemma 3 27B旗艦?zāi)P偷男Ч嵌藗?cè)設(shè)備的主力版本。
中間的 26B MoE 版本則精準(zhǔn)踩中了開發(fā)者最痛的 “速度與性能平衡” 需求,它采用混合專家架構(gòu),通俗來說就是模型內(nèi)置了 128 個(gè)不同方向的 “專業(yè)部門”,每次處理問題時(shí),僅激活最對(duì)口的 8 個(gè)部門加 1 個(gè)共享協(xié)調(diào)部門。252 億總參數(shù)里,單次推理僅激活 38 億參數(shù),最終實(shí)現(xiàn)了單 token 生成速度對(duì)標(biāo) 4B 級(jí)模型,效果卻接近 31B 旗艦?zāi)P?/strong>的表現(xiàn)。
而作為旗艦的31B Dense版本,更是直接刷新了開源模型的參數(shù)效率上限,310億全激活參數(shù),未量化的原版權(quán)重一張80GB H100就能裝下,量化后普通消費(fèi)級(jí)顯卡也能流暢運(yùn)行,卻在業(yè)界公認(rèn)的Arena AI開源模型排行榜上沖到了全球第三,用不到十分之一的參數(shù)量,就能和參數(shù)量400億級(jí)別的巨無霸模型掰手腕。
和上一代產(chǎn)品相比,它的提升是代際級(jí)別的:AIME 2026數(shù)學(xué)競(jìng)賽測(cè)試準(zhǔn)確率從20.8%暴漲到89.2%,翻了四倍多;LiveCodeBench代碼測(cè)試得分從29.1%漲到80%,同時(shí)還補(bǔ)上了之前的短板,長(zhǎng)上下文窗口拉到256K,能一次性處理幾十萬字的完整文檔,原生支持140多種語言,多模態(tài)理解能力也實(shí)現(xiàn)了翻倍提升。
![]()
而最讓全球開發(fā)者驚喜的,從來都不只是性能,而是谷歌終于放下了姿態(tài),把Gemma 4的開源協(xié)議換成了行業(yè)最寬松、最受認(rèn)可的Apache 2.0。在此之前,Gemma前三代產(chǎn)品用的都是谷歌自定義的開源協(xié)議,不僅有諸多商用限制,谷歌還能單方面修改規(guī)則,甚至有條款被解讀為“用Gemma生成的數(shù)據(jù)訓(xùn)練新模型,新模型也要受該協(xié)議約束”,讓很多開發(fā)者和企業(yè)不敢放心商用,怕埋下法律風(fēng)險(xiǎn)。
這次的Apache 2.0協(xié)議,沒有任何商用門檻,沒有用戶量限制,開發(fā)者可以自由下載、修改、分發(fā)、二次開發(fā),甚至修改后換成自己的品牌商用,谷歌都不會(huì)干預(yù),Hugging Face聯(lián)合創(chuàng)始人Clément Delangue直接評(píng)價(jià),這是開源AI領(lǐng)域的一個(gè)重大里程碑。
![]()
遲來的背水一戰(zhàn):Gemma 4要改寫的是整個(gè)AI行業(yè)的格局
Gemma 4的發(fā)布,是谷歌在全球AI開源賽道的一次全面反攻,背后是整個(gè)AI行業(yè)格局的深刻重構(gòu)。
過去兩年,開源大模型的戰(zhàn)場(chǎng)已經(jīng)徹底換了天地。最初Meta憑借Llama系列的先發(fā)優(yōu)勢(shì)和寬松協(xié)議,一家獨(dú)大拿下了開源市場(chǎng)的大部分份額,但從2025年開始,國(guó)內(nèi)AI廠商在開源賽道全面發(fā)力,通義千問、DeepSeek、智譜AI、月之暗面等廠商密集迭代,用更快的更新速度、更強(qiáng)的性能、更友好的開源協(xié)議,快速搶占市場(chǎng),全球開源模型排行榜的前排位置,長(zhǎng)期被國(guó)內(nèi)廠商包攬,美國(guó)廠商在開源賽道的存在感越來越弱,就連英偉達(dá)都下場(chǎng)推出了自己的Nemotron開源系列,試圖守住生態(tài)話語權(quán)。
而谷歌此前的Gemma系列,雖然背靠Gemini的技術(shù)積累,累計(jì)下載量突破4億次,社區(qū)衍生出超過10萬個(gè)變體,但因?yàn)閰f(xié)議保守、更新節(jié)奏慢,在實(shí)際商用部署中的份額,遠(yuǎn)遠(yuǎn)落后于Llama和國(guó)內(nèi)的主流開源模型,在開源賽道逐漸被邊緣化。
這次Gemma 4的發(fā)布,本質(zhì)上是谷歌的一次“背水一戰(zhàn)”,它直接把閉源旗艦Gemini 3的底層技術(shù)架構(gòu)完整下放,官方明確表示Gemma 4與Gemini 3共享同一套世界級(jí)的研究成果和技術(shù)體系,相當(dāng)于把之前只有付費(fèi)API才能用到的能力,免費(fèi)開源給了所有開發(fā)者,再配合Apache 2.0協(xié)議,目的就是用最大的誠意,搶回開源市場(chǎng)的開發(fā)者生態(tài)。
而谷歌這記毫無保留的重拳砸向開源市場(chǎng),國(guó)內(nèi)AI圈里被問得最多的一句話就是:DeepSeek是否在伺機(jī)而動(dòng)了?
所有人都盯著DeepSeek的反應(yīng),本質(zhì)上是因?yàn)樗钱?dāng)下國(guó)內(nèi)開源賽道里,唯一能和Gemma 4正面硬碰硬的選手。
![]()
過去一年多里,DeepSeek幾乎憑一己之力,改寫了全球開源大模型的競(jìng)爭(zhēng)格局:從DeepSeek V2系列憑借67B MoE模型首次登頂全球開源模型榜單,到后續(xù)V3系列用30B全參數(shù)模型刷新參數(shù)效率紀(jì)錄,再到端側(cè)1.5B、7B模型把離線AI的門檻壓到百元級(jí)開發(fā)板都能跑,它始終走的是和這次Gemma 4完全一致的路線——不堆無意義的參數(shù)量,死磕參數(shù)效率,用更小的體積、更低的算力門檻,實(shí)現(xiàn)對(duì)標(biāo)旗艦大模型的能力。
甚至在代碼、數(shù)學(xué)推理這兩個(gè)硬核賽道上,DeepSeek此前的迭代版本,長(zhǎng)期壓著上一代Gemma系列打,在LiveCodeBench、AIME數(shù)學(xué)競(jìng)賽等核心測(cè)試集上,多次用更小的參數(shù)量實(shí)現(xiàn)了反超。更關(guān)鍵的是,DeepSeek從初代產(chǎn)品開始,就一直采用最寬松的MIT開源協(xié)議,商用無門檻、無限制,企業(yè)可以自由修改、分發(fā)甚至二次封裝商用,這也是它能快速拿下國(guó)內(nèi)開發(fā)者市場(chǎng),甚至在海外市場(chǎng)都能和Llama分庭抗禮的核心原因——谷歌這次用協(xié)議放開打的牌,DeepSeek從一開始就已經(jīng)打透了。
鳳凰網(wǎng)科技此前從行業(yè)人士處了解到,DeepSeek從不被外界節(jié)奏影響,只專注于自身,“模型做好了自然會(huì)發(fā)”。
而熟悉DeepSeek迭代節(jié)奏的開發(fā)者都清楚,這家廠商也不走“小步快跑、頻繁修修補(bǔ)補(bǔ)”的路線,而是每一次更新都直擊行業(yè)痛點(diǎn),試圖拿出代際級(jí)的技術(shù)突破。
從2025年至今,DeepSeek的大版本更新間隔基本穩(wěn)定在2-3個(gè)月,每一次新版本發(fā)布,都能直接刷新當(dāng)時(shí)的開源模型性能榜單,甚至多次倒逼海外廠商調(diào)整產(chǎn)品節(jié)奏。更關(guān)鍵的是,多家科技媒體早在3月就已爆料,DeepSeek V4版本已經(jīng)進(jìn)入灰度測(cè)試階段,定檔2026年4月正式發(fā)布。
不過對(duì)谷歌來說,開源生態(tài)的重要性遠(yuǎn)不止于模型本身,它背后是云服務(wù)、芯片、移動(dòng)生態(tài)的完整閉環(huán)。此前谷歌云在AI時(shí)代的增長(zhǎng),一直落后于亞馬遜AWS和微軟Azure,核心短板之一就是沒有形成自己的開源開發(fā)者生態(tài),開發(fā)者不用你的模型,自然不會(huì)優(yōu)先選擇你的云服務(wù)來部署、你的芯片來訓(xùn)練。而Gemma 4的出現(xiàn),就是谷歌給開發(fā)者遞出的一張“無門檻入場(chǎng)券”,用免費(fèi)的頂級(jí)模型,帶動(dòng)自家云服務(wù)和TPU芯片的增長(zhǎng)。
更關(guān)鍵的是,Gemma 4踩中了AI行業(yè)下一個(gè)核心戰(zhàn)場(chǎng)端側(cè)AI。其他廠商或許還在云端卷大模型的參數(shù)和性能,谷歌正在把目光投向全球30多億臺(tái)安卓設(shè)備。這次Gemma 4的端側(cè)模型,直接和Pixel團(tuán)隊(duì)、高通、聯(lián)發(fā)科做了芯片級(jí)的深度優(yōu)化,和安卓系統(tǒng)的AICore能力原生打通,開發(fā)者只需要寫一次代碼,就能在所有支持的安卓設(shè)備上實(shí)現(xiàn)離線運(yùn)行。
Gemma 4的發(fā)布,相當(dāng)于給所有安卓設(shè)備預(yù)裝了一個(gè)免費(fèi)、頂級(jí)的本地AI引擎,直接和蘋果iOS的端側(cè)AI能力形成正面抗衡,未來安卓手機(jī)的AI體驗(yàn),很可能會(huì)迎來一次全面的升級(jí)。
當(dāng)然,Gemma 4不是開源AI戰(zhàn)爭(zhēng)的終點(diǎn),而是新一輪競(jìng)爭(zhēng)的開始。谷歌用一次徹底的“放權(quán)”,重新回到了開源賽道的第一梯隊(duì),而國(guó)內(nèi)的廠商也不會(huì)停下迭代的腳步,未來的開源市場(chǎng),只會(huì)在性能、效率、易用性上越來越卷。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.