網易首頁 > 網易號 > 正文申請入駐

谷歌推出最強手機端開源模型Gemma4 E2B/E4B

2026-04-03 16:49:11　來源: 鈦媒體APP

北京舉報

分享至

文 | 硬嘮intalk

2026年4月2日凌晨，Arena AI 的開源模型排行榜在沉寂數周后突然刷新。

這一天沒有硅谷慣有的盛大發布會，Google DeepMind 首席執行官 Demis Hassabis 僅在 X 上發布了一條簡短的消息。隨后，一個名為 Gemma 4 31B Dense 的中量級模型，以驚人的斜率殺入全球開源前三。

在它上方的，是參數量數倍于它的龐然大物；在它下方的，是過去一年統治社區的幾支老牌主力。

在開發者社區，31B 這個數字顯得極不尋常。它既不追求超大規模的混合專家架構（MoE），也未試圖在參數量上追趕閉源旗艦。它像是一個精準的切片，切開了開源 AI 長期以來“大即是美”的共識。

沒人預料到，這家曾在開源競賽中動作遲緩的巨頭，會選擇在清晨以一種近乎“冷啟動”的方式，宣告對開源高地的重奪。

更令人意外的是，Gemma 4 E2B 和 E4B 雖然總參數量分別為 5.1B 和 8B，但它們采用了逐層嵌入（PLE）實際激活的“有效參數”僅為 2.3B 和 4.5B，極大降低了手機和筆記本電腦的內存和運行門檻。

在帶有原生多模態能力的端側極小尺寸區間，業界認為 Llama 4 和 Qwen 3.5 目前都沒有能與 Gemma 4 E2B/E4B 直接對標的產品。對于純端側或邊緣部署，Gemma 4 目前被認為是最強的選擇。

維度

Gemma 4 (E2B / E4B)

Qwen 3 (1.7B / 4B)

核心差異結論

實際激活參數

2.3B / 4.5B

1.7B / 4B

Gemma同等性能下顯存占用極低。

最大上下文

128K

32K

Gemma 4 碾壓。

支持模態

文本、圖像、視頻、原生音頻

文本、圖像、視頻

Gemma 4 獨占原生音頻。

推理Token消耗

極低 (~1.1K Tokens)

極高 (~9K Tokens)

Gemma 4 效率碾壓。

極限視覺并發

較弱

極強 (~280張圖)

Qwen 3/3.5 碾壓。

最低內存門檻

4GB / 5.5-6GB (4-bit 量化)

3GB / 4GB (4-bit 量化)

Qwen 的物理體積下限更低。

根據社區總結，Gemma 4 E2B/E4B除了在圖像批量處理時弱于Qwen1.7B / 4B外，在上下文，原聲語音處理，推理能力上均實現了大幅度領先。

第一章：每參數智能

在 Google 的戰略里，這場戰爭的關鍵詞不是“規?！?，而是“每參數智能”（Intelligence-per-parameter）。

長期以來，開源社區被分為兩派：一派是以 Meta 為代表的堆料競賽，試圖用千億參數換取邏輯能力；另一派是以 DeepSeek 為代表的成本學派，通過 MoE 架構降低推理開銷。

Google DeepMind 此次推出的 Gemma 4 系列——包括 E2B、E4B、26B MoE 和 31B Dense——試圖開辟第三條路徑：在有限的“權重”內壓榨出極限的智能。這種“反向進化”的核心支撐是 TurboQuant 壓縮算法。

根據 Google Research 在 3 月底披露的技術細節，這項技術能將 KV 緩存壓縮至 3 比特，在 H100 GPU 上實現 8 倍的注意力計算加速，且在 MMLU Pro 等核心指標上實現“零精度損失”。

數據的跳躍是直觀的。Gemma 4 31B 的 MMLU Pro 得分達到 85.2%，而在代表數學巔峰能力的 AIME 2026 測試中，它跑出了 89.2% 的高分。相比之下，前代 27B 模型的這一數字僅為 20.8%。

Google 此次不僅交出了權重，還交出了控制權。Gemma 4 全系采用了商業友好的 Apache 2.0 協議，徹底終結了此前版本在商用授權上的扭捏。

在端側，Google 展現了更為激進的收割姿態。通過 AICore 開發者預覽版，Gemma 4 E2B 和 E4B 被直接集成進 Android 系統級接口。在 Pixel 手機和 Raspberry Pi 上，新模型的推理速度提升了 4 倍，電池消耗則降低了 60%。

對于 Google 而言，這不再僅僅是一場關于排行榜位次的爭奪，而是一場關于誰能定義“有用”的生存戰：如果模型不能裝進用戶的口袋，那它對 Google 的移動生態便毫無意義。

第二章：中式合圍

當 Google 試圖用 31B 重新定義“每參數智能”時，它的對手們正駐守在另一條壕溝里。在中國大模型廠商的戰略坐標中，智能的衡量標準不是參數的瘦身，而是復雜問題的“暴力破解”與工程場景的“絕對占有”。

DeepSeek 在 2026 年初再次加固了它的邏輯護城河。根據行業披露，DeepSeek-V4 采用了一種極端的 1T 總參數 MoE 架構，盡管每次推理僅激活 37B 參數，但其引入的 Engram 條件內存技術，讓模型在 1M 上下文內展現出了極強的記憶穩定性。

更具殺傷力的是其 V3.2 系列引入的“思考模式”（Thinking mode）。在針對 STEM 領域、邏輯糾錯 and 復雜代碼生成的測試中，這一模式允許模型在給出答案前進行大規模的“自我博弈”。

BentoML 的技術分析指出，DeepSeek 的這種思路在于：如果端側模型暫時無法在短時間內追上閉源旗艦的直覺，那就通過“多想幾步”來補齊。這直接切中了金融和科研開發者對“邏輯確定性”的需求。

而在生產力工具層面，阿里巴巴的通義千問 Qwen 3.5 系列則展現了近乎殘酷的工程壓制力。在 2026 年 3 月底的 LM Studio 測評中，Qwen 3.5 的 32B 模型在 HumanEval 編程測試中報出了 88.0 分的驚人數據。

這意味著，在處理具體、細碎且容錯率極低的工業級編程任務時，Qwen 的表現甚至優于部分體量大它三倍的國際模型。

這種競爭格局形成了一個微妙的“中式合圍”：DeepSeek 占據了“深思熟慮”的智力高地，Qwen 占據了“開箱即用”的工程低地。

對于開發者而言，選擇不再單一。如果你需要一個能夠深入理解 Android 底層系統并進行離線多模態交互的伙伴，Gemma 4 是首選。但如果你是在尋找一個能夠處理 100 萬字技術文檔、或者在云端以最低成本生成百萬行代碼的“勞動力”，DeepSeek 和 Qwen 依然擁有難以逾越的遷移壁壘。

這場戰爭的下半場，正從“誰的分數高”轉向“誰的護城河更難被跨越”。Google 拿出了手術刀般精準的參數效率，而它的中國對手們，則在邏輯與工程的堡壘里，筑起了更厚的墻。

第三章：最后一百米

在大模型的世界里，算力的賬本往往比排行榜的得分更具決定性。

如果說 DeepSeek 依靠超大規模 MoE 架構在云端實現了推理成本的極限壓縮，那么 Google DeepMind 的 Gemma 4 則試圖在硬件的“最后一百米”——也就是用戶的手機與開發者的工作站里，建立一套全新的結算體系。

WaveSpeed AI 的分析指出，此前的許可協議中存在的 MAU 限制和用途審查，一直是企業級開發者站隊的阻礙。而現在，隨著協議的徹底放開，Gemma 4 31B 模型能夠以“無鎖”狀態直接進入醫療、國防等對數字主權極度敏感的領域。

相比之下，DeepSeek 等廠商雖然開源，但在跨國商業授權上的透明度仍是不少跨國企業觀望的原因。更深層的壁壘被建立在操作系統內部。在 Android AICore 的開發者預覽版中，Gemma 4 獲得了系統級的“特權插槽”。

這意味著，當開發者調用 E2B 或 E4B 模型進行實時語音識別或離線視頻處理時，其效率是未經優化的第三方模型的 4 倍，且電池損耗僅為后者的 40%。這種“軟硬一體”的垂直整合，是目前任何中國模型廠商都難以逾越的系統級護城河。

算力的經濟賬同樣在倒向“中量級”模型。根據 Spheron 的測算數據，Gemma 4 31B Dense 的權重能夠完整塞入單張 80GB 的 NVIDIA H100 GPU 顯存中，實現 FP8 精度的滿速推理。

這是一個極其微妙的平衡點。DeepSeek V3.2 為了維持其頂尖的邏輯能力，至少需要 8 張 H100 組成的集群才能高效運轉。對于絕大多數中小型初創企業而言，這意味著每小時推理成本從 2.40 美元到 19.20 美元的跨越。

“Google 并不是在制造一個最聰明的模型，”Constellation Research 分析師 Holger Mueller 評價道，“它是在制造一個能讓開發者在不更換硬件的前提下，所能買到的、性價比最高的智能。”

在這場最后一百米的終刺沖刺中，Google 選擇了繞開昂貴的云端軍備競賽，直接降落在全球數十億部 Android 設備與數百萬個工作站的顯存里。

當競爭對手還在爭論誰的邏輯更接近人類時，Google 已經在思考，如何讓 AI 像電力一樣，低廉且隱形地流經每一塊電路板。

第四章：未知勝負與未解之局

在這場關于“效率”與“主權”的突襲戰中，計分板上的數字正在發生微妙的漂移。根據 Design News 在 2026 年 3 月底發布的行業分析，AI 技術的突破正在以超乎預期的速度削減部署成本。

這種削減不僅發生在云端機房，更發生在離散的、邊緣的每一個節點。目前的競爭格局已經清晰：

Google 通過 Gemma 4確立了在端側生態位上的統治力。當一個開發者在沒有網絡連接的情況下，依然能利用手機端的 E4B 模型進行復雜的圖像語義理解，且電池消耗僅僅下降了幾個百分點時，Google 就已經在“裝機權”上贏下一局。

這種“軟硬一體”的先發優勢，正在讓 Android 系統變成一個巨大的、由開源模型驅動的神經系統。然而，中國廠商并沒有在算力的賬本前退縮。

DeepSeek-V4 與 Qwen 3.5 的存在，證明了即便是在參數效率極高的時代，對于“重型邏輯”和“工業級精度”的需求依然旺盛。只要企業還需要處理百萬行代碼，只要科研還需要在公理叢林中尋找路徑，中國模型在邏輯護城河內的統治力便難以動搖。

真正的變數在于 Apache 2.0 協議。當 Google 徹底推倒許可權的高墻，原本在各陣營間搖擺的企業級用戶，開始意識到“數字主權”的價值。在未來的 24 個月里，競爭的重點將 from “誰的模型更聰明”，轉向“誰的模型更不容易被收割”。

這場關于 31B 與超大參數規模的對撞，本質上是一次關于 AI 本質的重新定義。它不再是實驗室里的貴重擺設，也不再是只有巨頭才能負擔的昂貴博弈。

2026年4月3日，距離 Gemma 4 發布不到 48 小時。

在舊金山的一間共享辦公空間里，一名獨立開發者正試著在斷網狀態下，通過一部 Pixel 手機運行實時語音翻譯。屏幕上的文字跳動得飛快，推理速度比上一代提升了整整 4 倍。而在地球的另一端，杭州的一家物流初創企業，正利用 Qwen 3.5 自動生成的代碼重新部署其核心調度系統。

這兩幕場景背后，是兩套截然不同的計算哲學：一個是極致的口袋化，一個是極致的生產力。當智能像電力一樣，以近乎零成本的姿態流經每一塊單片機和顯存時，誰是排行榜上的第一已經不再重要。

重要的是，在這場算力與邏輯的戰爭中，昂貴的智能正在變成一種廉價的公共資源。這一年，端側 AI 的全球滲透率預測將首次突破 35%。大模型的上半場在云端云霧繚繞，而下半場，正悄無聲息地落進每一個人的口袋里。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

完球了，GPT-4o之母宣布離職OpenAI

量子位 2026-04-07 17:19:50
1 跟貼 1
羅福莉：Claude訂閱封殺龍蝦背后，真正的出路不是更便宜的token

機器之心Pro 2026-04-07 10:48:02
3 跟貼 3

Claude災難級大宕機，全球開發者集體炸鍋！Anthropic三連翻車被怒噴

新智元 2026-04-07 13:48:58
3 跟貼 3

谷歌用一堆不賺錢的AI小玩意，給科技圈上了一課

機器之心Pro 2026-01-26 14:47:02
43 跟貼 43
免費無限用！谷歌上線了一款AI語音轉寫神器

智東西 2026-04-07 19:09:17
1 跟貼 1

安卓之父重返機器人賽道：這次，他要在東京造真正的Android

DeepTech深科技 2025-11-13 21:33:55
0 跟貼 0

女子路上碰瓷，不料碰到鋼板上了，大哥壓根不吃這一套！

一萬根韭菜 2026-04-07 04:15:36
40 跟貼 40
安卓也能給蘋果 Airdrop，實測 Pixel 9 Pro 傳照片

愛范兒 2026-04-02 21:57:11
1 跟貼 1

【美股盤前】布油突破110美元/桶；Anthropic與谷歌和博通達成千億美元芯片交易；SpaceX計劃6月初進行IPO路演；折疊屏iPhone遭遇工程

每日經濟新聞 2026-04-07 17:38:09
0 跟貼 0
他們全員6點下班，卻讓硅谷脊背發涼

獸樓處 2026-04-06 17:12:07
0 跟貼 0
99%做硬件的老方法注定是死局

虎嗅APP 2026-03-31 00:22:12
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
13 跟貼 13
男子手機被搶，網速快的大爺選擇不追，結果被搶的竟是自己手機

南陽日報 2026-04-05 19:50:34
0 跟貼 0
比吸煙還可怕的九大習慣，一坐就是一整天，50%的人都中槍！

筆記的旅途 2026-04-07 08:44:07
0 跟貼 0
騰訊《怪物獵人：旅人》開啟「啟程測試」招募，米哈游創始團隊向上海交大捐資

游戲頭條 2026-04-05 08:02:53
0 跟貼 0
男子理發付款，魔鬼算法把老板娘繞進去，最后竟然還賺錢了

企鵝愛聊生活 2026-04-04 09:15:52
0 跟貼 0
我的手機哪去了

大美臨城追夢 2026-04-04 07:56:11
0 跟貼 0
醫生讓爺爺戒酒，體檢報告讓醫生震驚，老人：真沒喝霧化了三瓶

四海為家旅行攻略 2026-04-06 09:46:36
0 跟貼 0
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
1 跟貼 1
大爺打電話手機拿反了，本想提示一下，結果意想不到！

爆笑小蜜蜂 2026-04-04 14:25:47
1 跟貼 1
安徽女童失蹤后續，作案幾分鐘，拿手機卻無法求救，3大疑點曝光

妙娛連珠 2026-04-07 18:42:29
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
68萬一個的手機，當小姐姐蹲下的那刻，瞬間感覺都值了！

老沾看生活 2026-04-03 15:57:24
0 跟貼 0
046中考數學真題，求一個令分數表達式為整數的參數值，整除問題

我服子佩 2026-04-06 13:39:49
1 跟貼 1
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2610 跟貼 2610
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
901 跟貼 901
別被忽悠了！這款AI手機就是「智商稅」，骨子里只是個安卓APP

雷科技 2025-12-28 14:28:22
26 跟貼 26
為了不跟龍蝦搶電腦用，有人開始造Agent專屬的“三無”硬件

量子位 2026-04-05 10:16:52
4 跟貼 4
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2008 跟貼 2008
內容投毒，工作埋坑，打工人開始用「魔法」對抗Skill煉化？

雷科技 2026-04-07 21:42:51
0 跟貼 0
男子在河邊發現一只死掉的“放生魚”，魚鰭上被系著一個布袋

罕天宇 2026-04-05 11:49:20
3 跟貼 3
為什么老師不讓同學們私下建群？

多巴安工作室 2026-04-07 20:33:48
3 跟貼 3
倆女生街頭遇黑人男子后主動要求合影

奇聞吉 2026-04-05 09:32:40
24 跟貼 24
微商入局AI圈：靠賣課、傳銷、空氣幣瘋狂斂財，收割手段全揭秘

雷科技 2026-04-07 21:48:25
0 跟貼 0
廢除漢字幾十年后，韓語終于被確診“中國拼音”，韓國人又破防了

新一說史 2026-04-07 20:53:00
0 跟貼 0
姑娘大街上直播跳舞，硬件條件太差了，想復制阿梓的路不可能

矜寡愛時尚 2026-04-06 09:17:05
0 跟貼 0
安徽6歲女童失蹤，新線索曝光，手機在菜地溝找到，奶茶店主發聲

小孟家居生活 2026-04-07 00:51:44
0 跟貼 0
午夜庭院驚魂：手機刷不停，秋千自舞嚇人夜

預言與夢u 2026-04-06 04:01:07
0 跟貼 0
網友用毛線給好朋友做了個手機包，這下手機不會總摔了，網友@閨蜜：我的手機不知道為什么總是摔

重慶科教融媒體 2026-04-06 21:01:43
0 跟貼 0

鈦媒體APP

獨立財經科技媒體

131859文章數 862072關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

房產

健康

手機

藝術

手機 / 數碼

房產 / 家居

谷歌推出最強手機端開源模型Gemma4 E2B/E4B

滿嘴謊言！OpenAI奧特曼黑料大起底

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世 被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

科普｜科學備孕，需要做好哪些孕前檢查？

重磅！三亞擬出安居房新政！

干細胞抗衰4大誤區,90%的人都中招

4月21日的手機圈，不敢想象會有多刺激

美麗風光看不盡

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大極狐首款MPV問道V9靜態體驗

科普｜科學備孕，需要做好哪些孕前檢查？

重磅！三亞擬出安居房新政！

4月21日的手機圈，不敢想象會有多刺激