網易首頁 > 網易號 > 正文申請入駐

Google把31B模型塞進Android Studio

2026-04-04 21:01:09　來源: 灰度測試中

北京舉報

分享至

2024年4月，一個Android開發者在Reddit上吐槽：「我在飛機上改bug，Copilot斷了，我像個原始人。」這條帖子被頂了2400次。14個月后，Google的回應來了——不是補丁，是直接把一個31B參數的模型塞進你的IDE，斷網也能用。

4月2日，Gemma 4正式發布。沒有發布會，沒有 Sundar Pichai 站臺，只有一條技術博客和Android Studio里的更新提示。但開發者社區的反應是：「等等，這玩意真的在本地跑？」

是的。E2B和E4B兩個輕量版本，26B和31B兩個滿血版本，全部可以離線運行。你的代碼不再流向任何服務器，Agent Mode能跨文件改代碼、寫測試、查文檔——而這一切發生在你的筆記本上。

「云優先」是個美麗的陷阱

過去三年，AI編程助手幾乎成了標配。GitHub Copilot、Cursor、甚至Google自己的Gemini Code Assist，它們有個共同前提：你得聯網。Token配額用完？等下個月。API密鑰泄露？重新生成。企業代碼上傳云端？先過安全審查。

這些不是邊緣場景。某金融科技公司的技術負責人告訴我，他們的合規團隊花了8個月才批準使用云端AI工具——條件是「核心模塊代碼不得上傳」。最后方案是：買兩臺帶A100的本地服務器，團隊排隊用。

更隱蔽的問題是節奏控制。一個中等規模的Android項目，Agent Mode一次深度查詢可能消耗數萬Token。按OpenAI的定價，一個月輕松燒掉幾百美元。但真正的成本不是錢，是中斷——當你卡在「Rate limit exceeded」的提示前，思路斷了。

Gemma 4的本地架構直接抹掉了這三層摩擦。沒有配額，沒有密鑰，沒有網絡依賴。Google DeepMind的工程師在發布說明里寫了一句很少見的話：「核心操作無需API密鑰。」翻譯過來：我們不打算從這個功能上直接賺錢。

31B塞進筆記本，怎么做到的

Gemma 4的四個版本中，31B Dense是性能怪獸。它在LMSYS Arena排行榜上位列開源模型第三，超過Llama 3 70B和Qwen 2.5 72B。但參數只有后者的一半不到。

秘密在于訓練后優化。Google用了知識蒸餾（knowledge distillation）把Gemini 3的能力壓縮進更小的架構，再加上針對ARM芯片的量化方案。結果是：M3 Max MacBook Pro可以流暢運行E4B版本，31B在RTX 4090上響應延遲低于2秒。

但Android開發者真正該看的是E2B和E4B。這兩個版本專為邊緣設備設計，128K上下文窗口，原生支持函數調用（function calling），能處理文本、圖像、視頻、音頻的多模態輸入。E2B在Pixel 9上實測可用——雖然慢，但能跑。

一個關鍵細節：Gemma 4支持「投機解碼」（speculative decoding）。簡單說，模型會同時生成多個候選答案，用更快的草稿模型篩選，最終輸出質量不變但速度快40%。這個技術在云端大模型里常見，但在本地運行的開源模型中，Gemma 4是首批實裝的。

Agent Mode不是更聰明的補全，是另一個物種

傳統的AI編程助手是「你寫，它猜」。Agent Mode是「你說，它干」。我在Android Studio 2025.1.1 Preview里測試了Gemma 4的Agent Mode，場景是：給一個三年前的Kotlin項目加Jetpack Compose支持。

指令很簡單：「把MainActivity的XML布局改成Compose，保持原有邏輯。」Agent Mode的執行路徑是：先讀build.gradle確認依賴版本，再分析現有布局文件的結構，生成Compose代碼，最后提出需要手動調整的硬編碼顏色值。全程沒有生成無法編譯的中間狀態。

這背后是「工具使用」（tool use）能力的落地。Gemma 4在本地維護了一個符號索引，能調用Android Studio的代碼分析API、Gradle構建系統、甚至模擬器狀態。它不是在讀代碼，是在操作IDE。

Google的演示視頻里有個更激進的例子：開發者說「這個崩潰只在低內存設備上出現，幫我復現」，Agent Mode自動調低模擬器內存配置、運行測試、抓取日志、定位到Bitmap未回收的泄漏點。這個過程沒有預設腳本，是模型根據問題描述自主規劃的步驟。

代價是顯存。31B版本需要約48GB顯存才能全速運行，E4B壓縮到8GB可用。Google的解決方案是分層加載——常用代碼分析模塊常駐內存，生成功能按需喚醒。實際體驗中，16GB M3 Pro Mac的交換內存壓力明顯，但可用。

為什么是現在？

本地大模型不是新概念。Llama.cpp、Ollama、LM Studio這些工具已經存在兩年。但它們的共同問題是：模型和工具鏈脫節。你得自己下載、配置、對接IDE，Agent能力幾乎為零。

Google的賭注是：開發者愿意為「零配置」買單。Gemma 4在Android Studio里的集成深度，是第三方工具無法復制的。代碼補全、重構建議、錯誤解釋、測試生成，全部走同一套本地推理管道，上下文共享，沒有「 Copilot 和 IDE 各說各話」的割裂感。

更深層的動機可能是防御。2024年，Cursor以「AI-native IDE」的定位拿下40億美元估值，其核心賣點就是深度集成的Agent能力。Google不能讓Android開發的最佳體驗出現在別人的編輯器里。

但Gemma 4的開放程度也出人意料。模型權重在Hugging Face和Kaggle完全開源，允許商業使用，沒有「月活超過X需付費」的隱藏條款。Google的AI Studio還提供了微調接口，可以用企業私有代碼庫繼續訓練。

一位在Square工作的Android工程師告訴我，他們已經在評估用Gemma 4替代內部托管的Code Llama。「同樣的硬件，Gemma 4的Kotlin代碼質量明顯更好。而且我們不需要維護模型服務了，Android Studio自己搞定。」

誰還沒準備好

不是所有開發者都能立即遷移。Windows平臺的支持目前滯后——Gemma 4的本地優化主要針對Apple Silicon和Linux，Windows版Android Studio還需要通過WSL2迂回。Google承諾Q2解決，但時間表模糊。

更現實的障礙是硬件門檻。E4B需要至少8GB統一內存或顯存，31B版本建議32GB起步。這意味著2019年之前的Intel Mac、大多數Windows筆記本、全部Chromebook被排除在外。Google的回應是云端回退——硬件不達標時自動切到Gemini API，但這又回到了老問題。

企業采納的另一個未知數是審計。雖然代碼不出本機，但模型本身的行為是否可解釋？Gemma 4的推理過程是黑箱，生成的代碼是否包含許可證沖突的片段？Google提供了輸出溯源功能，能標記與訓練數據相似的代碼塊，但精確度有限。

Reddit上有個高贊評論：「我終于可以把Copilot訂閱停了，但我要先買臺M4 Mac。」這條回復下面有217條討論，核心分歧是：本地AI節省的訂閱費，多久能抵消硬件升級成本？

你的開發環境現在是什么配置？如果升級硬件能徹底擺脫云端AI的配額焦慮，這筆賬你會怎么算？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

易中天，獲獎勵20萬元

極目新聞 2026-04-06 21:04:19
26113 跟貼 26113
陳麗華47歲倒追遲重瑞財富傳承披露：1兒2女均在富華

極目新聞 2026-04-07 12:39:33
1721 跟貼 1721

“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2008 跟貼 2008

毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2610 跟貼 2610
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
1 跟貼 1

鄭麗文率團抵達南京開始大陸參訪行程

央視新聞客戶端 2026-04-07 19:03:20
15 跟貼 15

趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
177 跟貼 177

廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
16 跟貼 16
廣州越秀白云或現嚴重回南天！近期全省雨霧頻繁空氣濕度偏高

南方都市報 2026-04-07 10:20:10
66 跟貼 66
美國眾議院民主黨議員推動彈劾防長赫格塞思

新京報 2026-04-07 12:30:07
57 跟貼 57
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
883 跟貼 883
夏航季東航將采用國產大飛機C919執飛上海航線

黑龍江新聞網 2026-04-06 22:32:19
770 跟貼 770
賽力斯：公司不承擔其他品牌門店的建店、運營相關費用

每日經濟新聞 2026-04-07 15:53:45
10 跟貼 10
中國3月外匯儲備33421.23億美元

界面新聞 2026-04-07 16:08:50
179 跟貼 179
下個小長假，不是“五一”？！

最江陰 2026-04-07 11:07:24
248 跟貼 248
家國永念｜一個有希望的民族不能沒有英雄

國際在線 2026-04-07 10:18:15
723 跟貼 723
28年26場訪談，余華《我只要寫作，就是回家》出新版

澎湃新聞 2026-04-07 08:26:28
58 跟貼 58
張雪公布自己設計的跨界踏板車設計圖，最新回應：正在制作踏板摩托，這款踏板偏運動越野風格，售價可能比傳統的貴一點

魯中晨報 2026-04-07 17:13:05
0 跟貼 0
陳光標捐車給張雪轉而變現捐出一事透出怎樣的世故人情？

丹東曉程 2026-04-07 19:58:17
0 跟貼 0
汽車墜河致5人死亡，長汀警方通報

第一財經資訊 2026-04-07 19:54:14
0 跟貼 0
飛向月球不到48小時 "阿耳忒彌斯2號"廁所先撐不住了

澎湃新聞 2026-04-06 22:05:04
0 跟貼 0
安慶遇害6歲女童現場探訪：有村民稱其是雙胞胎中的姐姐，與嫌疑人同住一棟樓但不互通

紅星新聞 2026-04-07 19:57:22
0 跟貼 0
一條來自海外的風險預警，他們迅速行動起來

上海長寧 2026-04-07 19:53:44
0 跟貼 0

灰度測試中

生活正在重構，目前還在灰度測試階段，暫不全量發布。

881文章數 12關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

游戲

手機

時尚

手機 / 數碼

房產 / 家居

Google把31B模型塞進Android Studio

「云優先」是個美麗的陷阱

31B塞進筆記本，怎么做到的

Agent Mode不是更聰明的補全，是另一個物種

為什么是現在？

誰還沒準備好

滿嘴謊言！OpenAI奧特曼黑料大起底

英媒：伊朗最高領袖病重昏迷 無法參與任何國家決策

英媒：伊朗最高領袖病重昏迷 無法參與任何國家決策

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世 被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

干細胞抗衰4大誤區,90%的人都中招

高校官宣：教師，沒有“非升即走”！

大話西游手游通用套裝哪個好用？仙族首選容止，變身卡不再被克

華為暢享90 Pro Max升級鴻蒙6.0.0.138 SP23，新增HiCar互聯

楊超越之后，全網頭像錦鯉的C位被她搶走了

英媒：伊朗最高領袖病重昏迷無法參與任何國家決策

英媒：伊朗最高領袖病重昏迷無法參與任何國家決策

女首富陳麗華離世被曝生前已分好遺產

不止是大極狐首款MPV問道V9靜態體驗