網易首頁 > 網易號 > 正文申請入駐

Google把Gemma 4算力成本砍了6倍，開發者卻更怕賬單了

2026-04-05 04:00:44　來源: 字節漫游指南

北京舉報

分享至

去年Gemma 3發布時，作者飛去巴黎看了現場演示。回來自己跑測試，發現演示沒騙人——這是第一個真正追上商業大模型的開源模型。然后他干了一件蠢事：周末在Vertex AI上部署測試，忘了關，回來賬單教他重新做人。

這次Gemma 4發布，作者選了Cloud Run。這玩意兒不用的時候自動縮到零，忘了關？隨便你，一分錢不收。

26B參數的"障眼法"

Gemma 4這次發了四個型號，不是四個版本，是四個完全不同的模型。兩個小的（E2B、E4B），兩個大的（E9B、E26B）。

26B那個值得細說。它用了MoE（混合專家）架構：硬盤里存著260億參數，推理時每個token只激活40億。像醫院會診，不是全院醫生都跑來，只叫相關科室。能力接近26B模型，算力成本跟4B差不多。

作者測了推理開銷。同樣任務，全量26B和MoE 26B的差距，體現在賬單上是倍數關系。

多模態這次也補上了。圖片、音頻、視頻都能進，出的是文字。小模型帶音視頻理解，大模型搞長上下文圖像。但對做Agent的人來說，真正值錢的是后面兩個：推理能力和函數調用。

Agent管道的兩塊拼圖

推理能力指模型先拆解問題、一步步想，再出答案。以前這種活只能找GPT-4級別的模型，現在Gemma 4能干了，成本差一個數量級。函數調用改進更實在——模型能穩定返回結構化工具調用，這是Agent編排多步驟的前提。

這兩個能力湊一塊，Gemma 4才能塞進自動化流程里當齒輪用，而不是當個聊天框。

作者把部署拆成兩部分：先講Gemma 4是什么、為什么自己跑模型能改變你能做什么、技術棧怎么搭、他自己的性能數據。第二部分是純實操：前置條件、VPC配置、模型上傳、四個尺寸的部署命令、清理步驟。

Cloud Run的"自動關機"邏輯

重點在Cloud Run的"縮放到零"。傳統部署模型，實例跑著你就在燒錢，不管有沒有請求。Cloud Run沒流量時實例數降到零，重新有請求時冷啟動。對推理服務來說，冷啟動時間決定了這方案能不能用。

作者測了。Gemma 4的冷啟動在可接受范圍內——具體數字他沒在導讀里放，但暗示了"比你想的快"。

四個模型的部署命令略有不同，主要是內存和CPU配置。E2B最小，E26B需要顯存規劃。VPC setup是為了模型文件的安全傳輸，不上公網。

清理步驟他寫得特別細。顯然去年的賬單創傷還沒好。

文章最后沒給總結，停在一個問題上：當你的模型能自動關機、按需喚醒，你會把它用在什么以前不敢想的地方？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

“Claude Code更新廢了”！思考深度降67%，無法勝任復雜工程任務

量子位 2026-04-07 14:07:07
0 跟貼 0
Claude Code一周份額，一天燒完一半？有人逆向工程發現了7個bug

機器之心Pro 2026-04-07 17:34:08
0 跟貼 0

鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0

谷歌用一堆不賺錢的AI小玩意，給科技圈上了一課

機器之心Pro 2026-01-26 14:47:02
43 跟貼 43
完球了，GPT-4o之母宣布離職OpenAI

量子位 2026-04-07 17:19:50
5 跟貼 5

免費無限用！谷歌上線了一款AI語音轉寫神器

智東西 2026-04-07 19:09:17
1 跟貼 1

【美股盤前】布油突破110美元/桶；Anthropic與谷歌和博通達成千億美元芯片交易；SpaceX計劃6月初進行IPO路演；折疊屏iPhone遭遇工程

每日經濟新聞 2026-04-07 17:38:09
0 跟貼 0
他們全員6點下班，卻讓硅谷脊背發涼

獸樓處 2026-04-06 17:12:07
0 跟貼 0

DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
四島連接方案引爭議：從大陸視角看臺省統派折中論調的荒謬

獨夫之心 2026-04-07 03:06:50
36 跟貼 36
2026企業AI大考：別秀PPT，亮出你的「用蝦」真功夫

36氪 2026-04-07 20:54:15
0 跟貼 0
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
1 跟貼 1
告別昂貴賬單，Token直降68%，多智能體動態協作編程來了

機器之心Pro 2026-04-07 13:16:40
0 跟貼 0
7個頂級AI集體撒謊，為救“同伴”篡改文件、偷運數據

鈦媒體APP 2026-04-07 11:01:25
0 跟貼 0
046中考數學真題，求一個令分數表達式為整數的參數值，整除問題

我服子佩 2026-04-06 13:39:49
1 跟貼 1
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2639 跟貼 2639
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
901 跟貼 901
內容投毒，工作埋坑，打工人開始用「魔法」對抗Skill煉化？

雷科技 2026-04-07 21:42:51
0 跟貼 0
廢除漢字幾十年后，韓語終于被確診“中國拼音”，韓國人又破防了

新一說史 2026-04-07 20:53:00
0 跟貼 0
微商入局AI圈：靠賣課、傳銷、空氣幣瘋狂斂財，收割手段全揭秘

雷科技 2026-04-07 21:48:25
0 跟貼 0
蒸餾同事skill火了，我想蒸餾老板，可以嗎？

混沌學園官方 2026-04-07 20:18:44
0 跟貼 0
浙江仙通：2025年度凈利潤約2.22億元，同比增加29.22%

每日經濟新聞 2026-04-07 21:11:09
0 跟貼 0
英特爾盤前拉升一度漲超3%，現漲超2%

每日經濟新聞 2026-04-07 21:33:29
0 跟貼 0
郭德綱千萬流量砸場！尚筱菊被哈欠逼出絕活，3秒搶空全是狠勁

茶喝多了睡不著 2026-04-07 07:09:06
6 跟貼 6
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
25 跟貼 25
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
59 跟貼 59
燒Token成KPI，8.5萬Meta員工狂刷60萬億Token，爭榜一大哥

機器之心Pro 2026-04-07 13:24:24
0 跟貼 0
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
183 跟貼 183
不止055！神秘水泥模型曝光，中國2萬噸巨艦要來了？

因果 2026-04-06 20:39:40
0 跟貼 0
玄甲（AgentWard）全鏈路防御操作系統正式發布

機器之心Pro 2026-04-07 13:58:00
0 跟貼 0
科技巨頭集體押注自研芯，AI芯片戰場正加速向推理端遷移

華爾街見聞官方 2026-04-07 21:48:40
0 跟貼 0
AI邪修時刻！Meta聯手MIT投毒，左腳踩右腳強行升天

新智元 2026-04-07 09:43:43
0 跟貼 0
夏航季東航將采用國產大飛機C919執飛上海航線

黑龍江新聞網 2026-04-06 22:32:19
906 跟貼 906
風箏-交通員叛變，竟帶著機密文件投誠，看鄭耀先如何應對

龍耀影視 2026-04-07 08:15:51
1 跟貼 1
廣汽憋了3年的電子架構，終于舍得拿出來見人

爬蟲飼養員 2026-04-07 21:09:52
0 跟貼 0
上海一公園內，游客爬上櫻花樹拍照，結果整棵樹倒下！網友：不堪重婦！

上觀新聞 2026-04-07 16:33:38
35 跟貼 35
中國3月外匯儲備33421.23億美元

界面新聞 2026-04-07 16:08:50
282 跟貼 282

手機 / 數碼

房產 / 家居

Google把Gemma 4算力成本砍了6倍，開發者卻更怕賬單了

26B參數的"障眼法"

Agent管道的兩塊拼圖

Cloud Run的"自動關機"邏輯

滿嘴謊言！OpenAI奧特曼黑料大起底

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世 被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

雅致愜意 感知生活之美

重磅！三亞擬出安居房新政！

干細胞抗衰4大誤區,90%的人都中招

美麗風光看不盡

地理教材上五種交通運輸方式的比較是不是過時了？

女首富陳麗華離世被曝生前已分好遺產

不止是大極狐首款MPV問道V9靜態體驗

雅致愜意感知生活之美