![]()
你花三個月研究顯卡參數,最后發現隔壁用五年前的筆記本跑得比你還快。這不是段子,是Google Gemma 4發布一周后,本地AI圈的真實寫照。
4月2日,Google甩出四款新模型,最小的E2B版本只要1.5GB內存。什么概念?Raspberry Pi能跑,舊手機能跑,你抽屜里吃灰的備用機大概率也能跑。一位用戶在LM Studio社區反饋:「我的2019款MacBook Pro終于不用當暖爐了。」
參數迷信的破產現場
本地大模型的敘事一直很擰巴。一邊告訴你「7B起步,13B能用,70B才好用」,一邊讓你的錢包和電表一起崩潰。我認識的開發者里,有人為了跑Qwen-72B,專門配了塊48GB顯存的顯卡,結果推理時風扇噪音像直升機起降。
Gemma 4的打法是反著來的。E2B(Effective 2B)專注速度,E4B瞄準移動端,E9B和E27B覆蓋桌面到工作站。Google沒有公布具體訓練數據規模,但強調架構與Gemini 3同源——換句話說,你用1.5GB內存拿到的,是 frontier-level(前沿級)架構的縮水版,不是邊角料。
關鍵區別在于「有效參數」這個概念。傳統模型堆的是總參數量,Gemma 4系列玩的是激活效率。同樣2B級別的計算,E2B的實際內存占用只有同類模型的三分之一。一位Hugging Face工程師在技術解析里打了個比方:「以前買沙發看總體積,現在看坐下時實際占用的空間。」
這種設計直接改寫了硬件門檻的公式。LM Studio的下載數據顯示,Gemma 4發布72小時內,E2B版本的Windows安裝包下載量超過了同期所有7B模型的總和。用戶用腳投票的速度,比任何評測都誠實。
LM Studio的「傻瓜化」助攻
模型再小,部署麻煩也是白搭。Gemma 4的第二個殺招是生態同步——LM Studio在發布當天就完成了適配,量化版本(INT4/INT8)一鍵下載。
我實測了E4B在M1 MacBook Air上的表現。8GB內存的機器,同時開著Chrome十幾個標簽頁,E4B的token生成速度穩定在每秒18-22個。作為參照,同設備跑Llama-3-8B的Q4量化版,速度掉到每秒8個,且風扇狂轉。
更隱蔽的優勢是上下文窗口。E9B和E27B支持128K token,E4B也給到了64K。這意味著你可以扔進去一本中篇小說讓它總結,而不用像玩俄羅斯方塊一樣刪減提示詞。本地模型的實用性,終于從「玩具級」跨進了「工具級」。
Google這次的產品矩陣很克制,沒有搞「一個模型打天下」的噱頭。E2B給邊緣設備,E4B給手機/平板,E9B給普通筆記本,E27B給有獨立顯卡的工作站。每檔硬件都有對應選項,且相鄰檔位的能力差距可控,不會讓你產生「加錢上更高配」的焦慮。
誰該現在動手?
三類人最適合立刻嘗試。
第一類是「顯卡觀望黨」。你盯著RTX 4090的價格曲線看了半年,每次想下單都怕下個月出新款。Gemma 4的E9B在RTX 3060 12GB上能跑到每秒35 token,足夠處理日常文檔分析和代碼輔助。這筆錢可以暫時省下了。
第二類是「隱私偏執狂」。你的數據不能出本地,但之前的本地模型要么太蠢,要么太卡。E4B的代碼能力在HumanEval基準測試中接近CodeLlama-7B,數學推理超過Phi-3-mini。夠用,且完全離線。
第三類最意外——「舊設備復活者」。我測試了E2B在一臺2017年的ThinkPad X1 Carbon上的運行,8GB內存,核顯,Windows 10。結果能流暢處理郵件分類和會議紀要整理。這臺機器的二手殘值不到800塊,現在成了專用AI終端。
當然,短板也存在。E2B和E4B的多輪對話連貫性明顯弱于云端大模型,復雜推理任務會突然「失憶」。E27B雖然能力最強,但27B的有效參數在本地部署時,對內存帶寬的要求依然不低——DDR4筆記本內存會成為瓶頸,DDR5或統一內存架構(Apple Silicon)體驗更好。
Google沒有公布Gemma 4的訓練成本,但從發布時間線看,這很可能是Gemini 3訓練過程中的「副產品」蒸餾而來。如果是這樣,它的商業邏輯就通了:用邊際成本極低的輕量模型,搶占端側AI的入口,同時為云端Gemini導流。
一個值得玩味的細節是許可協議。Gemma 4延續了Gemma系列的開放權重,但增加了對「超過7億用戶的產品」的額外限制。Google在防范什么很明顯——防止某個超級App直接套殼,做出下一個「安卓時刻」的壟斷者。
LM Studio的社區里,已經有開發者用E4B搭建了完全離端的個人知識庫。流程不復雜:OCR掃描紙質筆記→向量化存儲→E4B負責檢索和生成摘要。整套系統跑在一臺iPad Pro上,電池續航6小時。
這種場景在半年前還是科幻。現在你只需要下載一個2.3GB的文件,點三次鼠標。
硬件軍備競賽的敘事正在失效。當1.5GB模型能在樹莓派上跑出可用的智能,「算力即正義」的信仰還剩多少保質期?你的抽屜里,有沒有一臺被遺忘的設備,正等著被重新激活?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.