![]()
200萬。這是Gemma 4上線7天的下載量,而它的前輩Gemma 3花了一年才攢到670萬。
更刺眼的是對比:阿里Qwen 3.5的旗艦模型發布1.5個月,總下載量2700萬——但那是包含3970億參數的云端巨獸。Gemma 4的兇猛在于,它讓普通人手里的iPhone變成了能跑40 token/秒的本地AI引擎。
從"跑分冠軍"到"即插即用"
Hugging Face CEO Clément Delangue 的推文被反復轉發:Gemma 4登頂平臺趨勢榜,不是因為刷榜,而是"practical usability"——實用主義。
這種實用主義有具體畫面。@adrgrondin 把Gemma 4 E2B塞進iPhone 17 Pro,MLX框架下跑出40 tok/s;@enjojoyy 跟進了同樣的部署;@_philschmid 則在AI Edge Gallery里演示了用技能調維基百科查詢。Red Hat同步發布了31B版本的量化模型卡,NVFP4和FP8-block格式,指令跟隨評估已上線,推理和視覺評估待更新。
開源模型的競爭邏輯變了。過去是"我參數比你多",現在是"你能在便利店WiFi下跑起來嗎"。
訂閱經濟的裂縫
@AlexEngineerAI 的觀察很直接:本地跑的Gemma 4已經夠好用,Claude訂閱對部分人來說不再劃算。@ben_burtenshaw 補了一刀——Hugging Face托管的模型免費,能替換掉agent工作流里的付費環節。
Ollama的動作更快。Gemma 4上線Ollama Cloud,后端是NVIDIA Blackwell GPU,OpenClaw和Claude式工作流無需自建服務器就能調用。免費層在蠶食付費層的地基。
@osanseviero 列出的生態名單值得細看:Hugging Face、vLLM、llama.cpp、Ollama、NVIDIA、Unsloth、SGLang、Docker、Cloudflare……"開放模型成功"的定義正在被改寫——不是權重開源就完事,而是發布當天下游系統全部就緒。
Hermes Agent的暗線
同期還有一條被低估的線索:Hermes Agent的自我改進循環。Turing Post對比了Hermes與OpenClaw的差異,核心爭議在于開放軌跡數據(open trace data)的推進力度。agent框架的競賽,正在從"誰能調用更多工具"轉向"誰能用更少人工干預完成閉環"。
Gemma 4的200萬下載是一個信號,但信號的方向還沒完全清晰——它究竟會催生更多本地優先的獨立開發者,還是最終被云服務商的"免費層"收編?
Google三天后將在倫敦舉辦Gemma 4主題演講,議程尚未公開。一個值得追問的細節是:當端側算力足夠跑起31B模型,云廠商的定價權還能撐多久?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.