![]()
谷歌今天把Gemma 4端上桌了。這模型最狠的不是參數,是胃口——140億參數的活兒,一張H100就能吞下去。以前跑這種規模的模型,你得湊一桌顯卡開席,現在單卡solo就行。
谷歌在AI Studio里直接開了免費試玩,模型權重也往Hugging Face扔了。但老玩家都懂,谷歌放模型向來是"先開槍再畫靶",Gemma系列之前幾次更新,社區反饋都是"能用,但沒必要"。這次把效率卷到這種程度,擺明了是沖著端側和中小開發者去的。
有個細節挺扎心:Gemma 4的27B版本在單卡性能上,已經能跟Llama 3的70B掰手腕。谷歌自己曬的基準測試圖里,數學和代碼題的正確率漲了兩位數。一位在Hugging Face下面留言的開發者說:「終于不用為了省算力,把模型砍成智障版了。」
不過谷歌沒說的是,這種"單卡奇跡"很大程度上靠了量化壓縮的暴力美學——模型精度有沒有暗傷,還得等社區喂一波真實數據才知道。目前AI Studio的免費額度已經有人排隊,Hugging Face的下載量兩小時破了五位數。
最尷尬的是英偉達。H100本來是數據中心的大鍋飯,現在被谷歌調教成單人小灶。老黃去年還在財報會上說"算力永遠不夠",今天Gemma 4的發布稿里,谷歌產品副總裁專門加了一句"感謝英偉達硬件支持"——場面話,但聽著像補刀。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.