![]()
一個2.54GB的AI模型,在iPhone上跑起來是什么體驗?Google剛上線的AI Edge Gallery給了答案:不是幻燈片,是真能用。
這是Google第一次給自家Gemma模型做官方iOS客戶端。之前你想在手機端試本地大模型,要么折騰開源工具,要么用第三方套殼。現(xiàn)在Google親自下場,把Gemma 4的E2B和E4B兩個尺寸打包成App,連Gemma 3的部分型號也塞進去了。
2.5GB的模型,怎么做到不卡的
E2B模型下載包2.54GB,這個體積放在移動端不算小。但運行起來"fast and genuinely useful"——這是Simon Willison的原話,他很少夸Google的產(chǎn)品。
本地運行的好處很實在:沒網(wǎng)也能用,對話不上傳云端,響應(yīng)延遲比云端模型低一個數(shù)量級。代價是占存儲、吃算力。Google的解法是把模型壓到手機能承受的臨界點,然后靠iOS的神經(jīng)網(wǎng)絡(luò)引擎硬扛。
功能層面,App做了三件事:看圖說話、30秒語音轉(zhuǎn)文字、以及一個叫"skills"的工具調(diào)用演示。
那個會凍結(jié)App的"skills"實驗
skills模塊放了8個交互小部件,每個都是HTML頁面:地圖、廚房冒險、哈希計算、文本旋轉(zhuǎn)器、情緒追蹤器、密碼生成器、維基百科查詢、二維碼生成。
設(shè)計思路很明顯:讓模型學會調(diào)用工具,而不是只會聊天。你問"附近有什么博物館",模型能直接操作地圖組件;說"幫我生成一個記得住的密碼",它調(diào)用密碼生成器并給出口訣。
但Willison踩了個雷:追加提問時App直接凍結(jié)。本地模型的工具調(diào)用鏈條一長,穩(wěn)定性還是問題。
Google沒說的那個遺憾
對話記錄不保存。每次關(guān)掉App,上下文清零。這個設(shè)計很Google——先讓你嘗個鮮,完整體驗等下一代。
對比云端產(chǎn)品,本地模型的商業(yè)邏輯完全不同。沒有API調(diào)用費,沒有訂閱分層,純靠硬件性能說話。Google愿意官方推這個,說明Gemma的端側(cè)優(yōu)化到了能見人水平。
一個細節(jié):App名字被Willison吐槽"Terrible name"。AI Edge Gallery,既不像ChatGPT那樣直接,也不像Copilot有功能暗示。Google的產(chǎn)品命名玄學,又一次應(yīng)驗。
本地大模型上手機,去年還是極客玩具,今年變成大廠標配。Apple Intelligence、高通NPU、現(xiàn)在加上Google Gemma——手機AI的戰(zhàn)場,正在從云端往芯片層遷移。你的下一部手機,存儲空間可能要按模型數(shù)量來買了?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.