![]()
Google上周在iOS商店悄悄丟了個新東西——「Google AI Edge Eloquent」。沒預熱,沒發布會,連官方博客都懶得寫。這很Google:好東西先藏著,等用戶自己挖出來。
但數據不會說謊。語音轉寫賽道里,Otter.ai月費16.99美元,Rev按分鐘計費,蘋果原生聽寫雖然免費,卻離不開云端。Eloquent的打法像是個故意找茬的插班生:完全離線、零訂閱、用量無上限。產品經理出身的我,第一反應是——這商業模式怎么跑通?
實時轉寫+一鍵潤色:語音App的「兩步走」
打開App,界面干凈得不像Google出品。底部一個大紅按鈕,按住說話,波形圖跟著跳動,文字實時蹦出來。松手后,真正的戲才開始——系統用幾秒「思考」,把口語化的碎片整理成通順文本,自動復制進剪貼板。
這個「暫停-整理」的設計很討巧。市面上多數工具追求「邊說邊出字」,結果滿屏語氣詞和斷句災難。Eloquent選擇先錄后理,犧牲3秒延遲,換來可讀性躍升。工具欄提供四個變形選項:提取要點、正式化、縮短、擴充。我試了一段會議錄音,「那個」「嗯」被批量清除,數據術語保留原樣。
右上角有個開關,打開后進入「完全離線」模式。此時音頻不出設備,連Google服務器都碰不到。代價是潤色功能降級——本地模型 vs 云端Gemini的差距,大概相當于手機修圖和Photoshop的區別。
個人詞典:從Gmail偷師你的口頭禪
語音轉寫的死穴是人名和行話。Eloquent的解法很產品經理思維:允許自建詞典,還能登錄Google賬號,從近期發出的Gmail里抓取高頻詞匯。我的測試賬號導入了37個專有名詞,包括一家拼寫詭異的丹麥客戶公司名——轉寫準確率從「災難級」拉到可用。
歷史記錄頁按時間軸排列,支持刪除和重新編輯。統計面板顯示總字數、平均語速、使用時長,數據控會喜歡這種「量化自我」的顆粒度。但缺少文件夾分類和搜索,重度用戶遲早會罵。
Google把這款App歸類為「AI Edge」系列——專指端側AI體驗。同門師兄是AI Edge Gallery,一個讓用戶下載開源模型Gemma的實驗平臺。Eloquent的發布時機微妙:Gallery上周剛更新,支持Gemma 3的新版本。兩款App共用一套端側推理框架,技術復用的痕跡明顯。
免費午餐能吃多久?
「無訂閱、無上限」的承諾寫在App Store副標題里,醒目得像挑釁。但Google的免費歷來有條件。Eloquent的隱私條款埋著伏筆:離線模式關閉時,音頻片段可能用于「改進服務」——翻譯過來就是訓練數據。
更現實的疑問是安卓版本。截至發稿,Play Store查無此App,Google發言人未回應平臺獨占原因。iOS優先的逆操作,在Google產品史上不多見。一種猜測是蘋果設備的神經網絡引擎(Neural Engine)標準化程度高,端側部署成本更低;另一種更陰暗:先在小眾平臺試水,罵聲小了再擴圈。
競品們此刻的心情應該復雜。Otter.ai去年剛裁員30%押注企業市場,Rev的轉寫員時薪訴訟還沒打完。Eloquent的免費策略像塊石頭丟進池塘,漣漪方向不明,但水里的魚都感覺到了。
我注意到一個細節:App Store評分區有條中文評論,用戶抱怨離線模式下「增強潤色」按鈕變灰,怒打一星。開發者回復稱「云端Gemini需要聯網,這是技術限制而非功能閹割」。這種坦誠在Google產品里罕見——通常他們選擇沉默,等用戶自己悟。
語音交互的終局是什么?是Siri式的全能管家,還是Eloquent這樣的垂直工具?Google這次沒給答案,只給了一個免費選項,和一道選擇題:你愿意用隱私換便利,還是忍受離線模式的「笨」?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.