![]()
語音轉文字這件事,有點像請一個速記員坐你旁邊——理想情況下他該聽懂你的意思,而不是把你結巴的"那個那個"也記下來。
谷歌最近悄悄在 iOS 上放了個叫"Google AI Edge Eloquent"的應用,專干這事。免費下載,裝完再把基于 Gemma 的語音識別模型拽到本地,手機就能離線干活。實時出文字,按暫停時自動幫你把"嗯""啊"這些填充詞剃掉,順便潤色一遍。
底下擺著幾個按鈕:要點、正式化、精簡、詳細。點一下,同一段話能變會議紀要,也能變周報體。
有意思的是云端開關。關掉它,所有處理都在本地完成;打開則調用 Gemini 云端模型做更深度的優化。還能從 Gmail 里扒你的專屬詞庫——人名、術語、黑話,或者手動往里塞。
歷史記錄、全文搜索、語速統計這些基礎功能也都有。上次說了多少字、每分鐘蹦出幾個詞,應用給你記著。
谷歌在商店里的描述挺直接:普通聽寫是"逐字記錄卡頓和填充詞",Eloquent 要的是"精準捕捉核心意圖"。這話聽著像踩同行,但確實戳中痛點——誰也不想發出去的語音轉文字里全是"呃……我是說……那個……"。
目前只有 iOS 版,但介紹里已經畫了安卓的餅:要做成默認鍵盤,全系統隨處調用,再加個懸浮按鈕隨時喚醒。這套打法和 Wispr Flow 在安卓上的路子很像。
語音轉錄這條賽道最近越來越擠。模型小了、快了、準了,用戶自然開始挑剔——不僅要轉得對,還要轉得懂人話。谷歌這次拿了個實驗性產品下場,顯然是看準了這個趨勢。
一位提前試用的用戶在 App Store 評論區寫道:"終于不用手動刪自己的口癖了,雖然它偶爾會把我的停頓理解成句號。"
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.