語(yǔ)音 AI 公司 Speechify 日前推出原生 Windows 應(yīng)用,依托本地存儲(chǔ)的 AI 模型,在系統(tǒng)層面支持跨應(yīng)用語(yǔ)音聽(tīng)寫(xiě),并可朗讀網(wǎng)頁(yè)、文檔和 PDF 等內(nèi)容。 該公司此舉正面競(jìng)爭(zhēng) Wispr Flow、Willow、Superwhisper 等同類(lèi)跨平臺(tái)聽(tīng)寫(xiě)與轉(zhuǎn)錄應(yīng)用。
![]()
Speechify 表示,這款 Windows 應(yīng)用在 Copilot+ PC(搭載 AMD、英特爾和高通 NPU 的機(jī)型)上,以及配備英特爾或 AMD GPU 的其他 Windows 11 電腦上,均可實(shí)現(xiàn)完全本地的語(yǔ)音處理,無(wú)需將音頻上傳云端。 應(yīng)用在本地同時(shí)運(yùn)行三類(lèi)模型:用于朗讀的神經(jīng)網(wǎng)絡(luò)文本轉(zhuǎn)語(yǔ)音模型、用于實(shí)時(shí)檢測(cè)用戶(hù)是否在說(shuō)話(huà)的語(yǔ)音活動(dòng)檢測(cè)模型,以及基于 Whisper 的轉(zhuǎn)錄模型。 用戶(hù)也可以在設(shè)置中切換為云端模型,或在使用過(guò)程中按需切換本地與云端處理模式。
根據(jù)公司披露的數(shù)據(jù),Speechify 在全球擁有超過(guò) 5000 萬(wàn)用戶(hù)。 其中,VITS Neural 模型可在七檔不同語(yǔ)速下生成音頻,方便用戶(hù)按個(gè)人習(xí)慣調(diào)節(jié)朗讀速度,用于聽(tīng)網(wǎng)頁(yè)、文檔或其他文本內(nèi)容。 在語(yǔ)音活動(dòng)檢測(cè)方面,Speechify 采用 Silero 開(kāi)源模型,以識(shí)別用戶(hù)何時(shí)開(kāi)始或停止說(shuō)話(huà),從而提升實(shí)時(shí)聽(tīng)寫(xiě)和轉(zhuǎn)錄的流暢度與準(zhǔn)確性。
Speechify 創(chuàng)始人兼首席執(zhí)行官 Cliff Weitzman 在聲明中表示,全球有超過(guò) 10 億人使用 Windows,隨著這款 Windows 應(yīng)用上線(xiàn),公司希望確保“閱讀,乃至寫(xiě)作,不再成為任何人工作的障礙”,無(wú)論用戶(hù)使用何種設(shè)備、偏好何種工作方式。 他特別強(qiáng)調(diào)了企業(yè)市場(chǎng)的潛力,稱(chēng)大量職場(chǎng)用戶(hù)曾經(jīng)主動(dòng)要求在 PC 上使用 Speechify,Windows 原生應(yīng)用將有助于滿(mǎn)足這部分需求。
今年 2 月,Speechify 剛剛推出類(lèi)似 Granola 的會(huì)議轉(zhuǎn)錄功能,可以在瀏覽器環(huán)境中轉(zhuǎn)錄并總結(jié)線(xiàn)上會(huì)議,但當(dāng)時(shí)該功能僅限于基于瀏覽器的會(huì)議場(chǎng)景。 隨著其跨平臺(tái)原生應(yīng)用的逐步完善,公司預(yù)計(jì)會(huì)將這一會(huì)議轉(zhuǎn)錄能力遷移到各平臺(tái)的本地客戶(hù)端,使用戶(hù)無(wú)論使用哪款會(huì)議軟件或?yàn)g覽器窗口,都能直接在系統(tǒng)層面完成會(huì)議錄音與轉(zhuǎn)錄。
在此之前,Speechify 多年間主要專(zhuān)注于文本轉(zhuǎn)語(yǔ)音場(chǎng)景,例如朗讀文章和電子郵件,或?qū)⑽臋n內(nèi)容“變成播客”供用戶(hù)收聽(tīng)。 近來(lái),該公司則著力向“全棧語(yǔ)音應(yīng)用”方向演進(jìn),相繼上線(xiàn)語(yǔ)音聽(tīng)寫(xiě)、會(huì)議轉(zhuǎn)錄以及語(yǔ)音助手等功能,嘗試覆蓋從閱讀、輸入到智能助理交互的完整語(yǔ)音使用鏈路。
https://apps.microsoft.com/detail/9n58gbx6x3vj?cid=DevShareMCLPCS&hl=zh-CN
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.