品玩12月15日訊,據通義大模型官方消息,通義百聆宣布其語音大模型Fun-CosyVoice3與Fun-ASR完成重大升級并同步開源。此次升級聚焦核心性能與實用性,為開發者與企業提供更強大的語音AI工具。
Fun-CosyVoice3:實時、精準的語音合成
模型首包延遲降低50%,實現“輸入即發聲”。中英混說錯誤率大幅下降56.4%,并支持9種語言、18種方言及情感控制。其開源版本Fun-CosyVoice3-0.5B具備優秀的zero-shot音色克隆能力。
Fun-ASR:強悍抗干擾的語音識別
該模型在嘈雜環境下準確率達93%,新增歌詞與說唱識別功能。支持31種語言自由混說與多種中文方言,流式識別首字延遲僅160毫秒。輕量化版本Fun-ASR-Nano-0.8B同步開源,推理成本更低。
模型已在魔搭、HuggingFace及GitHub等平臺開源,支持本地部署與二次開發。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.