這是專門做音頻編輯的模型
核心能力:
迭代控制情緒、說話風(fēng)格、副語言
情緒可選幾十種,說話風(fēng)格包括撒嬌、老人、小孩、耳語
副語言支持 10 種標(biāo)簽:呼吸、笑聲、驚訝、嘆氣等
支持中文、英文、四川話、粵語
https://huggingface.co/spaces/stepfun-ai/Step-Audio-EditX
https://github.com/stepfun-ai/Step-Audio-EditX
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.