品玩4月17日訊,階躍星辰(StepFun)正式發(fā)布新一代語音生成模型StepAudio 2.5 TTS。該模型面向Agent時(shí)代構(gòu)建,突破傳統(tǒng)語音合成技術(shù)局限,致力于實(shí)現(xiàn)從單純的“復(fù)現(xiàn)聲音”向深層次的“創(chuàng)造表達(dá)”跨越,賦予語音合成模型真正理解人類意圖的能力。
StepAudio 2.5 TTS具備三大核心能力:一是全局語境控制,支持通過自然語言定義整段語音的情緒基調(diào)、角色狀態(tài)及場景氛圍,確保表達(dá)的連貫性與統(tǒng)一性;二是文中語境控制,能夠精準(zhǔn)調(diào)節(jié)語氣、節(jié)奏、停頓及呼吸感,細(xì)膩刻畫角色的心理活動(dòng)與潛臺(tái)詞;三是零樣本復(fù)刻與全音色控制,無需重新訓(xùn)練即可保留目標(biāo)音色特征,并靈活調(diào)節(jié)情感與風(fēng)格。
該模型現(xiàn)已全量上線階躍星辰開放平臺(tái)及Step Plan,支持非流式與流式語音合成等多種接口方式,旨在為有聲書制作、影視配音及智能交互等場景提供具備真人級(jí)表現(xiàn)力的語音解決方案。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.