快科技4月9日消息,字節跳動正式推出原生全雙工語音大模型Seeduplex,基于"邊聽邊說"的全新架構,徹底打破傳統AI語音交互"一問一答"的局限,實現自然實時對話。
目前Seeduplex已在豆包App全量落地,成為行業內首個規模化應用的全雙工語音大模型。
![]()
Seeduplex的核心突破的是改變了傳統半雙工"聽完再說"的交互模式,真正實現了聽與說的同步處理,其中兩大核心能力得到重點突破:
精準抗干擾:模型具備持續的"傾聽"能力,從而能更好地理解用戶所處的聲學環境,準確忽略背景噪音和無關對話。在復雜場景下,相比半雙工模型,其誤回復率和誤打斷率減少了一半。
動態判停:模型能聯合語音和語義特征,綜合判斷用戶意圖,可實現更自然的對話節奏控制。面對用戶的思考猶豫,模型能耐心傾聽;在用戶說完后,又能快速響應。相比半雙工模型,其搶話比例相對下降了40%。
![]()
多維度評測顯示,Seeduplex在對話的流暢度和節奏感上,均顯著優于傳統的半雙工方案及行業主流App的語音通話功能;在判停表現上,模型相比半雙工方案提升了8%,展現出更接近自然對話的分寸感。
對話流暢度MOS分提升12%,整體通話滿意度提升8.34%,其打斷響應表現已略優于真人對話平均水平,讓人機交互更貼近自然交流狀態。
![]()
![]()
工程落地方面,該模型依托字節跳動自研LLM底座,通過架構創新、海量語音預訓練、推理優化及穩定性保障,有效解決了高并發場景下的卡頓問題,可支持億級用戶穩定使用。
目前,用戶更新至豆包App最新版,在"打電話"語音通話界面即可體驗該功能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.