近日,豆包APP實(shí)時語音通話功能升級,上線全雙工語音大模型Seeduplex。據(jù)介紹,作為原生全雙工端到端語音大模型,Seeduplex能夠在復(fù)雜聲學(xué)場景下實(shí)現(xiàn)精準(zhǔn)抗干擾與動態(tài)判停,提供更順暢、更自然的語音交互體驗(yàn)。
此次更新后,豆包實(shí)時語音通話功能在對話自然度、響應(yīng)速度和抗干擾能力等方面均有提升。
記者實(shí)測發(fā)現(xiàn),升級后的豆包語音通話在復(fù)雜環(huán)境下表現(xiàn)出較強(qiáng)的抗干擾能力,即便周圍存在人聲和噪音干擾,也能較準(zhǔn)確地識別用戶語音,不易被無關(guān)聲音帶偏。以餐廳、展覽等易出現(xiàn)多人交談的場景為例,過往AI產(chǎn)品容易因背景噪音或旁人說話聲出現(xiàn)誤打斷、誤回復(fù)等情況;此次升級后,豆包對無關(guān)聲音的過濾能力有所增強(qiáng),對話過程也更不容易被人聲意外打斷。
除抗干擾能力外,升級后的語音對話節(jié)奏也更接近自然交流。人與人對話中,停頓并不總意味著發(fā)言結(jié)束。此次升級后,豆包可結(jié)合語音與語義信息判斷用戶是否仍在繼續(xù)表達(dá),從而減少對話中的“搶話”現(xiàn)象。與此同時,對話響應(yīng)時延也進(jìn)一步降低,在接龍、飛花令等高頻互動場景中表現(xiàn)更為明顯。
目前,這一能力已在豆包APP上線。用戶可點(diǎn)擊“打電話”按鈕,開啟實(shí)時語音通話功能體驗(yàn)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.