近日,豆包APP實(shí)時(shí)語(yǔ)音通話功能升級(jí),上線全雙工語(yǔ)音大模型Seeduplex 。據(jù)介紹,作為原生全雙工端到端語(yǔ)音大模型,Seeduplex 能夠在復(fù)雜聲學(xué)場(chǎng)景下實(shí)現(xiàn)精準(zhǔn)抗干擾與動(dòng)態(tài)判停,提供更順暢、更自然的語(yǔ)音交互體驗(yàn)。
此次更新后,豆包實(shí)時(shí)語(yǔ)音通話功能在對(duì)話自然度、響應(yīng)速度和抗干擾能力等方面均有提升。
記者實(shí)測(cè)發(fā)現(xiàn),升級(jí)后的豆包語(yǔ)音通話在復(fù)雜環(huán)境下表現(xiàn)出較強(qiáng)的抗干擾能力,即便周?chē)嬖谌寺暫驮胍舾蓴_,也能較準(zhǔn)確地識(shí)別用戶語(yǔ)音,不易被無(wú)關(guān)聲音帶偏。以餐廳、展覽等易出現(xiàn)多人交談的場(chǎng)景為例,過(guò)往 AI 產(chǎn)品容易因背景噪音或旁人說(shuō)話聲出現(xiàn)誤打斷、誤回復(fù)等情況;此次升級(jí)后,豆包對(duì)無(wú)關(guān)聲音的過(guò)濾能力有所增強(qiáng),對(duì)話過(guò)程也更不容易被人聲意外打斷。
除抗干擾能力外,升級(jí)后的語(yǔ)音對(duì)話節(jié)奏也更接近自然交流。人與人對(duì)話中,停頓并不總意味著發(fā)言結(jié)束。此次升級(jí)后,豆包可結(jié)合語(yǔ)音與語(yǔ)義信息判斷用戶是否仍在繼續(xù)表達(dá),從而減少對(duì)話中的“搶話”現(xiàn)象。與此同時(shí),對(duì)話響應(yīng)時(shí)延也進(jìn)一步降低,在接龍、飛花令等高頻互動(dòng)場(chǎng)景中表現(xiàn)更為明顯。
目前,這一能力已在豆包 APP上線。用戶可點(diǎn)擊“打電話”按鈕,開(kāi)啟實(shí)時(shí)語(yǔ)音通話功能體驗(yàn)。
![]()
雷峰網(wǎng)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.