品玩2月10日訊,據實況網報道,聲網與美團、xbench聯(lián)合發(fā)布了AI語音外呼行業(yè)的首個評測基準VoiceAgentEval。
其評估語料庫完全基于真實的外呼業(yè)務數據構建,摒棄傳統(tǒng)固定腳本,覆蓋六大業(yè)務領域的30個子場景。評測采用文本與語音雙維度評估體系,不僅考核AI對話的邏輯正確性,也全面評估其在語音交互中的綜合表現。
為嚴格測試AI的任務遵循與通用交互能力,該框架還通過用戶模擬器構建了150種虛擬對話場景進行壓力測試。據悉,基于這一新標準,目前已初步甄選出在該場景中綜合性能排名前三的模型,為行業(yè)設立了明確的技術標桿。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.