![]()
3月31日,百度發布業界首個基于全新互相關注意力(Cross-Attention)的端到端語音語言大模型,實現超低時延與超低成本,在電話語音頻道的語音問答場景中,調用成本較行業均值下降約50%-90%。文小言率先接入該模型,還帶來多模型融合調度、圖片問答等功能升級。接入全新的端到端語音語言大模型后,文小言不僅能支持更擬真的語聊效果,而且支持重慶、廣西、河南、廣東、山東等特色方言。語音大模型具備極低的訓練和使用成本,極快的推理響應速度,語音交互時,可將用戶等待時長從行業常見的3-5秒降低至1秒左右。更新后的文小言還支持“多模型融合調度”,通過整合百度自研的文心X1、文心4.5等頂尖模型,并接入DeepSeek-R1等第三方優質模型,實現了多模型間的智能協同。同時,文小言還加強了圖片問答功能,用戶拍攝或上傳圖片,以文字或語音提問即可直接獲取深度解析。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.