品玩12月18日訊,xAI官方宣布,xAI正式發布Grok Voice Agent API,面向開發者開放其在Tesla車輛及移動應用中已驗證的語音代理技術。
該API支持數十種語言,具備實時工具調用與網絡搜索能力,平均首音頻響應時間低于1秒,在Big Bench Audio評測中位列第一。Grok Voice Agent采用自研全棧語音技術,包括語音活動檢測、分詞器與音頻模型,定價為每分鐘0.05美元。API兼容OpenAI Realtime規范,并提供Ara、Eve、Leo等多款自然表達語音。
目前支持通過xAI LiveKit插件或瀏覽器語音沙盒快速接入。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.