品玩9月10日訊,據(jù)阿里巴巴消息,Qwen團(tuán)隊(duì)發(fā)布語(yǔ)音識(shí)別模型Qwen3-ASR-Flash。該模型基于Qwen3-Omni構(gòu)建,支持11種語(yǔ)言自動(dòng)檢測(cè)及轉(zhuǎn)錄,涵蓋中文、英文、阿拉伯語(yǔ)、法語(yǔ)等,還支持多種中國(guó)方言及不同地區(qū)英語(yǔ)口音。
在復(fù)雜聲學(xué)環(huán)境及語(yǔ)言模式下,它展現(xiàn)出高準(zhǔn)確率。在標(biāo)準(zhǔn)中文公開(kāi)測(cè)試中,錯(cuò)誤率僅3.97%;處理中文口音時(shí),錯(cuò)誤率為3.48%;英文識(shí)別錯(cuò)誤率3.81%。識(shí)別歌詞時(shí),其錯(cuò)誤率僅4.51%,遠(yuǎn)超同類(lèi)產(chǎn)品。
該模型具有靈活的上下文偏差功能,用戶(hù)輸入任意格式背景文本,都能獲取定制化結(jié)果。目前,用戶(hù)可通過(guò)ModelScope、HuggingFace和阿里云百煉API免費(fèi)體驗(yàn)。
據(jù)介紹,圖像創(chuàng)作正從文生圖邁向多模態(tài)交互新階段,Seedream 4.0已具通用多模態(tài)創(chuàng)意引擎雛形 。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.