![]()
劃重點:
1、第八屆世界聲博會暨全球1024開發者節上,科大訊飛董事長劉慶峰判斷,AI產業紅利兌現需聚焦自主可控、軟硬一體、行業縱深和個性化四大核心。作為2025年訊飛新出品的AI翻譯軟件,訊飛翻譯APP的迭代煥新尤為引人關注。
2、一個革命性的技術突破,在于非自回歸語音大模型架構。這種端到端架構與傳統的級聯翻譯方案形成了鮮明的技術代際差異。
3、訊飛翻譯APP迭代的核心,是同聲傳譯功能的全面進化。包括四大核心優化點:引擎煥新、實時分享、記錄留存、懸浮字幕,使其從一個單純的翻譯工具,進化為支持協作的新范式。
4、科大訊飛的戰略并非局限于APP,軟硬一體是其AI在真實世界應用落地的關鍵。翻譯功能,正是軟硬一體戰略的最佳實踐場。同時,科大訊飛此前還推出了訊飛翻譯SaaS平臺,提供了從專業翻譯服務到數據聚合管理的一站式解決方案。
5、科大訊飛正在利用自主可控的底層大模型技術,軟硬一體和更懂你的AI,從根本上重塑實時翻譯的體驗。
作者 林易
編輯重點君
2025年,全球人工智能產業正集體邁過技術奇點,進入紅利兌現時刻。大模型的發展焦點,已從參數競賽轉向解決真實世界問題的規模化落地。
在日益緊密的全球化協作、旅行和信息消費中,跨語言溝通始終是最高頻的剛需之一,也是一道難以逾越的屏障。傳統的翻譯工具在處理實時對話、高噪環境和專業領域時,長期面臨延遲、失準和體驗割裂的挑戰。
行業需要更根本的解決方案。11月6日,科大訊飛在第八屆世界聲博會暨全球1024開發者節上,給出了自己的答案。在這場以《更懂你的AI》為主題的發布會上,科大訊飛董事長劉慶峰判斷,AI產業紅利兌現需聚焦自主可控、軟硬一體、行業縱深和個性化四大核心。
在這一戰略框架下,科大訊飛發布了深度推理大模型訊飛星火X1.5,以及一系列AI產品。其中,作為2025年訊飛新出品的AI翻譯軟件,訊飛翻譯APP的迭代煥新尤為引人關注。
科大訊飛的路徑十分清晰:利用自主可控的底層大模型技術,軟硬一體和更懂你的AI,從根本上重塑實時翻譯的體驗。
為翻譯而生的根技術
任何一款顛覆性的應用,都源于底層根技術的突破。訊飛翻譯APP體驗革新的背后,是科大訊飛在AI翻譯技術和基礎模型兩條戰線上同時取得的進展。
一個革命性的技術突破,在于非自回歸語音大模型架構。實時翻譯的瓶頸不僅在翻譯的準度,更在語音識別的速度。傳統的自回歸模型需要逐字順序生成文本,天然存在延遲。
科大訊飛此次全球首發的非自回歸語音大模型架構(即端到端語音同傳大模型的核心技術之一),能夠并行、一次性輸出整個文本序列,帶來了推理效率的大幅階躍:效果相對提升16%,而推理成本下降了520%。這項新技術也為訊飛翻譯APP實現“語音秒譯”提供了堅實的技術前提。
![]()
這種端到端架構與傳統的級聯翻譯方案形成了鮮明的技術代際差異。傳統方案將任務拆解為“識別、翻譯、合成”三個獨立模塊,串行處理導致時延疊加、信息損失和錯誤累積。
科大訊飛的端到端同傳大模型則徹底顛覆了這一流程,它使用統一大模型模仿人工口譯思維鏈,實現了全局最優的翻譯質量,能深度整合上下文、傳遞源語言韻律,并達到2秒的極致響應,為實時交流提供了堅實的技術保障。
技術路線的選擇決定了未來。科大訊飛選擇了更具挑戰性的端到端路線并成功實現商業化,而傳統級聯方案的性能上限已被固有缺陷鎖定。
科大訊飛的領先優勢不僅在于技術先進性,更是全方位的:從率先發布搶占時間先機,到9個月內3次升級的快速迭代;從服務百萬用戶與超42萬場會議積累的海量數據,到全線產品應用端到端技術的完整布局,再到與產業鏈緊密合作的深度生態。這些綜合優勢共同疊加,使其在AI翻譯領域建立了穩固的地位。
如果說領先的端到端架構解決了“快”與“準”的全局體驗,那么垂直領域的深度則依賴專業的同傳大模型。星火語音同傳大模型已升級至2.0版本,覆蓋超8萬個專業詞匯,大幅提升了專業領域的準確性。
而承載上述所有翻譯技術突破的堅實底座,則源于自主可控的星火X1.5大模型。自主可控是科大訊飛的基石。劉慶峰在發布會上表示,訊飛星火是目前中國主流大模型中,唯一基于全國產算力訓練的通用大模型。在國產算力平臺上訓練先進的MoE(Mixture of Experts)架構,科大訊飛已攻克全鏈路訓練效率等難關。
此次發布的訊飛星火X1.5,推理效率相比X1提升了100%,更重要的是,它為翻譯應用提供了強大的多語言能力,目前可支持130多種語言,在拉美、東盟等地區的14個重點語言上效果領先。
根據國際數據公司(IDC)發布的《中國AI翻譯技術評估》,科大訊飛在AI翻譯速度、效果、專業度等八大核心維度評測中均為行業第一,其中六項斬獲滿分。堅實的技術底座,讓訊飛翻譯APP的體驗重塑成為可能。
所聽即所譯的實時體驗
利用自研的先進技術,訊飛翻譯APP 旨在從兩個核心的實時場景——同聲傳譯和音視頻翻譯出發,徹底改變用戶的跨語言溝通工作流。
本次1024開發者節期間,訊飛翻譯APP迭代的核心,是同聲傳譯功能的全面進化。
在傳統認知中,同傳是高度專業化的服務,或依賴昂貴的人力,或受限于復雜的硬件。而訊飛翻譯APP則希望將“如譯員在側”的高效同傳體驗,賦能給每一個需要進行跨語言會議、課堂學習和演講的普通用戶。
![]()
此次煥新,訊飛翻譯APP圍繞同傳功能構建了四大核心優化點,使其從一個單純的翻譯工具,進化為支持協作的新范式,比如:
引擎煥新:搭載全新的語音同傳大模型,帶來更準、更快、更流暢的實時翻譯體驗。
實時分享:支持一鍵分享實時同傳內容。這意味著,即便同事或朋友在遠程參會,也能通過分享卡片打造的同傳頻道,同步查看實時譯文,確保關鍵信息不再遺漏。
記錄留存:同傳內容(包括音頻與文本)會自動保存并支持導出,歷史記錄可隨時回看。這解決了實時會議中信息易揮發、難追溯的痛點,便于后續復盤和整理。
懸浮字幕:用戶無需停留在APP界面,即可通過懸浮字幕查看同傳內容。這使得“邊聽譯邊處理其他事務”成為可能,大幅提升了多任務處理效率。
在1024開發者節的直播演示中,訊飛翻譯APP產品經理展示了全球化辦公的典型場景:面對全英文會議,打開“同聲傳譯”功能,發言人話音剛落,精準的譯文便實時呈現于屏幕。
如果說同傳功能解決了主動溝通的難題,那么沉浸式翻譯則攻克了被動接收信息的壁壘。
用戶在日常生活中,面臨大量無字幕的外文音視頻內容,如外文播客、海外影視劇、國際直播或應用。科大訊飛的解決方案是沉浸式翻譯,其核心是“所聽即所譯,沉浸不中斷”。
該功能啟動后,訊飛翻譯APP會保持后臺運行,實時翻譯手機上正在播放的任何音頻或視頻內容,并以懸浮字幕窗的形式呈現譯文。用戶可以靈活調整字幕窗口,選擇雙語對照或只看譯文,真正實現邊看邊譯的無縫體驗。
在11月6日的1024發布會直播期間,訊飛翻譯APP就為全球觀眾免費提供了這一功能,支持中文與英、日、韓、法、俄等15種語種的互譯,讓全球觀眾無障礙觀看。
從解決會議痛點的同聲傳譯,到打破信息繭房的沉浸式翻譯,訊飛翻譯APP正在借助大模型的能力,將翻譯體驗推向一個更實時、更無縫的新高度。
軟硬一體的戰略縱深
科大訊飛的戰略并非局限于APP。劉慶峰在發布會上強調,軟硬一體是AI在真實世界應用落地的關鍵。大模型需要從手機、電腦走向機器人和更多的智能終端。
翻譯功能,正是“軟硬一體”戰略的最佳實踐場。要實現精準的實時翻譯,第一步是解決嘈雜環境下的“聽清”問題。為此,科大訊飛發布了“AI+麥克風陣列技術”,并將其應用到一系列硬件中:
訊飛智能辦公本X5:首創上4下4環麥克風大陣列,根據現場視頻演示結果,在高分貝和遠距離環境下的轉寫效果遠超iPhone17 pro。
訊飛AI翻譯耳機:首創單耳三麥多感融合降噪系統,采用“骨導+氣導”雙拾音,在地鐵等嘈雜環境準確率達97.1%,遠超AirPods 3。
訊飛雙屏翻譯機2.0:實現1米以內穹頂式隔音降噪,適應轟鳴工廠等極端環境。
同傳麥克風:此次發布的業界首個軟硬一體同傳麥克風,置于會議桌即可使用,支持10種語言免切換自動翻譯,且支持私有化部署,保障數據安全。
![]()
與此同時,科大訊飛此前還推出了面向企業和專業團隊的訊飛翻譯SaaS平臺。它整合了文本、文檔、同傳、音視頻譯制、人機協同五大核心翻譯能力,通過打通多端設備的數據鏈路,為企業提供了從專業翻譯服務到數據聚合管理的一站式解決方案。
這些硬件與訊飛翻譯APP,共同構成了科大訊飛在翻譯領域的生態護城河。軟件APP負責高頻、便捷的C端應用;專業硬件則攻克高噪、遠場、B端安全的特定場景;SaaS平臺則將軟硬能力整合,為企業級應用提供了統一入口。
![]()
從自主可控的端到端語音同傳大模型,到重塑體驗的APP同傳與沉浸式翻譯,再到“軟硬一體”的硬件與SaaS生態布局,科大訊飛正在AI翻譯這條核心賽道上,完成從技術紅利到產品紅利和市場紅利的兌現。
正如訊飛翻譯APP在東盟博覽會作為指定翻譯軟件的實戰檢驗,這場聚焦AI生態落地的1024盛會,最終指向的是一個明確的價值——“讓跨語言溝通像母語聊天一樣簡單”。
而這,才是科技進步的意義!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.