![]()
作者 |辰紋
來源 |洞見新研社
今年年初,DeepSeek橫空出世,讓世界重新認(rèn)識(shí)了中國大模型。
幾乎在DeepSeek爆紅的同一時(shí)間,科大訊飛發(fā)布了全國產(chǎn)算力平臺(tái)上首個(gè)深度推理大模型——訊飛星火X1,其獨(dú)一無二的標(biāo)簽是“唯一基于全國產(chǎn)算力訓(xùn)練的深度推理模型”。
1萬張華為昇騰910B國產(chǎn)算力卡,訓(xùn)練出的星火X1在模型參數(shù)比業(yè)界同類小一個(gè)數(shù)量級(jí)的情況下,整體效果卻能對(duì)標(biāo)OpenAI o1和DeepSeek R1。
在曠日持久的科技賽跑中,科大訊飛用實(shí)際行動(dòng)走出了一條自主可控,雖然艱辛,但更值得夸贊大模型發(fā)展路線。
01 技術(shù)突圍,國產(chǎn)算力的極限挑戰(zhàn)
從表面上看,科大訊飛選擇“全棧自主可控”路線是出于中美競(jìng)爭(zhēng)的地緣環(huán)境,兩次被美國列入實(shí)體清單,無法獲得英偉達(dá)芯片算力的“另辟蹊徑”,然而更深層次的內(nèi)里,人工智能競(jìng)爭(zhēng)的實(shí)質(zhì)已經(jīng)算法與模型的性能優(yōu)劣,演變成算力/算法/應(yīng)用這一整條鏈接綜合能力的考驗(yàn)。
因而科大訊飛從一開始就確定了“全棧自主可控”的方向,算力國產(chǎn)化,算法自研。
2023年5月,訊飛星火大模型發(fā)布,5個(gè)月后,首個(gè)支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺(tái)“飛星一號(hào)”也宣布正式啟用。
2024年,在“飛星一號(hào)”算力平臺(tái)的支持下,訊飛星火大模型不斷升級(jí),從V3.5到V4.0再到V4.0 Turbo,核心能力全面對(duì)標(biāo)GPT-4 Turbo。
取得上述成績(jī)的背后是科大訊飛與華為共同攻克的技術(shù)無人區(qū)。自2023年5月起,雙方團(tuán)隊(duì)在萬卡高速互聯(lián)組網(wǎng)、計(jì)算通信隱藏、訓(xùn)練推理強(qiáng)交互等關(guān)鍵領(lǐng)域取得突破,將昇騰910B的訓(xùn)練效率從最初相當(dāng)于英偉達(dá)A100的30%-50%提升至85%-95%。
今年1月,科大訊飛又發(fā)布了國內(nèi)首個(gè)基于全國產(chǎn)算力訓(xùn)練的具備深度思考和推理能力的大模型——訊飛星火X1。
這個(gè)僅130億參數(shù)的“小模型”實(shí)力“驚人”,在高考題、AIME競(jìng)賽題和高中奧賽題解答中,不僅答案準(zhǔn)確,還能提供接近人類“慢思考”的詳細(xì)解題步驟。
3個(gè)月后,科大訊飛與生態(tài)企業(yè)組成的聯(lián)合團(tuán)隊(duì)通過多種優(yōu)化手段提升“飛星一號(hào)”平臺(tái)上 MoE 模型集群推理的性能上限,并實(shí)現(xiàn)大規(guī)模專家并行集群推理性能翻番,訊飛星火X1也由此迎來了全新升級(jí),在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識(shí)問答等通用任務(wù)上效果顯著提升。
科大訊飛的實(shí)踐充分證明了基于國產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實(shí)力和持續(xù)創(chuàng)新的潛力,與此同時(shí),也在“自主可控”語境下,為中國的大模型行業(yè)提供了一條可供借鑒的破局之路。
02 應(yīng)用為王,從教育醫(yī)療到央國企的全面滲透
研發(fā)實(shí)現(xiàn)了“全棧自主可控”,其價(jià)值最終要體現(xiàn)在落地應(yīng)用上,科大訊飛的戰(zhàn)略是以“1+N”的形式進(jìn)行業(yè)務(wù)體系布局, “1”是指通用底座大模型,“N”是指以底座大模型賦能教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等多個(gè)行業(yè)領(lǐng)域,并形成獨(dú)具優(yōu)勢(shì)的行業(yè)大模型。
比如,訊飛星火X1在教育場(chǎng)景中落地時(shí),聯(lián)合中國教育科學(xué)研究院發(fā)布基于“問題鏈”的高中數(shù)學(xué)智能教師助手,在全國百個(gè)試點(diǎn)區(qū)域部署,與上千名優(yōu)秀教研員打造了上萬個(gè)優(yōu)秀案例。
在實(shí)際教學(xué)中,老師們發(fā)現(xiàn)X1在一題多解、教學(xué)知識(shí)關(guān)聯(lián)、拓展學(xué)生高階思維等方面表現(xiàn)出色。相關(guān)技術(shù)的融入,科大訊飛AI學(xué)習(xí)機(jī)的學(xué)習(xí)推薦和診斷也變得更加精準(zhǔn),解題思路和知識(shí)鏈條更加清晰。
在醫(yī)療領(lǐng)域,X1的模型策略已使專科輔助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控準(zhǔn)確率達(dá)90%。科大訊飛還表示將在年內(nèi)發(fā)布基于X1的醫(yī)療大模型升級(jí)版,確保其深層次診斷推理效果業(yè)界領(lǐng)先。
更令人矚目的是在央國企市場(chǎng)的攻城略地,科大訊飛為央企打造的專業(yè)大模型已成為行業(yè)標(biāo)桿。
與中國石油共建的昆侖大模型使代碼開發(fā)效率提升73%,行業(yè)知識(shí)問答采納率超95%;為國家能源集團(tuán)開發(fā)的智能評(píng)標(biāo)助手獲國資委點(diǎn)名表揚(yáng);與中海油合作的 “海能”人工智能模型已在招標(biāo)采辦、員工健康等領(lǐng)域應(yīng)用,并正在研發(fā)海上油田穩(wěn)產(chǎn)增產(chǎn)等專業(yè)場(chǎng)景模型。
科大訊飛之所以能夠在IDC的報(bào)告中拿下去年央國企大模型解決方案市場(chǎng)份額第一,其核心原因在于滿足了產(chǎn)業(yè)應(yīng)用“既要又要還要”的需求,即工程能力與技術(shù)能力雙向驅(qū)動(dòng)。
在具體實(shí)踐中,科大訊飛通過“通專結(jié)合、端云聯(lián)動(dòng)與軟硬一體”(通用大模型與專業(yè)大模型結(jié)合、端側(cè)大模型與云端大模型聯(lián)動(dòng)、軟硬件一體化)來實(shí)現(xiàn)部署成本與用戶體驗(yàn)的平衡,提出“建算力、理數(shù)據(jù)、訓(xùn)模型,到落場(chǎng)景、保安全、精運(yùn)營”的全鏈路方法,從場(chǎng)景出發(fā),給客戶提供人工智能的解決方案。
在工具層面上,科大訊飛進(jìn)一步升級(jí)了模型定制優(yōu)化工具鏈,支持監(jiān)督微調(diào)、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案,持續(xù)簡(jiǎn)化定制步驟和成本。
03 星火燎原后的硬仗與新征途
從上文的分析不難看出,科大訊飛不僅證明了國產(chǎn)算力登頂技術(shù)巔峰的實(shí)力,更為中國大模型行業(yè)開辟了一條可借鑒的破局路徑。然而,大模型行業(yè)的競(jìng)逐正步入深水區(qū),訊飛面臨的考驗(yàn)更為復(fù)雜。
其一,全球大模型正加速向多模態(tài)、強(qiáng)推理、高能效演進(jìn)。昇騰910B效率雖追至A100的85%-95%,但面對(duì)英偉達(dá)H200等新一代芯片及集群效率的持續(xù)躍升,保持算力底座競(jìng)爭(zhēng)力仍需在芯片互聯(lián)、訓(xùn)練框架、集群調(diào)度等“硬骨頭”上持續(xù)攻堅(jiān)。
其二,大模型之爭(zhēng)終將演化為生態(tài)之爭(zhēng),科大訊飛“1+N”戰(zhàn)略雖已鋪開,但相比互聯(lián)網(wǎng)巨頭在消費(fèi)端的海量觸達(dá)和開發(fā)者生態(tài)號(hào)召力,其仍需在吸引廣大開發(fā)者、構(gòu)建繁榮的工具鏈與社區(qū)生態(tài)上傾注更多資源與開放誠意,避免成為“孤勇者”。
其三,行業(yè)落地已從“能用”邁向“好用且經(jīng)濟(jì)”,科大訊飛在央企、教育、醫(yī)療的標(biāo)桿案例雖亮眼,但需將“通專結(jié)合、端云聯(lián)動(dòng)”方法論沉淀為可快速復(fù)制的規(guī)模化能力,在確保“自主可控”前提下持續(xù)優(yōu)化部署成本與用戶體驗(yàn),實(shí)現(xiàn)商業(yè)價(jià)值的可持續(xù)閉環(huán)。
今年4月份的業(yè)績(jī)說明會(huì)上,科大訊飛官方認(rèn)為,“目前底座大模型還有很大的增長空間,通過預(yù)訓(xùn)練和強(qiáng)化訓(xùn)練兩種方法,大模型的自主進(jìn)化在未來2-3年內(nèi)還有巨大的提升空間,天花板非常高。”
科大訊飛董事長劉慶峰也表示,會(huì)繼續(xù)加大“1+N”的投入,搶抓通用人工智能的根紅利。“在完全自主可控的基礎(chǔ)上,我們的通用底座大模型要做到第一梯隊(duì),永爭(zhēng)行業(yè)第一,不僅僅是跟隨,并推動(dòng)更多算法研發(fā)和創(chuàng)新。”
很明顯,科大訊飛的挑戰(zhàn)主要來源于持續(xù)不斷的創(chuàng)新與投入和長盈利周期的平衡,好就好在,科大訊飛以篳路藍(lán)縷的實(shí)踐點(diǎn)燃了希望之火,至少在當(dāng)前這個(gè)時(shí)間節(jié)點(diǎn),科大訊飛仍處于領(lǐng)跑的位置。
科大訊飛的未來如何,既取決于其在技術(shù)深水區(qū)持續(xù)攻堅(jiān)的硬實(shí)力,也考驗(yàn)其構(gòu)建開放生態(tài)、實(shí)現(xiàn)規(guī)模落地的軟智慧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.