文 | Judy
邁入第三年,全球大模型的競逐正迎來一個新周期。
一面在技術層,隨著OpenAI相繼發布o1和o3模型,一場推理競賽已在模型廠商間展開;另一面在競爭側,在“應用落地”的集體共識里,大模型的競爭格局發生新的松動。海外,一批如Character.ai的明星公司已被大廠收購,巨額融資越來越集中在頭部公司。
國產大模型也出現類似的趨勢。互聯網大廠憑借技術和云廠商的生態優勢,依舊遵循“產模一體”的路徑,創企則出現了新的分化,開始做起減法,比如零一萬物不再追逐超大模型,將部分技術團隊并入阿里,百川智能則轉向to B醫療......
分化與洗牌中,橫亙在國產大模型面前的還有一道無法繞開的關卡——算力。
2018年至今,圍繞人工智能和芯片制造,美國多次加碼對華芯片管制措施,呈現出更動態、更精準的特點。今年1月13日,拜登政府卸任前發布《人工智能擴散暫行最終規則》,根據BIS發布的新規,在加碼限制高算力先進GPU出口的同時,限制范圍也再度擴大。
以出口管制卡住中國大模型的算力脖子,是美國政府的一場“陽謀”,而把牌握在自己手里,尋找國產化的解決方案,這也是國產大模型必須要走的路,此前科大訊飛董事長劉慶峰就曾反復表示:“中國大模型只有在國產技術底座上發展,才能有自主可控的大未來。”
但這條國產化之路究竟該怎么走?結合大模型的前沿趨勢和科大訊飛等企業的實踐,我們或許能找到一些確定性的解題思路。
1、解法一:深度推理競賽爭奪:比深度,也要比廣度
隨著OpenAI扣動推理模型的扳機,大模型浪潮的技術范式已從預訓練的Scaling Law轉向推理端,從“快思考”轉向“慢思考”,國內外科技公司的新目標無疑是更快搶奪推理模型的“船票”,追平與OpenAI的差距。
從谷歌發布Gemini 2.0 Flash Thinking,到月之暗面、DeepSeek、智譜、阿里云、科大訊飛等國內大模型廠商相繼發布各自的推理模型,一場推理模型的新競賽已經開始。
![]()
但想要吃到新技術范式的紅利,并非那么簡單。大模型廠商需要解決的核心問題有二:一是模型的深度是否足夠深,即在數學等復雜領域問題上能否達到人類專家水平;二是模型深度能否泛化至其他領域,應用于更廣的行業。
也就是說,推理大模型的深度和廣度都很關鍵。
在模型能力的深度上,數學題就是最好的試煉場。以科大訊飛近期發布的星火深度推理模型X1為例,其在小初高(含競賽)、大學(含競賽)、AIME、MATH500等多項考試中,取得了亮眼成績,得分水平處于業界第一梯隊,且多項指標國內第一。
![]()
事實上,早在2023年,科大訊飛的通用底座模型訊飛星火就在《MIT科技評論(中國版)》的一場公開透明測試中以超出平均得分率20%的成績被評為“最會算數”的大模型。而就在國產大模型趕超o1系列時,OpenAI卻深陷“o3成績造假羅生門”。據外媒最新報道,o3在數學基準FrontierMath中的驚人表現很有可能是提前得到了大部分數據集。
過往科技史已經證明,一切的技術炒作最終都會回歸應用和落地,深度推理模型的競賽也不例外,除了深度水平外,推理模型只有落地于剛需場景,解決普通人的日常問題,才能真正體現“慢思考”的技術價值。
「硅基研究室」觀察到,目前國內大模型企業的深度推理模型版本迭代還在陸續發布中,但在行業側的落地明顯速度更快,例如訊飛星火X1已在教育、醫療等真實場景中實現了應用落地。
在教育場景,去年科大訊飛曾聯合中國教育科學研究院發布了基于“問題鏈”的高中數學智能教師助手。而X1目前已部署上述產品,在內測期就收獲老師們的好評。X1還將與訊飛AI學習機結合,升級這一AI硬件產品的學習推薦和診斷等能力。在醫療場景,X1模型可讓專科輔助診斷和復雜病歷內涵質控的準確率達到90%,為今年上半年即將發布的訊飛星火醫療大模型升級提供底層模型能力支持。
左手技術趕追OpenAI o1和o3,右手前置模型落地,在深度推理模型這場競賽中,國產大模型依舊有彎道超車的機會。
2、解法二:大模型商業化落地:要專注優勢,更要規模復用
緊追前沿技術風口外,商業化是國產大模型的另一重機會。
過去一段時間來,圍繞大模型的討論已從“誰又融到資了”轉變為“誰先賺到錢了”,為了尋求更快地商業化落地,在B端,云廠商大打價格戰、創企爭奪更多的硬件入口,大廠則在C端比拼投流獲客,但商業化困境依舊擺在眼前。
但并非沒有優等生給出可供參考的解法。
在B端,據第三方機構「智能超參數」統計,2024年,科大訊飛以91個中標項目成為2024年度標王,在大模型拿單江湖上走出一條“訊飛之路”;大廠中,始終堅持開源路線的阿里云,發揮流量優勢和人才優勢的字節跳動,在C端的商業化上也都交出了一份不錯的成績單。
![]()
復盤它們的大模型商業化之路,有兩個關鍵點:一是要專注自身的優勢,二是要更快實現規模化復用。
首先,大模型商業化并非是盲目狂奔,拿著錘子到處找釘子,而是專注自身的優勢,做更擅長的事。
以科大訊飛為例,在AI 1.0時代,作為率先探索和落地商業化的AI企業,科大訊飛就已沉淀下B、G端的行業know-how,其AI能力在教育、醫療、金融等領域和央國企中就受到了認可。
而在AI 2.0時代,這些優勢被科大訊飛進一步延續和放大,為其大模型商業化落地提供了好的基礎條件。在all in大模型這件事上,科大訊飛堅持“1+N”戰略,“1”代表大模型算法研發及高效訓練底座平臺,而“N”則代表應用于教育、醫療、辦公等多個領域的專用大模型版本。每次升級核心底座的時候,“N”也都會有相應的升級。
科大訊飛研究院院長劉聰也曾在采訪中表示,科大訊飛做AI的一大特點是:“內部 AI核心技術和業務之間邏輯是對齊的”,由于經歷了AI從技術驅動到應用場景驅動的完整周期,因此科大訊飛對AI落地行業有著更為務實和深刻的理解。
截至2024年10月,科大訊飛已與各頭部企業共建了20多個行業大模型,覆蓋超300個應用場景,這些頭部企業中包含了中石油、中國移動、中國海油、交通銀行等央國企。
針對一些實體產業,例如汽車行業,科大訊飛已和奇瑞、廣汽、長城、長安等七大車企探索落地“汽車+大模型”創新,據艾媒咨詢數據,中國汽車出海十強企業中,有8家企業應用了科大訊飛的智能語言技術。
![]()
其次,大模型商業化比拼的也并非是最貴的技術,而是站在企業成本端,提供更具性價比的全套解決方案,并在行業中快速復用實現規模效應。
劉慶峰曾提到:“每個企業搭建后,我們都會找到很多可復用的給其他企業。很多央國企頭部企業在這個行業做完后,可推廣給全行業,也可以在不同行業相互借鑒。”
實現規模化復用的背后,針對大模型落地,科大訊飛自上而下建立了一套“建算力、理數據、訓模型、落場景、保安全、精運營”全套解決方案,由此能快速落地千行百業。
在“建算力”上,科大訊飛早在2023年就與華為聯合打造了中國第一個萬卡算力集群“飛星一號”,訊飛星火也是國內首個由全國產算力平臺訓練出的萬卡算力通用大模型。
在“理數據、訓模型”上,科大訊飛以“通專結合”的方式,為行業提供更具性價比的模型解決方案。 如科大訊飛此前和中國石油、中國移動、華為共同打造了能源行業大模型——昆侖大模型,該模型就以通用大模型搭配不同尺寸、不同類型的專業大模型,滿足了能源化工行業不同業務的場景需求。
從科大訊飛的商業化實踐中不難看出,專注自身優勢,才能將行業做深做透;堅持模型的性價比理念,才能讓更多企業從“用模型”邁入“用好模型”,這是大模型商業化的正道。
3、解法三:大模型國產化:持續為世界提供第二選擇
算力、算法和數據是AI時代的三要素,一個行業共識是,國產大模型不缺算法和數據。一方面,中國完備的產業生態提供了廣闊的應用場景,移動互聯網時代沉淀下的場景經驗也打好了數據基礎。另一方面,中國在算法、軟硬件、工程等方面的技術優勢,也讓國產大模型具備了跟住海外領先模型扳手腕的實力。
但隨著中美科技博弈邁入深水區,算力仍然是影響國產大模型前進的關鍵因素,特別在海外谷歌、微軟等科技大廠尚在大舉搭建算力基建、布局算力投資時,中國大模型的算力國產化已箭在弦上。
劉慶峰也曾表示,在中美AI的激烈博弈下,國產大模型底座下的自主可控的繁榮生態,決定了能在這條路上走多遠,也直接影響到國內技術開發者是否能在浪潮中享受更多紅利。
這條算力國產化之路,國內大模型企業不得不走,也必須要走,而國產化從算力底座、模型到應用產品,一個也不能少。
這種堅定國產化的認知,浸潤在科大訊飛的實踐中,早在2019年被列入實體名單時,科大訊飛就已開展國產化移植優化工作,承擔國家多個AI國產化攻關項目,走在“為世界提供第二選擇”的路上。
實現大模型完全國產化,科大訊飛的路線圖也很清晰:自研算力底座、提升基礎模型能力、搭建開放生態。
首先,是自研國產化算力底座。聯手華為打造出國產萬卡算力平臺“飛星一號”,無論是訊飛星火,還是星火深度推理模型X1,借助這一國產化算力底座,能實現國產大模型自主可控。同時,訊飛的AI算法優勢和華為的硬件能力結合,通過不斷地適配和調優,能實現用更少算力,取得更優效果。
去年10月,科大訊飛又宣布聯合華為、合肥市大數據資產運營有限公司打造國產超大規模智算平臺“飛星二號”,將帶來新模型、新算法的持續適配,以及智算集群規模的再次躍遷,為國產智算基建繼續儲備彈藥。
其次,在國產算力底座下,訊飛的基石模型能力也在持續迭代。 以訊飛星火4.0 Turbo為例,全面對標OpenAI GPT-4o,在文本生成、語言理解、知識問答、邏輯推理、數學、代碼和多模態七大核心能力上再度實現了新升級,且在數學能力、行業知識、圖文識別、長文本能力等行業、企業最關注的痛點問題上,底座模型能力也有針對性的提升。
![]()
最后,則是通過搭建開放生態,科大訊飛以“通專結合、端云聯動、軟硬一體”的產品路徑,對外輸入模型能力,讓大模型如“水電煤”一樣深入千行百業。
“通專結合”前文已有論述。“端云聯動”是指科大訊飛一方面通過云端不同尺寸的通用大模型和星火一體機、“飛星一號”、“飛星二號”算力平臺等自主可控的硬件,發揮云端的計算和數據處理能力。另一方面,在端側可以為不同行業量身定制可以適配不同終端、參數模型更小、效果更優的軟硬件一體化方案,為用戶提供更好的體驗。無論是汽車領域的星火智能座艙,還是教育領域的星火智慧黑板2.0,都是科大訊飛端云協同的實踐。
“軟硬一體”更好理解。科大訊飛自身在消費電子端布局多年,通過AI學習機、智能辦公本等智能終端產品,當這些硬件入口接入星火大模型,具備持續迭代的AI能力,科大訊飛也以軟硬一體化為用戶提供與時俱進的AI產品體驗。
如劉慶峰所言:“國產模型在快速奔跑的過程中,別人用的是最豪華的武器,而我們在一邊打仗,一邊磨練武器,一邊向前進步。在這個過程中,我們需要付出更多的投入,既要掙錢,又要大規模投入,既有軟件,又有硬件。”
但從加速推出深度推理模型、重視商業化再到探索大模型國產化的“無人區”,如科大訊飛一樣的中國大模型在中美科技博弈中正走出一條自主創新之路。我們也有理由相信,2025年,國產大模型會繼續落地千行百業,迎來新突破。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.