![]()
當AI大模型從實驗室走向千行百業,成本與效率的博弈正成為行業破局的關鍵。
近日,云天勵飛以一場“大算力芯片戰略前瞻會”向行業投下重磅炸彈:未來三年聚焦大模型落地成本攻堅,劍指百萬Tokens推理成本降低100倍!
與此同時,公司2025年業績預告釋放積極信號——營收最高預增52.61%,虧損大幅收窄。
這場“技術+商業”的雙輪驅動,能否為行業撕開一條普惠AI的新賽道?
芯片戰略:從“算力競賽”到“成本革命”
近年來,全球AI產業格局正經歷深刻重塑,其發展重心從“重訓練”逐步轉向“重推理”。
根據IDC預測,推理算力占比將持續攀升,2024年占比40%,2027年將達70%。而這一轉變的背后,是AI應用場景的加速落地與使用頻次的爆發式增長,推動算力需求結構發生根本性變化。
然而,在AI大模型狂飆突進的同時,一個關鍵瓶頸日益凸顯:高昂的推理成本正成為AI規模化落地的“阿喀琉斯之踵”,嚴重制約了技術從示范走向普及。
面對這一行業性挑戰,云天勵飛選擇將戰略重心聚焦于攻克大模型落地的“成本壁壘”,通過底層架構創新開啟“成本革命”。公司提出“百萬Tokens推理成本降低100倍以上”的突破性目標,旨在推動AI技術從實驗室走向普惠化應用,真正成為賦能千行百業的生產力工具。
為實現這一目標,云天勵飛確立了GPNPU技術路線,構建起“GPNPU=GPGPU+NPU+3D堆疊存儲”的核心技術框架。該架構創造性地兼顧通用計算的“通用性”與NPU的“高效性”,在工程層面同步解決可遷移性、可部署性和持續降本三大難題,為推理時代提供系統級解決方案。
在生態兼容性方面,針對CUDA作為全球主流加速計算平臺的現實,云天勵飛的GPNPU架構實現了“一行代碼完成CUDA程序兼容”,這種生態適配能力,顯著降低了技術遷移門檻。
針對推理場景的能效優化,云天勵飛通過引入針對大模型推理高度優化的NPU單元,并結合3D堆疊存儲等先進技術來突破“內存墻”限制,從而在系統級提升帶寬、降低時延,將能效優勢切實轉化為真實的成本優勢。
在架構工程創新層面,云天勵飛強調了兩大務實策略:
①“算力積木”架構:基于Chiplet擴展與互連技術,將標準計算單元進行模塊化封裝,支持算力像搭積木般靈活擴展。這種設計使產品形態能夠覆蓋從邊緣計算到大規模推理的全場景需求。
②系統級優化導向:拒絕單純的“芯片參數競賽”,將“如何讓模型運行更高效”的核心問題融入架構設計。通過圍繞真實業務負載持續迭代,系統性地破解推理鏈路中的成本與時延瓶頸。
業績表現:營收增長,虧損進一步收窄
日前,云天勵飛發布2025年年度業績預告,公司主營業務經營保持穩健增長勢頭,預計2025年公司營業收入、毛利率較上年同期均提升顯著,公司虧損進一步收窄。
根據業績預告顯示,預計云天勵飛2025年營業收入為11.3億元至14億元,同比增長23.18%至52.61%;預計實現歸屬于母公司所有者的凈利潤為-4.71億元至-3.51億元,虧損同比收窄18.64%至39.36%。
關于本期公司業績虧損變化的原因,云天勵飛表示,公司企業級和消費級場景業務的銷售收入大幅增長,綜合毛利潤較上年顯著提升,促使公司虧損收窄。
同時,為把握行業發展機遇,鞏固公司核心技術競爭優勢,云天勵飛在高端人才、底層技術方面繼續加大投入。報告期內,公司研發投入仍保持較高水平,故公司經營毛利未覆蓋研發等方面投入,呈現虧損狀態。
展望未來,云天勵飛將繼續深耕核心業務,持續推進技術創新與市場落地,進一步提升盈利能力與經營效益。
行業視角:AI普惠時代加速到來?
當前,全球AI行業正邁入從“模型構建”向“價值創造”的關鍵轉折期,產業邏輯也正經歷多維度重構。
技術層面,單純追求參數規模的“軍備競賽”已顯疲態,增長曲線趨于平緩。行業焦點正從“把模型做得更大”轉向“讓應用跑得更穩、更省”。技術創新重點不再局限于提升理論性能峰值,而是更加聚焦于優化工程落地與部署效率。
商業層面,企業客戶對AI投入的審視日趨理性務實,投資回報率(ROI)已成為決策的核心標尺。在規模化部署的進程中,推理成本的可控性、解決方案的穩定性以及整體運營成本效益等,正超越單純的性能參數,成為采購決策中更具分量的決定性指標。
政策層面,國家“人工智能+”行動計劃的推進,明確提出要降低技術應用門檻、賦能廣大中小企業。這要求產業界不僅提供先進技術,更需通過架構創新與成本優化,打造“用得起、用得好”的算力基礎設施,使AI紅利能廣泛滲透至實體經濟各毛細血管。
而這一切的共同作用,清晰地指向同一個產業剛需:一場以“極致性價比”為核心的算力成本革命已勢在必行。這也正是云天勵飛提出“成本革命”戰略的深層背景——AI普惠并非自然結果,而是需要通過創新實現的技術經濟可行性突破。
隨著全球算力產業的風向標加速向推理側傾斜,一場圍繞“單位推理成本”的競賽已然拉開序幕。當推理成本真正降至足夠低的水平,AI才能真正走出實驗室和演示場景,成為千行百業日常可依賴、可負擔的通用生產力工具。這場圍繞成本效率的競賽,將最終決定AI普惠時代的到來時間和普及廣度。
![]()
? IOTE 深圳物聯網展 ?
(2026年8月26-28日 深圳國際會展中心 9/10/11/12號館)
觀眾報名| 申請展位
交通指南 |展館分布 |觀眾客服
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.