2月3日,云天勵飛正式舉辦“大算力芯片戰略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片戰略布局。面對人工智能從“基礎模型構建”邁向“規模化應用落地”的重要轉折點,公司宣布將核心研發資源集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構創新,力爭實現百萬 Tokens 推理成本降低 100 倍以上的目標,推動 AI 從技術嘗鮮走向普惠生產力。
![]()
值得一提的是,雖然目前云天勵飛在A股的市值只有300億元左右,但是鑒于對于未來AI推理市場需求持續爆發的看好,以及對于云天勵飛攜全新 GPNPU 技術路線進入市場空間更大的大算力云端AI推理芯片市場的看好,在會議最后,云天勵飛董事長兼CEO陳寧博士還提出了未來五年內,公司市值大幅提升的愿景。
一、 產業變局:推理競速,從“參數內卷”轉向“效能為王”
過去一年,全球算力產業的風向標已發生顯著偏轉,重心正加速向推理側傾斜。谷歌在 2025 年 4 月發布第七代 TPU “Ironwood”時,明確將其定位為“面向推理時代”的基石,強調在大規模推理與能效上的系統化優化。
與此同時,圍繞“更低時延、更低成本”的推理芯片與系統能力,產業整合動作也在加速。2025 年 12 月,英偉達斥資200億美元與推理AI芯片廠商 Groq 達成非獨占許可安排,并吸納其核心工程人才團隊加入,此舉被視為強化推理與實時工作負載能力的關鍵布局。
![]()
這些行業信號共同指向一個趨勢:推理側競爭已不再單純是“把模型做得更強”的參數競賽,而是“讓應用跑得更久、更穩、更便宜”的效能競賽,單位推理成本與交付效率已成為規模化落地的最大門檻。
二、 架構破局:GPNPU 路線重新定義“通用生態”與“極致能效”
推理時代的勝負手不在單點指標,而在系統級協同:既要承接主流軟件生態,又要在推理負載下實現更優能效與更低時延。
云天勵飛確立了 GPNPU 技術路線,并提出了“GPNPU = GPGPU + NPU + 3D 堆疊存儲”的核心公式,旨在兼顧通用計算的“通用性”與 NPU 的“高效性”,在工程層面同時解決可遷移、可部署、可持續降本三大難題。
![]()
在通用生態層面,鑒于 CUDA 仍是全球最成熟、覆蓋最廣的加速計算平臺之一,云天勵飛的 GPNPU 架構致力于正視主流生態的遷移成本問題,能夠實現一行代碼完成 CUDA 程序兼容,極大降低了進入生產系統的門檻。
在推理能效層面,NPU 能夠實現更高的計算效率和能效比,面對大模型推理這種高度結構化、可被體系化優化的負載,專用化設計帶來的能效優勢更容易轉化為真實成本優勢,這也是國際廠商持續加碼專用路線的重要原因。
同時,針對行業公認的“內存墻”瓶頸,云天勵飛正深度研發 3D 堆疊存儲及更前沿的互連技術,以提升帶寬與能效,降低推理時延。
在架構工程與產品化路徑上,云天勵飛進一步強調了兩項可落地的優勢。首先是“算力積木”架構,即通過 Chiplet 擴展與互連思路,將標準計算單元進行模塊化封裝與組合,讓算力像搭積木一樣按需擴展,形成從邊緣到更大規模推理的彈性產品形態。
其次是面向推理的系統級優化能力,公司拒絕單純的“芯片參數競賽”,而是主張把“模型怎么跑得更省”沉淀到架構里,圍繞真實業務負載持續迭代,逐項擊穿推理鏈路中的成本與時延瓶頸,最終形成可復制交付的綜合最優解。
三、 五大核心要素構筑堅實護城河,將打造千卡集群
云天勵飛董事長兼 CEO 陳寧在演講中指出,支撐公司跨越周期的,是長期積累構筑的商業護城河。他將核心競爭力總結為技術、產能、生態、市場、資本五大關鍵要素。這五大維度的協同共振,不僅是云天勵飛應對行業激烈競爭的底氣,更為未來三年戰略的穩步落地提供了堅實的體系化保障。
針對行業普遍關注的供應鏈安全問題,云天勵飛高級副總裁、CFO 兼董秘鄧浩然特別強調,公司目前是國內屈指可數手握充足國產產能保障的企業之一,這一戰略儲備為后續芯片的大規模量產與交付提供了極高的確定性。
![]()
陳寧還詳細解讀了云天勵飛的“1+4”架構:“1”指聚焦于AI大算力推理芯片,“4”則是四大事業部。
![]()
作為生態構建者,四大事業部旨在解決芯片從“研發生產、優化打磨到市場推廣”的核心難題。其中,政企事業部作為基石,將憑借深厚的行業經驗,將戰略重點轉向推理設備和智算中心的建設。此外,云天勵飛還計劃打造區域級“千卡集群”,樹立城市AI算力賦能的新標桿。
四、 藍圖展開:DeepVerse 領銜,全場景算力矩陣精準卡位
面向未來三年的規劃,云天勵飛CTO李愛軍表示,將不遺余力投入大算力芯片DeepVerse的研發,圍繞推理成本、時延與吞吐的核心矛盾持續迭代,并按產品節奏梯度覆蓋市場需求。
路線圖將對標國際主流平臺的代際演進,聚焦長上下文預填充(Prefill)、低時延解碼(Decode)等關鍵推理階段的系統優化,在真實負載下持續兌現“更便宜、更穩定、更易部署”的交付目標。
![]()
根據云天勵飛公布的未來三年大算力芯片規劃路線圖來看,云天勵飛的GPNPU將采用PD分離& AFN分離&超節點架構設計,2028年的產品將有望對標英偉達Rubin架構。
![]()
推理時代的競爭,本質是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩定、足夠易用,AI 才能從“看得見的能力”走向“用得起的生產力”。
未來,云天勵飛將以 GPNPU 架構為核心,大力推進云端大算力強化軟硬協同與存儲體系攻堅,力爭將百萬 Tokens 推理成本降低 100 倍以上,推動大模型從示范應用走向規模化交付。
五、第四次工業革命的反超
業界普遍認為,2030年AGI將會實現,這或將成為“第四次工業革命”開始的一個標志性里程碑的時間點。
陳寧博士指出:“大家知道我們中國有四大發明,曾經我們的中華文明領先全球一兩千年的時間。但是 300 年前,第一臺蒸汽機打破了這樣的一個格局,讓英國成為了全球第一個日不落帝國;200 年前的第一個燈泡又出現在美國,而美國依托電力時代的革命,通過汽車工業迎來了快速的一兩百年的經濟發展;100年前,第一臺計算機出現在美國,帶動了信息化的第三次的工業革命,讓美國真正成為了科技、經濟、軍事、文化甚至人類文明的代言人,去制定了世界運行的規則。今天,我們站在第四次工業革命的門口,大概率是在 2030 年,我們將會全面進入第四次工業革命。”
而AGI的實現離不開大算力AI芯片、優秀的人工智能模型、充足的能源供應的加持,同樣中國的人工智能產業能否抓住這樣一個歷史機遇,這些也是最為關鍵的因素。
“中國在能源、開源模型、應用、基礎設施都可以說在全球遙遙領先,唯獨 AI 芯片上比較薄弱。但是未來 5 ~ 10年,對于工業革命最重要的并不是AI訓練芯片,而是端邊云的 AI 的推理芯片,這也是為什么我們云天勵飛去 !All in 大算力的 AI 推理芯片,我認為 AI 推理芯片是能否率先進入第四次工業革命的關鍵。如果可以,我們就有機會讓中華文明在第四次工業革命中再度領先全球。而在座的每一位云天人,讓我們同心聚力,破壁前行,把我們的名字刻在 AI 的發展史上!”陳寧博士充滿期待地說。
編輯:芯智訊-浪客劍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.