
![]()
“在算力成為基礎設施的時代,究竟什么樣的技術路徑、生態戰略和商業邏輯,能夠穿越周期,占據未來價值鏈的頂端?”
作者丨楊依婷 劉伊倫
編輯丨包永剛
2025年12月13日,GAIR 2025「AI 算力新十年」專場在深圳·博林天瑞喜來登酒店正式啟幕。
作為國內前沿技術與產業變革的重要風向標,GAIR大會歷經七屆積淀,見證并推動了中國 AI 產業從算法突破、硬件迭代,到商業落地的完整過程。本屆論壇直面智能體系的底層核心——算力,從架構、生態、工具鏈到產業化落地,探尋未來十年的關鍵變量。
上午場以「誰是下一個寒武紀」為主題,六位來自產、學、研、投等多個維度的嘉賓依次登臺,以不同視角揭示國產算力的現狀與未來——這不僅是在探尋一家明星企業,更是在追問:
在算力成為基礎設施的時代,究竟什么樣的技術路徑、生態戰略和商業邏輯,能夠穿越周期,占據未來價值鏈的頂端?
從最底層的芯片架構哲學,到最頂層的應用落地挑戰,一幅更立體、更清晰、也更具方向感的圖景,正在這場大會中緩緩展開。
深圳理工大學算力微電子學院院長唐志敏:通過軟件定義算力,才能打破芯片技術壁壘
![]()
首位登場演講的嘉賓是深圳理工大學算力微電子學院院長,龍芯 CPU、海光 CPU 創始人唐志敏。深耕微電子與算力領域三十余載,唐志敏院長親歷了中國自主芯片從無到有、從弱到強的攻堅歷程,更在算力芯片(XPU)的體系結構、軟件生態與產業發展領域有著深厚積淀,對于算力時代下芯片技術突破瓶頸、產業生態構建難點,有著獨到且深刻的洞察。
唐志敏院長在大會上帶來了關于《XPU的未來——軟件定義成敗》的主題演講,從算力時代XPU發展的核心痛點切入,系統剖析軟件生態對算力芯片產業的決定性作用。
“我們不僅創造了‘算力’,還為它賦予了國際表達——computility。”唐志敏開篇點明,算力正在向“水、電般的公共事業”進化。他進一步延伸,隨著生成式AI的爆發,算力衍生出“訓力”(快速訓練大模型的能力)與“推力”(基于大模型輸出結果的能力),甚至幽默展望:“未來會不會出現‘演力’,直接把金庸小說變成電視劇?”這些鮮活的概念,既是技術趨勢的提煉,更傳遞出中國科技界對定義未來的主動思考。
“當前算力芯片的發展,像在爬一座越來越陡峭的山,技術迭代速度卻越來越慢。”唐志敏以形象的比喻指出核心矛盾:一方面,摩爾定律放緩導致CPU等傳統處理器發展受限;另一方面,生成式AI對算力的需求呈指數級增長。
為應對這一矛盾,學術界與工業界正推動“異構計算”(CPU+XPU),但新問題隨之而來——“我們有了很多種樂器,卻沒有統一的樂譜”,編程復雜度激增、軟件兼容性差成為新瓶頸。
“生態是繞不開的命題。”唐志敏以數據佐證:X86架構歷經四五十年沉淀,其軟件生態壁壘極高,ARM雖在手機領域稱雄,卻在服務器市場屢屢碰壁;RISC-V雖被視為“破局者”,但商業化之路同樣艱難。
他特別強調指令系統的重要性:“英特爾持續向X86架構中添加新指令,正是生態競爭的關鍵動作。”談及自主創新案例,他舉例:“我們在研發海光CPU時,阿里云為何優先選擇英特爾?因為軟件優化的積累,才是用戶選擇的核心。”
唐志敏強調,當前算力性能突破需跨學科交叉與軟件深度優化雙輪驅動。他以Linpack測試為例,指出應用軟件性能提升難度遠超硬件迭代,通過軟硬件協同優化,在現有制程限制下實現算力效能最大化。“中國半導體受全球趨勢及制程限制,必須通過軟件定義算力,打破傳統軟硬件隔閡。”
針對GPGPU發展現狀,唐志敏警示部分產品已偏離GPU本質功能。他以生成式AI場景為例,說明圖形渲染、著色等基礎能力的重要性:"將小說轉化為電視劇,既需要GPT的內容生成,也依賴GPU的視覺呈現。" 同時,他分析系統廠商自研芯片浪潮時指出,蘋果的成功在于通過自研CPU實現產品增值與全棧軟件掌控,而"未能提升產品溢價的自研芯片終將面臨市場挑戰"。
在架構創新層面,唐志敏明確反對指令系統碎片化:"現有指令系統足以支撐架構創新,RISC-V應成為產業統一標準。"他認為,計算芯片產業正呈現螺旋式發展,未來將回歸融合異構特性的CPU中心化架構,而RISC-V的包容性可有效整合CPU、GPU及AI處理器特性,通過開源體系突破生態壁壘。
“套用三國定律來理解芯片生態,就是分久必合、合久必分,以前是以CPU為中心,現在就是去中心化的異構計算,CPU和XPU聯合起來,但也會面臨很多問題,我們希望在將來回歸到以CPU為中心的大一統,總體就說一個否定之否定的過程。”唐志敏院長最后總結稱。
劉方明教授:國產算力驅動大模型需破解體系化挑戰,生態應從“野蠻生長”走向集約與開放
![]()
面向AI大模型和智能體興起的機遇和挑戰,第二位演講嘉賓劉方明教授作了題為《國產算力驅動的大模型體系化挑戰:全生命周期工具鏈與示范應用》的主題報告。
首先,劉方明教授分析了當前大模型的發展趨勢。他指出,當前算力中心和芯片等AI Infrastructure需要智算應用驅動,全球范圍內大模型數量和智能體應用已呈爆發式增長。
但他同時觀察到一種新動向:“隨著DeepSeek的推出,全球模型有從‘百模大戰’向‘十模爭鋒’的收斂趨勢。”
針對國內大模型發展生態,他指出當前仍面臨“野蠻生長”帶來的多重挑戰:國產模型能力存在差距、開源率低、工具鏈缺乏體系化、評測標準不統一以及價值對齊合規安全仍需技術保障。
他進一步介紹了鵬城實驗室作為國家實驗室的獨特定位——“保底線”,致力于在極端情況下保障國產算力主權和模型的自主可控。
“現在模型正逐漸走向集約化路線,不是只比誰規模大、暴力出奇跡了,而是看誰能用最少的數據、最少的算力、最少的能耗做出好用的模型。”劉方明尤其強調了范式的轉變。
鵬城實驗室在發布了2000億參數的大語言模型后,又推出了33B和2B參數的中小尺寸模型,并將2B參數模型全過程開源,包括所有數據和數據配比、權重和訓練環節,方便用戶復現和使用。
最后,他重申了“用以致善”的理念:“好的模型、算力、芯片、硬件是靠用出來的。”目前,鵬城實驗室正與氣象、金融、文博、生態環境、智能制造等行業合作,推動大模型在典型場景中的示范應用,以實踐驅動國產算力與大模型全生命周期體系的成熟。
燧原科技聯合創始人兼首席生態官李星宇:國產算力行業將迎來淘汰賽,軟件生態是關鍵勝負手
![]()
燧原科技聯合創始人兼首席生態官、芯片行業資深專家李星宇,在大會上帶來題為《時不我待,破局國產AI算力技術生態》的主題演講。
作為國產AI算力領域的深耕者與實踐者,李星宇親歷了國產算力芯片從技術攻堅到商業化落地的全歷程,在算力硬件創新、軟件生態構建與產業場景融合等領域有著豐富經驗。
李星宇拋出一組關鍵數據:“今年全球算力投資資本支出預計將超過4600億美金,超過美國登月計劃的總投入。”他解釋,當前全球頂級互聯網公司在AI領域的大部分資本支出(CapEx)用于算力采購,中國市場同樣如此,BAT等互聯網大廠占據了68%以上的份額。
從商業化應用看,AI正加速滲透至AI編程、數字IP內容領域。李星宇提到,“AIGC在數字人、游戲、影視行業今年國內產值預計超1000億,全球數字內容生成市場規模已近500億美金,加上AI編程領域、虛擬交互這三大場景構成了當前AI商業化的主戰場。”
而在這三大主戰場背后,GPU作為核心算力載體,其競爭的勝負手早已超出硬件性能本身,延伸至生態層面。“軟件生態是GPU硬件行業的勝負手。”
而中國的表現令全球矚目。李星宇強調,“中國已成為大模型領域的開源生態領導者。HuggingFace Top10模型中,9個來自中國公司。更關鍵的是,在實際商業化場景中,中國開源模型生成的Token量已超過全球其他開源模型總和。
談及技術演進,李星宇指出,軟硬結合,AI算法需求驅動計算架構持續創新,數據格式的創新和優化帶來了算力性能的提升,從FP32到FP16再到FP8和FP4,每一次迭代都需要硬件架構的支持和軟件生態的集成優化。
硬件層面,技術棧的范圍從單芯片加速向超大規模系統工程演進,在單芯片架構層面,需要CPU和XPU整個異構系統的軟硬件協同優化,綜合標量、向量和張量計算,更高效率支持算法的工程創新,如PD分離、MLA、MTP等。軟件層面,更需要深度擁抱開源軟件生態,如DeepSeek,Qwen,ChatGLM3等,借助生態的力量充分釋放硬件的算力。集群層面,要解決超高速互聯技術、系統分級存儲、以及液冷等挑戰。
“國產算力行業將迎來淘汰賽。”李星宇直言,由于系統級產品研發需海量資金投入,今年國內算力企業正全力沖擊資本市場,預計未來一年A股和港股至少6家公司沖刺上市。資金和技術儲備不足、生態布局薄弱的企業或將加速出局。得益于豐富的商業化應用場景,燧原的產品迭代獲得了堅實支撐,國民級爆款應用已經用到了燧原的算力。
“破局國產算力技術生態,是一場技術、商業與人才的長跑”,李星宇最后總結道,擁抱開源,構建開放、統一的技術體系,避免“煙囪式”發展、凝聚生態合力;綁定場景,與“AI+場景”深度綁定,以商業化場景打磨技術棧;培育人才,從社區和高校源頭入手,將國產AI算力技術棧融入人才培養體系。
摩爾線程副總裁王華:萬卡集群+智能工具鏈,破解大模型訓練效率與穩定性難題
![]()
隨后,摩爾線程副總裁王華作了題為《基于國產GPU集群的大規模訓練實踐》的主題演講,系統介紹了大模型訓練當前面臨的挑戰、摩爾線程的軟件棧指出以及提升訓練效率的關鍵技術與工具。
王華開宗明義地介紹了萬卡甚至更大規模的集群的必要性。他以Kimi、GPT-5、Grok等模型為例,揭示其計算量已超過了的102? FLOPs量級。在此背景下,集群規模成為壓縮訓練時間的核心變量。
一組對比數據直觀而震撼:對于某個特定大模型,千卡集群需耗時173天,而在萬卡集群上,即便模型浮點運算利用率(MFU)會從40%降至30%,訓練時間也能被大幅壓縮至23天。
“對于大模型來說,訓練非常關鍵。現在模型的競爭非常激烈,一些算法實驗希望快速驗證效果,而完成訓練的時間越短越好,最好不要超過1個月。”王華強調道。
那么,如何系統性地駕馭這個龐大而復雜的生命周期?王華隨后分享了摩爾線程的“全棧應對之道”。
在軟件生態上,摩爾線程提供了從Model Studio一站式平臺、深度融合的MT-MegatronLM與DeepSpeed框架、適配國產GPU的Torch-MUSA與MT-TransformerEngine,到底層MUSA計算庫及KuaE集群平臺的全棧支持。
此外,摩爾線程還構建了一套貫穿訓練前、中、后期的智能工具體系,旨在將不可控的風險轉化為可管理、可自動恢復的常規操作。
在訓練啟動前,SimuMax 支持訓練資源規劃與時間估算,并可驗證優化效果;起飛檢查對計算、網絡、存儲及軟件環境進行全面診斷,保障集群健康。
訓練過程中,慢節點檢測系統實時定位硬件或通信異常;針對隱蔽的靜默數據錯誤,通過硬件監控與重運行(Re-Run)等措施防范;Hang問題可通過定位源頭節點并自動重啟恢復;面對 Inf/NaN 異常,系統可自動檢測并通過重運行或更換節點處置。
同時,分布式 Profiling 系統提供從輕量級實時洞察到全鏈路深度分析的能力,支撐持續性能調優。
展望未來,摩爾線程以“為美好世界加速”為愿景,正致力于通過全功能GPU與全棧軟件能力的深度融合,為這場AI算力的極限挑戰提供堅實、高效且智能的基礎設施。
云天勵飛技術副總裁羅憶:2025年是AI芯片消耗關鍵拐點,推理芯片消耗或將超過訓練芯片
![]()
云天勵飛技術副總裁羅憶,在大會上帶來題為《芯智AI筑基,普惠點亮未來》的主題演講。
作為深耕AI芯片與智能生態領域的資深從業者,羅憶見證了人工智能從技術突破到規模化應用的演進歷程,在算力芯片架構創新、AI推理技術路線探索與產業生態落地等方面有著深厚積累。
羅憶指出,AI產業正從“模型訓練”向“推理應用”加速切換。2025年,AI芯片消耗將迎來重要轉折,推理芯片消耗量或將超過訓練芯片。這一判斷源于企業端推理需求的爆發:谷歌日調用量已達43萬億Token,字節跳動近期或突破40萬億,云廠商如谷歌、亞馬遜等已加速自研推理芯片以應對需求。
針對大模型應用的“經濟學困境”,羅憶強調成本優化是關鍵。當前萬億參數模型面臨算力、帶寬等成本的“幾何級增長”,需通過稀疏化、蒸餾化、量化優化等技術降低門檻,推動AI從“高成本探索”走向“規模化普惠”。
談及中國AI發展路徑,羅憶總結為“數據飛輪”模式: 應用生產數據-數據訓練算法-算法定義芯片-芯片賦能規模化應用 。區別于美國通過政策強推技術突破的路徑,中國以“人工智能+”計劃為核心,依托千行百業的場景落地反哺技術迭代,逐步縮短與美國在AI產業鏈上的差距。
在國產AI推理芯片方面,羅憶提出三個發展方向:軟件生態兼容,以平衡算法迭代與算力利用率;突破存儲技術瓶頸,支持3D memory技術;異構計算與優化性價比,目標在未來三到五年內讓百萬Token成本降至1元以內。
云天勵飛作為國產AI芯片代表,已完成芯片架構升級,實現全流程國產工藝轉型,構建起覆蓋端邊云的產品矩陣。
IO資本創始合伙人趙占祥:大模型算力突圍需摒棄“單點追趕”,以系統級架構與工藝創新開辟多元化中國路徑
![]()
論壇的最后一位嘉賓,是來自IO資本的創始合伙人趙占祥,他專注于硬科技與半導體領域的早期及成長期投資,會上發表了題為《大模型時代,國產AI芯片破局的幾種新技術路線》 的演講。
趙占祥在演講伊始,就將話題聚焦于當前的核心制約——在美國對華出口管制不斷升級,瞄準先進計算與先進制造產業鏈的背景下,未來我們怎樣在工藝受限的情況下超過英偉達?
“只能靠新的技術路徑。”趙占祥給出了他的答案。
面對從先進制程、HBM到先進封裝的全面限制,國內已涌現出一批從架構革新、工藝融合、系統優化入手的創新企業,其路徑呈現出多元化特征。趙占祥從云端AI芯片、邊緣AI芯片、端側AI芯片、loT末端AI芯片以及先進封裝等不同方向,分享了不同企業的創新路線。
在數據中心的AI芯片,部分企業摒棄了對單卡算力的盲目追求,轉而構建更高效的系統。例如,TPU路線通過打造大規模超節點、省去交換機和HBM,在集群層面追求更高性價比;以太網互聯網方案可以做到百萬卡的分布式集群,允許丟包,可擴展性更高。
在邊緣AI芯片方向,隨著桌面級AI應用(如AI NAS、AI攝像頭)的井噴,專為這些場景設計的LPU架構等應運而生,它們通過3D DRAM堆疊等技術,在有限功耗和成本下實現驚人的內存帶寬。
在端側AI芯片方向,主要針對手機以及各種智算終端,存算一體與近存計算成為關鍵。無論是將計算單元嵌入存儲芯片的3D-CIM架構,還是在LPDDR內存中集成處理能力的PIM方案,目標都是在手機有限的面積和功耗預算內,流暢運行數10億參數的大模型。
“3D DRAM,要靠先進封裝”。趙占祥強調,大算力芯片正在向三維架構變革,這使得先進封裝及其檢測設備不再是配角,而是決定性能和良率的核心。
更進一步,趙占祥直言:“光電合封,是下一代AI算力的基石。”能以數量級優勢提升集成度、降低功耗,是突破現有電氣互聯瓶頸的關鍵方向。
“中國真正強的是,我們可以把應用做好,有工程師紅利,我們在各個領域都有不同的定制化方案和創新的解決路線。”趙占祥的洞察揭示了此次芯片創新浪潮的驅動力——不是單一技術的顛覆,而是在廣泛的應用需求牽引下,通過多條技術路徑的并進,系統性構建自主的AI算力生態。
結語
“誰是下一個寒武紀?”——這場思辨在討論中暫告段落,答案并未指向某個具體名字,卻清晰揭示出:追問本身,遠比答案更重要。
本次論壇的意義,正在于將這一具體追問,拓展為對產業未來的系統性審思——從技術路徑的抉擇、生態模式的構建,到商業邏輯的沉淀。
尋找的過程,即是建構的過程。
我們或許尚未見到最終的引領者,卻已在思辨中凝聚了共識,辨明了前行的方向與必須夯實的基石。
這份對前沿的探索與對創新的篤行,正是驅動產業持續進化的根本動力。
我們期待,以此論壇為新的起點,產學研投各界能凝聚更廣泛的共識,形成更強大的合力。
智算新時代的帷幕已然拉開,關于技術路徑、產業格局與未來定義的探討仍將延續,讓我們懷抱這份期待,在未來征程中,再次相聚,共見分曉。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.