<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      不跟英偉達走老路,這家GPU公司的技術架構藏著哪些關鍵解?

      0
      分享至


      采訪嘉賓 | 天數智芯 AI 與加速計算技術負責人單天逸

      作者 | 凌敏

      對于國產 GPU 行業來說,沒有哪個時間節點比當下更寶貴。在政策支持硬科技企業上市的背景下,國產 GPU 迎來了難得的上市黃金窗口期。但上市并非終點,在敲鐘的那一刻,下一戰場大幕已經拉開——GPU 廠商的技術路線、產品能力和長期判斷,被放到了更公開也更嚴苛的舞臺上,誰能撐起資本市場和大眾期待,誰就能撐起市值。

      這也是為什么,天數智芯上市后的首場發布會能夠在業內形成廣泛討論。它以極其務實的工程師表達方式,把架構放回到國產 GPU 技術敘事的中心。在 1 月 26 日召開的天數智芯“智啟芯程”合作伙伴大會中,圍繞架構層的創新與思考占據了相當比重。基于這些創新點與思考,天數智芯公布了過去一代以及未來三代的架構路線圖:

      • 2025 年,天數天樞架構已經超越英偉達 Hopper,在 DeepSeek V3 場景中實測性能數據超出 20%;

      • 2026 年,天數天璇架構對標 Blackwell,新增 ixFP4 精度支持;

      • 2026 年,天數天璣架構超越 Blackwell,覆蓋全場景 AI/ 加速計算;

      • 2027 年,天數天權架構超越 Rubin,支持更多精度與創新設計。


      1 國產 GPU,開啟 AI++ 計算新范式

      根據天數智芯公布的架構路線圖及階段發展目標,在 2027 年之前,天數智芯將通過多代產品完成對英偉達的追趕;在 2027 年之后,將轉向更富創新性的架構設計,聚焦更具突破性的超級計算芯片架構設計。看似宏大,但對于仍處于爬坡階段的國產 GPU 行業來說,這條路徑實際上相當務實——只有在工程化能力上完成對標甚至是超越,國產 GPU 才有資格進入更大規模的生產環境中。

      而在規模化落地階段的競爭,焦點早已從峰值性能指標轉向有效計算能力。當 Token 成為 AI 時代最基本的生產資料,當算力消耗開始對標真實業務產出,無論是國際頂尖 GPU 廠商還是國內 GPU 企業,核心命題都只有一個:如何在真實業務中,把算力轉化為有效的 Token。這似乎又將大家都拉到同一起跑線。

      圍繞這一命題,天數智芯提出了兩條明確的架構判斷:其一,回歸計算本質;其二,提供高質量算力。

      回歸計算本質,核心在于“不設限”

      過去十年,規模的快速擴張帶來了階段性的產業繁榮,也使得算力實現野蠻增長。但這種粗放式發展,也帶來了能效比失衡、算力資源嚴重浪費等問題。背后的根因十分復雜。以開車行駛為例,路途中可能會遇到雨雪冰雹天氣、崎嶇道路等各種復雜情況。物理、芯片、系統世界也是如此,計算、通訊、存儲都會帶來各種障礙。所以,幻想奔跑在平坦的賽道上毫無意義,產業真正需要的,是能夠翻山越嶺的全能越野車。


      廣義上,芯片可分為專用芯片和通用芯片:專用芯片類似“應試教育”,它的優勢和邊界都很清晰,能加速特定算法、特定指令,比如矩陣乘法、Softmax 這些主流任務,但一旦計算范式發生變化,適應空間就會迅速收緊;通用芯片的設計哲學,不是為了押中某一類算法,而是回歸計算本質,覆蓋更廣泛,甚至全新的計算需求。

      這也是天數智芯堅持推出并量產通用 GPU 的根因。在其看來,硬件與算法的關系本來就不應該相互掣肘,算力的僵化不應限制算法的進化,而是通過通用算力為探索未知算法提供一個堅實的底座。

      支撐探索未來算法的關鍵,實則就是“不設限”。

      基于這一判斷,天數智芯的芯片設計哲學,在計算層面追求的是覆蓋幾乎所有的數學運算圖譜,而非某一類、某一種計算:從 Scalar、Vector、Tensor 到 Cube,支持從高精度科學計算到 AI 精度計算,從 MMA 到 DPX,不管是 AI 的 Attention 機制、前沿的科學計算,還是未來的量子計算相關模擬,天數智芯全都支持。

      在執行層面,追求的是更高的算力利用率:大、中、小任務會被精準分配到不同的計算單元中執行,配合高密度的多任務核心設計,算力可以被拆解、調度得更加精細,從而減少算力浪費,提高計算效率。


      這種“不設限”的設計哲學,讓天數天樞架構得以實現三大創新,這也是天樞能夠超越英偉達 Hopper 架構的根因:

      • TPC BroadCast(計算組廣播機制)設計:不是簡單粗暴地放大帶寬,而是從單位帶寬的使用效率入手,存在相同地址的數據時,芯片內部的 load store 單元不會進行重復、無用的訪問,而是在上游進行 BroadCast,減少不必要的內存訪問次數,從而有效降低訪存功耗,等效提升訪存帶寬,用更小的功耗和面積實現相同的功能。

      • Instruction Co-Exec(多指令并行處理系統)設計:在指令執行層面,通過 Instruction Co-Exec 設計實現了多種指令類型的并行執行能力,不僅支持 Tensor Core 與 Vector Core 的并行協同,還將 Exponent 計算、通信等操作一并納入統一調度。在天數 IX-Scheduler 模塊中,通過極低的成本增強了不同指令之間的并行處理能力,無論是 MLA、Engram,還是面向更復雜模型場景的計算需求,都可以在這一并行框架下被同時處理,從而提升整體執行效率。

      • Dynamic Warp Scheduling(動態線程組調度系統)設計:隨著 MoE 架構在大模型中被廣泛采用,模型廠商普遍面臨推理效率低等現實挑戰。為提升并行度,微架構層面允許芯片中同時駐留更多 warp,但 warp 的增加也意味著對計算資源的競爭更為激烈。為此,天數智芯首創了 Dynamic Warp Scheduling 機制,通過動態調度讓不同 warp 在資源使用上實現有序協作,避免計算資源閑置,也減少了對同一資源的無序爭搶。

      這三項設計的出發點本質上都指向相同的目標:高性能與高效率。數據顯示,這些創新讓天數天樞的效率較當前行業平均水平提升 60%,基于這些效率優勢,實現在 DeepSeek V3 場景平均比 Hopper 架構高約 20% 性能。

      從這三項設計中可以看出,天數智芯在架構層面的創新,并不是圍繞某一個具體模型或算子展開,而是試圖打破 GPU 通用范式邊界。天數智芯 AI 與加速計算技術負責人單天逸在接受采訪時表示,在天數智芯提出 Dynamic Warp Scheduling 設計之前,幾乎沒有人從調度機制的角度去思考,還能為 MoE 帶來哪些性能空間。從更深層次意義來看,這類微架構層面的調度和優化,一直是英偉達、AMD 等巨頭保持領先的“內功”,天數智芯在這些單點上的突破,實際上也是國產 GPU 向頂級玩家看齊的重要一步。

      提供高質量算力:高效率、可預期、可持續

      在天數智芯的架構語境中,回歸計算本質并不是一個抽象的口號,而是實現高質量算力的前提條件。只有當 GPU 從底層開始真正對計算負責,高質量算力才成為可能。基于這一判斷,天數智芯將高質量算力拆解為三個核心維度:高效率、可預期與可持續。


      高效率意味著能為客戶創造最優的 TCO(總體擁有成本),節省使用成本;可預期則通過精準的仿真模擬,讓客戶在拿到芯片、部署算力之前,就能清晰預判最終的性能表現,做到所見即所得;可持續指的是從現在主流的 CNN、RNN,到當下火熱的 Transformer,再到未來還未誕生的全新算法,算力始終能無縫適配。

      圍繞這三個方向,天數智芯在架構及系統設計上,選擇從多任務并行處理、長上下文 IX-Attention 模塊、IX-SIMU 全棧軟件仿真系統以及 IXAI++ 算力系統多個層面同步推進。這幾項,其實哪個都值得單獨展開探討。

      比如,基于“不設限”的設計理念,在當前 PD 分離的架構下,天數智芯的 GPU 不只做計算,還支撐通信、KV 數據傳輸這些關鍵任務,通過打造 Ⅸ 并行任務處理模塊,GPU 能精準調度 KV 傳輸、多路多流、計算與通信等各類任務,讓它們并行不沖突。在真實業務場景中,該模塊成功幫助頭部互聯網客戶實現了端到端 30% 的性能躍升。


      為了提高算力可持續性,天數智芯統一了芯片內、外,來構建算力系統,并通過不斷更新的軟件棧和軟件系統,三類庫共同支持和保障多場景的高效運行。其中,AI 庫、通訊庫(ixccl)、加速計算庫是基石,在基石之上,直接支撐各類神經網絡模型 CNN、Transformer、LSTM 與高性能計算的各個領域,并以此提供各類 AI 應用,包括支持 AI4Sci 的相關應用,如蛋白質結構預測(AlphaFold)、醫療影像分析(Clara)、氣候模擬(Earth2)等,以及量子計算的平臺 cudaQ、分子動力學 Gromacs,大規模方程組求解器 HPL 等。

      這套算力系統被命名為 IXAI++,寓意為自我迭代,不止于 AI。其最終的目標是,成為一座連接算法創新與物理世界的橋梁,帶領人類科技通往未知探索。

      但給業內帶來最多驚喜的,是 IX-Attention 模塊和 IX-SIMU 全棧軟件仿真系統。前者解決的是當前大模型推理中最具代表性的效率難題,后者解決的是企業部署算力系統最頭疼的不可控難題。

      在大模型推理場景中,長上下文被普遍認為是最具代表性的效率難題之一。即便是在國際主流 GPU 架構上,Attention 的執行效率依然不高,如果不對其進行針對性優化,首字延遲將明顯偏高,模型響應速度差,推理成本高昂,最終影響大模型在真實業務中的可用性。

      圍繞這一痛點,天數智芯設計了 Ⅸ Attention 模塊,從底層對 Attention 的執行路徑進行重構:Attention 底層涉及 exponent、reduce、MMA、atomic 等多類指令與算子,Ⅸ Attention 模塊的核心思路,是將這些分散的組件有機地拼裝到一起,如同指揮一支樂隊一般,確保多種樂器能夠和諧共鳴。


      “其中的技術難點在于調度,多種樂器需要同時演奏,任何一個環節拖慢節奏,都會成為整個系統的瓶頸”,單天逸表示,在實際的長上下文推理中,Ⅸ Attention 模塊有效改善了 Attention 的執行效率,帶來了約 20% 的提升。

      針對企業部署算力系統最頭疼的不可控難題,天數智芯搭建了IX-SIMU 全棧軟件仿真系統,這套仿真系統的目標,就是零意外、可預期。通過對芯片等硬件與軟件執行策略的聯合仿真,能精準輸出任意模型的性能表現,提升算力在真實場景中的可控性。


      單天逸表示,在算力系統的仿真與評估中,最難建模的是指令級別的硬件行為。IX-SIMU 的核心能力在于,能夠對底層指令執行進行精細建模。在實際使用中,用戶只需輸入軟件代碼,IX-SIMU 便會自動整合 GPU、CPU、網卡、PCIe 等硬件組件,匹配網絡拓撲,再結合軟件策略、投機策略、Streaming LLM 策略、前綴匹配等各類策略,最終精準輸出 Deepseek、千問等任意模型的性能表現,實現從單卡到萬卡集群的 “精密擴展”。

      圍繞高效率、可預期、可持續三大判斷,天數智芯在算力側從硬件架構到系統設計進行了整體布局,并用未來三代架構路線圖提前回答下一個問題:當算力僵化開始掣肘未來計算,架構層還能怎么演進?

      2 決定上限的,最終還是應用和生態

      架構代表的其實是下限,決定上限的,最終還是應用和生態。數據顯示,截至 2025 年年底,天數產品已在互聯網、大模型、金融、醫療、教育、交通等超過 20 個行業落地應用,服務客戶數量超過 300 家,并通過軟硬件協同優化,完成 1000+ 次模型部署,讓產品能力真正達到商用級別。

      支撐這些場景應用的,早已不是一個產品的能力范疇,而是“產品 + 解決方案” 雙軌模式,這一模式其實與英偉達定位非常相近,聚焦的都是解決方案落地。在大模型深入產業應用的當下,這套組合打法相當務實,畢竟應用落地才是唯一真理,誰能在企業真實業務場景中快速部署、持續穩定運行,誰就能贏得先機。在速度和兼容性上,天數智芯也交出了一份不錯的答卷:國內新的大模型發布當天便能跑通,目前已穩定運行 400 余種模型、數千個已有算子與 100 余種定制算子,數千卡集群穩定運行超 1000 天。

      在這次發布會上,天數智芯面向物理 AI 場景落地,一口氣發布了四款邊端算力產品“彤央”系列:包括邊端 AI 算力模組 TY1000、TY1100,以及邊端 AI 算力終端 TY1100_NX、TY1200。 據了解,“彤央”系列產品的標稱算力均為實測稠密算力,覆蓋 100T 到 300T 范圍。數據顯示,在計算機視覺、自然語言處理、DeepSeek 32B 大語言模型、具身智能 VLA 模型及世界模型等多個場景的實測中,彤央 TY1000 的性能全面優于英偉達 AGX Orin。

      在發布會中,天數智芯展示了“彤央”系列產品在具身智能、工業智能、商業智能和交通智能四大邊端核心領域的落地應用:具身智能領域,為格藍若機器人提供高算力、低延遲的“大腦”支撐;在工業智能領域,落地園區與產線,推動產線自動化升級;在商業智能領域,瑞幸咖啡數千家門店部署彤央方案,高效處理視頻流、挖掘消費數據價值;在交通智能領域,與“車路云一體化”20 個頭部試點城市合作,驗證車路協同方案。

      整體來看,天數智芯走的路線雖然是底層技術自研,但在生態上并非封閉。在生態建設上,天數智芯與硬件廠商、解決方案提供商等多家生態伙伴簽署戰略合作協議,進一步完善國產 AI 算力生態閉環。通過兼容主流開發生態,持續開放底層能力,降低開發者遷移和使用門檻。未來,天數智芯還會持續增加在生態共建上的資本與人力投入,從應用到芯片與開發者一同優化 AI 應用系統,共同為應用落地提供性能、性價比與生態易用的價值。

      從底層架構到產品,從應用到生態,國產算力正在實現完整閉環,這種從芯片到生態的協同能力,不僅讓國產算力更可用、更可持續,也為行業探索新模式提供了更多想象空間。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      重大錯誤,印制錯誤的韓國國旗被升起4次,國際奧委會已致歉

      重大錯誤,印制錯誤的韓國國旗被升起4次,國際奧委會已致歉

      懂球帝
      2026-02-22 17:22:25
      從“天才少女”跌落神壇后,17歲的姜萍如今在服裝廠踩縫紉機?一家人去向成謎

      從“天才少女”跌落神壇后,17歲的姜萍如今在服裝廠踩縫紉機?一家人去向成謎

      阿芒娛樂說
      2026-02-21 23:50:14
      徐家人如果看到馬筱梅分享的壓歲錢紅包,心情一定會很復雜吧

      徐家人如果看到馬筱梅分享的壓歲錢紅包,心情一定會很復雜吧

      早起的鳥兒有飯吃
      2026-02-23 09:13:11
      新春第一槍:原三甲院長落馬!享受“保姆式服務”,把醫院當自家后院……

      新春第一槍:原三甲院長落馬!享受“保姆式服務”,把醫院當自家后院……

      醫脈通
      2026-02-22 17:08:18
      55歲央視一哥康輝,缺席春晚真相曝光,為什么他不再拋頭露面?

      55歲央視一哥康輝,缺席春晚真相曝光,為什么他不再拋頭露面?

      天天熱點見聞
      2026-02-23 05:22:26
      48歲歐陽夏丹父母雙亡獨自過年,一個人吃7道菜,大口吃飯不矯情

      48歲歐陽夏丹父母雙亡獨自過年,一個人吃7道菜,大口吃飯不矯情

      離離言幾許
      2026-02-20 23:38:28
      訪華前,特朗普宣布對中國加稅,不到24小時,白宮收到巨額賬單

      訪華前,特朗普宣布對中國加稅,不到24小時,白宮收到巨額賬單

      蘭妮搞笑分享
      2026-02-23 12:59:42
      大滿貫爆冷:世界亞軍出局,日6人晉級,國乒新星0-3告負

      大滿貫爆冷:世界亞軍出局,日6人晉級,國乒新星0-3告負

      氧氣過敏者
      2026-02-23 12:40:06
      宋希濂晚年回憶:如果蔣介石同意將30萬人撤到緬甸,后果不堪設想

      宋希濂晚年回憶:如果蔣介石同意將30萬人撤到緬甸,后果不堪設想

      史之銘
      2025-12-29 01:44:43
      孫越訪談坦白:和岳云鵬私下不怎么聯系,成就如今的“德云一哥”

      孫越訪談坦白:和岳云鵬私下不怎么聯系,成就如今的“德云一哥”

      離離言幾許
      2026-02-21 09:26:48
      從33.27億跌到1.56億,我感慨:離開沈騰,馬麗也扛不起票房

      從33.27億跌到1.56億,我感慨:離開沈騰,馬麗也扛不起票房

      白公子探劇
      2026-02-21 23:34:43
      “我就是她取精生子的工具”清華學霸哭訴,撕開了女富豪的遮羞布

      “我就是她取精生子的工具”清華學霸哭訴,撕開了女富豪的遮羞布

      北緯的咖啡豆
      2026-02-20 19:12:17
      夫妻都奪冠拿2塊冬奧金牌,徐夢桃夫婦拿多少獎金?郭晶晶家豪氣

      夫妻都奪冠拿2塊冬奧金牌,徐夢桃夫婦拿多少獎金?郭晶晶家豪氣

      樂悠悠娛樂
      2026-02-21 13:15:00
      西部諸強全軍覆沒!全聯盟瘋狂助攻火箭,休城眾將開啟復仇之旅

      西部諸強全軍覆沒!全聯盟瘋狂助攻火箭,休城眾將開啟復仇之旅

      徐觳解說
      2026-02-23 13:29:48
      兒媳,你娘家拆遷分了3套房,我們要發了,“阿姨,我早離婚了”

      兒媳,你娘家拆遷分了3套房,我們要發了,“阿姨,我早離婚了”

      清水家庭故事
      2026-02-22 10:34:02
      兒子在越戰犧牲,老母親無路費去掃墓,等了20年終于摸到兒子墓碑

      兒子在越戰犧牲,老母親無路費去掃墓,等了20年終于摸到兒子墓碑

      歷史龍元閣
      2026-02-03 11:15:07
      中國成韓國“第二故鄉”?一文揭秘:韓國人為何熱衷于移居中國

      中國成韓國“第二故鄉”?一文揭秘:韓國人為何熱衷于移居中國

      暗香暗香
      2026-02-03 17:25:15
      縮至4小時!湖北這條南下高鐵定了,190公里串聯6城,十五五開工

      縮至4小時!湖北這條南下高鐵定了,190公里串聯6城,十五五開工

      匹夫來搞笑
      2026-02-23 12:48:25
      從2-2被絕平到4-1大勝!阿森納48小時極限自救,5分領跑卻藏隱患

      從2-2被絕平到4-1大勝!阿森納48小時極限自救,5分領跑卻藏隱患

      落夜足球
      2026-02-23 11:43:59
      女子在地鐵給孕婦讓座獲孕婦贈百元紅包,當事人:“明明設置有孕婦專座,卻沒有人給她讓座,看她坐在自帶的小矮凳上挺難受”

      女子在地鐵給孕婦讓座獲孕婦贈百元紅包,當事人:“明明設置有孕婦專座,卻沒有人給她讓座,看她坐在自帶的小矮凳上挺難受”

      觀威海
      2026-02-23 13:18:06
      2026-02-23 14:16:49
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      12068文章數 51762關注度
      往期回顧 全部

      科技要聞

      騰訊字節,“火拼”漫劇

      頭條要聞

      7名中國游客溺亡于貝加爾湖 31歲幸存者被救細節披露

      頭條要聞

      7名中國游客溺亡于貝加爾湖 31歲幸存者被救細節披露

      體育要聞

      哈登版騎士首敗:雷霆的冠軍課

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財經要聞

      結婚五金邁入10萬大關 年輕人結婚更難了

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      教育
      數碼
      游戲
      公開課
      軍事航空

      教育要聞

      大動作:英國留學劇本大變!

      數碼要聞

      英國硬盤價格高得讓人飛到美國購買:跨越半個地球竟省一大筆錢

      NS2看呆了!兩款原版NS主機獨占佳作殺入年度前五?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美軍重兵集結蓄力作戰之際 新一輪美伊談判時間“敲定”

      無障礙瀏覽 進入關懷版