<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,摩爾線程宣布開源!代碼量暴降90%

      0
      分享至


      芯東西(公眾號:aichip001)
      作者 ZeR0
      編輯 漠影

      芯東西2月10日報道,今天,摩爾線程宣布近日開源TileLang-MUSA項目,實現對TileLang編程語言的完整支持,旨在充分釋放全功能GPU的性能潛力,大幅降低國產GPU開發門檻。

      此前DeepSeek-V3大模型的研發已采用TileLang進行算子快速原型設計與性能驗證,證明了其在大規模模型訓練中的實戰價值。

      TileLang_MUSA項目已在摩爾線程多代全功能GPU上完成功能驗證與特性開發,驗證了“高層語言+國產GPU”技術路線的可行性。


      開源地址:https://github.com/MooreThreads/tilelang_musa

      一、重新定義GPU算子編程,“零門檻”實現算子遷移

      TileLang是一款基于張量分塊(Tiling)抽象的高性能AI算子編程語言,屬于領域特定語言(DSL),采用聲明式語法與類Python前端,使開發者能以接近數學公式的形式描述計算意圖,并由編譯器自動完成循環優化、內存調度與代碼生成,在保持底層性能的同時,大幅降低GPU及異構計算平臺的編程復雜度。

      在實際應用中,TileLang通過高級抽象降低開發門檻,具備跨平臺能力,實現“一次編寫、多架構運行”,編譯器自動執行Layout推導、線程映射、Warp特化、流水線排布、內存優化等復雜優化,在保障性能的同時提升GPU計算的開發效率,已廣泛應用于AI與機器學習、科學計算等領域。

      TileLang-MUSA項目提供了一種介于底層匯編與高層DSL之間的“中間層”抽象,
      在保留硬件控制力的同時,顯著降低編程復雜度。

      該項目硬件兼容性良好,已在摩爾線程多代全功能GPU上完成功能驗證與打通,包括訓推一體全功能智算卡MTT S5000MTT S4000。

      團隊還實現了TileLang高層語義到摩爾線程GPU底層MUSA架構的精準映射。

      • Tensor Core加速:編譯器能夠自動調用MUSA的MMA(矩陣乘累加)指令,充分發揮硬件張量核心的峰值計算能力;
      • Tile-Level Pipeline:自動處理從全局內存(Global Memory)到共享內存(Shared Memory)再到寄存器(Registers)的多級數據搬運,利用MUSA異步拷貝指令掩蓋訪存延遲;
      • Warp級并行優化:完整支持Warp Specialization特性。

      目前,基于MUSA架構的TileLang原生算子單元測試覆蓋率已超過80%,為大規模應用提供了可靠保障。

      在完成環境配置后,開發者可保留原有的import tilelang習慣,通過Cython編譯后端直接在MUSA環境中運行TileLang代碼。

      二、實測兼顧開發效率與運行性能,代碼量減少約90%

      在實際算子開發實踐中,TileLang-MUSA實現了讓開發者“寫得快”且“跑得快”。

      以大語言模型中重要的FlashAttention-3和GEMM(通用矩陣乘)算子為例,在摩爾線程MTT S5000上的測試結果顯示:

      (1)開發效率倍增:相較手寫MUSA C++代碼,使用TileLang-MUSA的代碼量減少了約90%,且代碼邏輯更加清晰,極大降低了開發與維護成本。

      (2)性能媲美手寫:得益于編譯器優化,生成的算子性能在典型配置下,Gemm最高可達手寫優化版本的95%,FlashAttention-3可達手寫優化版本的85%。

      (3)自動化調優:借助TileLang-MUSA的Auto-tuning機制,開發者可在MUSA架構的全功能GPU上快速搜索最優的分塊策略(Tile Size)和流水線級數,輕松超越未經深度優化的基準實現。

      TileLang-MUSA的推出,使TileLang用戶能近乎零成本地將算子邏輯遷移至摩爾線程GPU,還為不熟悉MUSA指令集的AI工程師提供了高層次的開發入口,并通過支持FlashAttention等關鍵算子的高效開發,加速大語言模型等前沿AI應用在國產算力平臺上的部署與落地。

      結語:計劃打造基于MUSA的深度學習統一平臺

      TileLang-MUSA的開源是摩爾線程構建國產算力生態的關鍵一步,摩爾線程計劃持續推進平臺與生態建設,致力于打造一個覆蓋從單算子到完整大模型的國產算力統一加速平臺。

      其計劃包括深度集成SGLang等主流AI框架,實現Transformer、MoE等復雜模型架構的跨算子調度與全局優化,完善調試和性能分析工具鏈,以及通過性能優化,開發更多MUSA架構定制擴展,使生成代碼性能穩定達到手寫優化版本的90%以上。

      這將為構建一個開放、易用的國產算力開發生態提供工具支撐。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      苗苗情感說
      2026-04-19 12:38:15
      中方開始秋后算賬,警告兩大航運公司,不要當美國“幫兇”

      中方開始秋后算賬,警告兩大航運公司,不要當美國“幫兇”

      空天力量
      2026-04-19 17:12:39
      李想把“理想平替”喂成了狼

      李想把“理想平替”喂成了狼

      市象
      2026-04-17 16:42:52
      章子怡這張照片真的有點嚇到我了!就是后面那些墻壁

      章子怡這張照片真的有點嚇到我了!就是后面那些墻壁

      動物奇奇怪怪
      2026-04-20 03:22:27
      133號艦艇編隊為何選擇從這里進入太平洋?專家解讀

      133號艦艇編隊為何選擇從這里進入太平洋?專家解讀

      環球網資訊
      2026-04-20 12:17:06
      黎筍長子曾坦言:越南當年敢打中國有3個原因,結果發現全是錯覺

      黎筍長子曾坦言:越南當年敢打中國有3個原因,結果發現全是錯覺

      顧史
      2026-04-18 09:17:19
      伊朗打響第一槍,特朗普再下通牒,中方擔憂的事情,恐怕越來越近

      伊朗打響第一槍,特朗普再下通牒,中方擔憂的事情,恐怕越來越近

      軍機Talk
      2026-04-20 12:01:43
      中國歷史第5人!楊瀚森季后賽首秀52秒0分 工作室:在場即是成長

      中國歷史第5人!楊瀚森季后賽首秀52秒0分 工作室:在場即是成長

      醉臥浮生
      2026-04-20 11:45:27
      國際油價飆漲7%,黃金白銀、美股期指全線下挫,加密貨幣16萬人爆倉,美軍向伊朗商船開火

      國際油價飆漲7%,黃金白銀、美股期指全線下挫,加密貨幣16萬人爆倉,美軍向伊朗商船開火

      21世紀經濟報道
      2026-04-20 06:46:08
      廣州一地現“淘晶熱”,市民稱不少家長帶孩子挖水晶,樹根被刨空、地表坑洼遍地,官方發布告知書明確制止→

      廣州一地現“淘晶熱”,市民稱不少家長帶孩子挖水晶,樹根被刨空、地表坑洼遍地,官方發布告知書明確制止→

      大風新聞
      2026-04-20 11:41:04
      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      混沌錄
      2026-04-19 17:27:06
      《我在故宮修文物》導演去世,享年43歲

      《我在故宮修文物》導演去世,享年43歲

      界面新聞
      2026-04-20 12:37:14
      美伊戰事50天 全球“蒸發”了5億桶原油 這相當于……

      美伊戰事50天 全球“蒸發”了5億桶原油 這相當于……

      財聯社
      2026-04-20 10:43:31
      富國銀行:全球經濟已進入第四輪 “貨幣貶值周期” 金價2027年或飆升至8000美元

      富國銀行:全球經濟已進入第四輪 “貨幣貶值周期” 金價2027年或飆升至8000美元

      財聯社
      2026-04-20 10:26:41
      廣東一醫院發生一級甲等醫療事故,家屬申請刑事立案監督

      廣東一醫院發生一級甲等醫療事故,家屬申請刑事立案監督

      醫脈圈
      2026-04-20 12:04:46
      人民日報聯合工信部緊急預警:全體iPhone用戶,請立刻升級系統!

      人民日報聯合工信部緊急預警:全體iPhone用戶,請立刻升級系統!

      小柱解說游戲
      2026-04-19 20:52:59
      世錦賽戰報:16強決出5席!中國2勝2負1領先,世界亞軍4-10一輪游

      世錦賽戰報:16強決出5席!中國2勝2負1領先,世界亞軍4-10一輪游

      球場沒跑道
      2026-04-20 05:38:54
      美國8名兒童遭槍擊死亡:槍手為其中7名兒童的父親,逃跑被擊斃現場曝光

      美國8名兒童遭槍擊死亡:槍手為其中7名兒童的父親,逃跑被擊斃現場曝光

      新京報
      2026-04-20 10:02:29
      斯諾克名宿:丁俊暉現在比趙心童更強大,聽說他在沒日沒夜的練球

      斯諾克名宿:丁俊暉現在比趙心童更強大,聽說他在沒日沒夜的練球

      楊華評論
      2026-04-20 10:29:47
      28年前失蹤的女老板終于被找到:被謀殺后埋尸天臺花壇28年,嫌疑人改名、變年齡、整容,還主動發短信催警察“還我清白”

      28年前失蹤的女老板終于被找到:被謀殺后埋尸天臺花壇28年,嫌疑人改名、變年齡、整容,還主動發短信催警察“還我清白”

      大風新聞
      2026-04-20 09:25:10
      2026-04-20 13:32:49
      芯東西 incentive-icons
      芯東西
      專注AI芯片、半導體產業媒體
      2285文章數 8153關注度
      往期回顧 全部

      科技要聞

      藍色起源一級火箭完美回收 客戶衛星未入軌

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      體育要聞

      七大獎項候選官宣!文班或全票DPOY

      娛樂要聞

      鹿晗生日上熱搜,被關曉彤撕下體面

      財經要聞

      月之暗面IPO迷局

      汽車要聞

      把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

      態度原創

      房產
      本地
      健康
      數碼
      公開課

      房產要聞

      官宣簽約最強城更!海口樓市,突然殺入神秘房企!

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      干細胞抗衰4大誤區,90%的人都中招

      數碼要聞

      華為全新鴻蒙電腦搭載云晰柔光屏,硬件級低藍光,今日下午發布

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版