<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek開源MoE新利器LPLB:基于線性規劃,專攻訓練動態負載不平衡

      0
      分享至


      剛剛DeepSeek在GitHub開源了LPLB(Linear-Programming-Based Load Balancer)。這是一個基于線性規劃的并行負載均衡器,旨在優化MoE(混合專家)模型的專家并行工作負載分配

      看起來 DeepSeek 和老黃的思路是一致的

      英偉達在一個由 NVLink 連接的 1 萬張 GPU 集群里,用完全一樣的機制來給不同 kernel 分配 SM(GPU 的計算單元:Streaming Multiprocessors)。DeepSeek 做的事也一樣,只不過它把這個調度機制往上抽象了一層,做到了整個 pipeline 級別

      目前該項目處于早期研究階段,性能提升仍在評估中。

      核心功能與實現

      LPLB主要通過以下機制實現動態負載均衡:

      動態重排序:基于工作負載統計信息對專家進行動態重排序(該過程由嵌入的EPLB輔助)

      副本構建:考慮靜態拓撲結構構建專家副本

      最優Token分配:針對每個批次(Batch)求解最優Token分配方案

      在技術實現上,其內置的LP(線性規劃)求解器實現了單SM內點法(Interior Point Method, IPM),并利用NVIDIA的cuSolverDx和cuBLASDx庫進行線性代數運算。

      工作負載統計信息可由用戶提供,通過torch.distributed收集,或從Deep-EP緩沖區的內部通信器獲取。

      工作原理

      LPLB是對EPLB(Expert Parallelism Load Balancer)的擴展,旨在解決MoE訓練中的動態負載不平衡問題:

      EPLB:主要處理由數據分布引起的靜態不平衡(如某些專家持續過載)。

      LPLB:針對訓練過程中小批次隨機性引起的每批次波動

      具體機制:

      1.冗余專家:每個冗余專家鏈接到一個原始專家,在GPU之間形成邊(Edge)

      2.邊容量:邊的容量定義為當前批次分配給冗余專家的Token數量,即用于平衡的最大Token流

      3.LP優化:LPLB求解線性規劃問題,在尊重邊容量的前提下沿這些邊重新分配Token,以最小化專家并行(EP)組內的負載不平衡。

      在該過程中,待復制的專家通過EPLB選擇(僅重排序,不復制),最重的專家根據選定的LPLB拓撲進行復制。為了減少通信開銷,實時工作負載同步利用NVLINK和NVSHMEM(需預裝DeepEP),而非torch.distributed.allreduce

      支持的拓撲結構

      LPLB支持通過修改r2o矩陣探索自定義拓撲,典型拓撲包括:

      Cube:在GPU子集上復制專家,形成帶有對角邊的立方體圖。每GPU至少需要2個專家。適用于8-GPU EP子組內的平衡,且不犧牲節點間通信

      Hypercube:類似于Cube,但排除對角邊,需要16個GPU。適用于跨16個GPU的專家并行

      Torus:在同一節點的鄰居GPU和鄰居節點的GPU上各復制一個專家,形成環面圖。每GPU至少需要2個專家。適用于全局平衡,但由于節點內通信效率原因,效果可能不如Cube

      局限性

      成本估算:目前的規劃器僅平衡總Token數量,未考慮分組矩陣乘法時間成本的非線性,可能導致次優性能

      求解延遲:求解器進行節點內優化耗時約100 μs(節點間更長),對于小批次任務,此開銷不可忽略

      極端不平衡:在全局負載極端不平衡的情況下,由于LPLB避免將多個副本分配給同一原始專家,其表現可能不如EPLB

      安裝與使用

      預備條件:

      CUDA Toolkit >= 12.6.3(包含cuSolverDx依賴)。

      DeepEP(可選,但強烈建議用于實際生產)。

      EPLB(已嵌入)

      安裝命令:

                                                                          ./download-mathdx.sh
      # export NVSHMEM_DIR=... # 可選
      pip install --no-build-isolation .

      接口示例:

                                                                          # 定義冗余專家拓撲
      r2o = torch.tensor(
      [
      [3, 0, 1, 2, 7, 4, 5, 6],
      [6, 7, 4, 5, 0, 1, 2, 3],
      ]
      ).T.int().cuda()

      planner = Planner(
      r2o,
      n_logical_experts + n_redundants_per_rank * ep_size,
      n_logical_experts,
      group=ep_group,
      )

      # 規劃器返回物理專家索引
      redirected_indices = planner.run(indices, avail_counter, N_SMS)

      項目地址:https://github.com/deepseek-ai/LPLB

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      反轉了!臭豆腐賠償到位大頭被捐,女兒成眾矢之的,再找工作難了

      反轉了!臭豆腐賠償到位大頭被捐,女兒成眾矢之的,再找工作難了

      離離言幾許
      2026-03-01 12:08:32
      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發聲

      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發聲

      參考消息
      2026-02-28 22:08:44
      砍9分11籃板!中國男籃1米98奇兵正負值+21:郭士強用對他

      砍9分11籃板!中國男籃1米98奇兵正負值+21:郭士強用對他

      李喜林籃球絕殺
      2026-03-01 18:48:10
      狗咬人被摔死,狗主人帶9人復仇被60歲老人反殺!是正當防衛嗎?

      狗咬人被摔死,狗主人帶9人復仇被60歲老人反殺!是正當防衛嗎?

      何慕白
      2025-11-13 10:22:09
      椰樹太顛了!代言人婚紗照成網紅打卡地,“土味營銷”天花板!

      椰樹太顛了!代言人婚紗照成網紅打卡地,“土味營銷”天花板!

      LOGO研究所
      2026-03-01 11:19:49
      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      春江財富
      2026-03-01 08:39:41
      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項了7部武俠片

      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項了7部武俠片

      電影票房預告片
      2026-02-26 23:39:18
      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

      墨印齋
      2026-02-26 08:32:20
      金靖自曝過完年胖了6斤,怎么工作啊,網友調侃年味都長身上了

      金靖自曝過完年胖了6斤,怎么工作啊,網友調侃年味都長身上了

      韓小娛
      2026-03-01 09:57:40
      中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

      中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

      封面新聞
      2026-03-01 22:14:05
      抵債的方式能有多離譜?網友:賠了我八個車位

      抵債的方式能有多離譜?網友:賠了我八個車位

      另子維愛讀史
      2026-02-28 20:39:11
      網紅民宿降價也無人問津?這屆“摳門”的年輕人擠爆體制內招待所

      網紅民宿降價也無人問津?這屆“摳門”的年輕人擠爆體制內招待所

      藍鯨新聞
      2026-02-24 16:03:06
      中領館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      中領館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      閃電新聞
      2026-02-26 12:46:48
      男籃世預賽晉級形勢分析!中國隊1戰定生死:韓國或被聯手踢出局

      男籃世預賽晉級形勢分析!中國隊1戰定生死:韓國或被聯手踢出局

      籃球快餐車
      2026-03-01 00:42:22
      伊朗犯下10月7日的致命失誤,導致其失去一切

      伊朗犯下10月7日的致命失誤,導致其失去一切

      山河路口
      2026-03-01 20:25:18
      鄒市明一家國外度假,冉瑩穎挑染紅發似精神小妹,軒軒180cm超帥

      鄒市明一家國外度假,冉瑩穎挑染紅發似精神小妹,軒軒180cm超帥

      瘋說時尚
      2026-03-01 11:38:45
      美伊戰爭進入第二天,美軍投入大量新式武器,伊朗連射20輪導彈

      美伊戰爭進入第二天,美軍投入大量新式武器,伊朗連射20輪導彈

      鐵血戰史1927
      2026-03-01 18:37:15
      無錫二院!你要火了!

      無錫二院!你要火了!

      無錫eTV全媒體
      2026-03-01 11:46:51
      富士康創始人郭臺銘:“若兩岸爆發沖突,我會誓死守護臺灣”

      富士康創始人郭臺銘:“若兩岸爆發沖突,我會誓死守護臺灣”

      百態人間
      2026-02-12 15:21:00
      2026-03-01 23:32:49
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1034文章數 396關注度
      往期回顧 全部

      科技要聞

      榮耀發布機器人手機、折疊屏、人形機器人

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      體育要聞

      火箭輸給熱火:烏度卡又輸斯波教練

      娛樂要聞

      黃景瑜 李雪健坐鎮!38集犯罪大劇來襲

      財經要聞

      中東局勢升級 如何影響A股、黃金和原油

      汽車要聞

      理想汽車2月交付26421輛 歷史累計交付超159萬輛

      態度原創

      藝術
      游戲
      家居
      親子
      公開課

      藝術要聞

      2025年第二屆少兒美術教師作品展 | 油畫選刊

      LPL季后賽:IG復仇NIP,成功挺進下輪

      家居要聞

      素色肌理 品意式格調

      親子要聞

      寧愿挨一刀也不愿順產?宋玉希四胎道出想剖腹產的原因,太不值當

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版