<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSpeed v0.18.4 發布:優化穩定性與兼容性,全面支持 Python 3.12 與 AMD ROCm

      0
      分享至




      2026 年 1 月 8 日,DeepSpeed 官方正式發布 v0.18.4 版本。本次更新主要聚焦于 性能優化、穩定性修復、兼容性增強,并帶來了對 Python 3.11 / 3.12PyTorch 2.8 / 2.9AMD ROCm 的全面支持。該版本共包含 23 次提交,涉及 14 位貢獻者,修改文件數 41 個,是一次重要的維護與優化版本。下面我們詳細解讀 v0.18.4 的更新內容。

      一、核心更新與改進 ? 1. 版本管理與測試體系優化

      • ? 更新版本號并同步測試框架。

      • ? 在編譯測試中禁用 deterministic 選項,以提升測試靈活性與速度。

      • ? 在持續集成(CI)層面新增 AWS 測試工作流,使測試環境更加多樣化和穩定。

      • ? 啟用對 Python 3.113.12 的自動化測試支持,進一步拓寬兼容邊界。

      ? 2. 性能優化與引擎可靠性提升
      • ? 修復 SuperOffloadOptimizer_Stage3 崩潰問題(由缺失 param_names 參數引起)。

      • ? 改進 Engine 模塊,僅在 scale_wrt_gas 為 True 時才對梯度進行縮放,從而提升計算效率。

      • ? 修復 Nebula Checkpoint Engine 的 commit() API 不匹配問題,完善接口一致性。

      • ? 修復 DecoupledCheckpointEngine 潛在死鎖問題,并增強整體可靠性。

      • ? 優化 DeepSpeed Async I/O 機制,通過釋放 Python GIL 解決罕見的異步等待卡死問題。

      • ? 修復 OnebitLamb 在空參數情況下出現的 NaN 傳播問題,提升分布式優化器穩定性。

      • ? 修復 BF16_Optimizer 在 DummyOptim 模式下的 IndexError 異常,保障兼容性。

      ? 3. 深度學習框架與功能兼容
      • ? 改進 DeepCompile 模塊,以確保與 PyTorch 2.8 / 2.9 的高度兼容。

      • ? 替換 torch.sqrtmath.sqrt ,解決因不同實現導致的學習率縮放誤差問題。

      • ? 更正 MOE 檢查點中的分布式尺寸定義,將 dp_world_size 替換為 seq_dp_world_size

      • ? 修復 UlyssesSPAttentionHF 與 PEFT 模型在注冊時的兼容性錯誤。

      • ? 針對部分依賴 Triton 的測試用例進行修復,確保多平臺一致性。

      二、硬件支持與平臺增強 ? 1. AMD ROCm 支持增強

      本次版本顯著提升了 AMD GPU(ROCm 平臺)的支持能力,對相關后端進行了進一步優化。部分 AMP 測試用例被跳過,以確保在 AMD 環境下的執行穩定性。

      ? 2. BF16 支持檢查優化

      新增 BF16 支持的 fallback 檢測邏輯,可在硬件不支持時自動回退至安全路徑,提升兼容性與健壯性。

      三、代碼質量與小幅修正

      • ? 修復若干拼寫錯誤,提升代碼可讀性。

      • ? 在反向傳播 Hook 中跳過 None 值,修復潛在異常。

      • ? 移除 OpenMPIRunner 中過早的 MPI 環境變量檢測邏輯,增強啟動靈活性。

      • ? 移除了舊版 AMP 相關測試用例,保持代碼庫簡潔。

      四、文檔與生態更新
      • ? 補充并發布 Core API 更新日志,完善官方文檔體系。

      五、總結

      代碼地址:github.com/deepspeedai/DeepSpeed

      DeepSpeed v0.18.4 是一次高質量的維護性更新,覆蓋了 兼容性、穩定性、測試體系、性能優化 等多個方面,對 AMD 生態及高版本 Python / PyTorch 的支持尤為顯著。對于研發者而言,本次版本在大規模分布式訓練的可靠性上帶來了切實提升。

      版本要點回顧:

      • ? ? 全面支持 Python 3.11 / 3.12 與 PyTorch 2.8 / 2.9

      • ? ? 增強 AMD ROCm 兼容與性能

      • ? ? 提升 DeepSpeed Async I/O、Checkpoint 引擎穩定性

      • ? ? 優化梯度縮放與學習率計算邏輯

      • ? ? 改進 BF16、MOE、Ulysses 等子模塊

      • ? ? 新增 AWS 測試工作流,強化 CI 能力

      結語:
      隨著 v0.18.4 的發布,DeepSpeed 在多平臺深度訓練生態中進一步鞏固領先地位,為開發者提供了更高效、更可靠的訓練引擎支持。未來版本將繼續深化異構計算與自定義算子的優化,讓大規模模型訓練更快、更穩。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      簡直太偉大!43000+12000+12000,詹姆斯再次刷新NBA天花板!

      簡直太偉大!43000+12000+12000,詹姆斯再次刷新NBA天花板!

      田先生籃球
      2026-04-12 22:06:33
      伊能靜大方曬自己的打針照片,坦言每年醫美費超出七位數。

      伊能靜大方曬自己的打針照片,坦言每年醫美費超出七位數。

      情感大頭說說
      2026-04-13 00:09:30
      溫瑞博4-2奪冠!逆轉原因曝光,誰注意他賽后一番話,展現高情商

      溫瑞博4-2奪冠!逆轉原因曝光,誰注意他賽后一番話,展現高情商

      體育就你秀
      2026-04-13 06:05:03
      特朗普即將訪華!白宮高官爆料:總統對華態度友好,中方大可放心

      特朗普即將訪華!白宮高官爆料:總統對華態度友好,中方大可放心

      青煙小先生
      2026-04-13 09:59:22
      尸骨未寒!陳麗華剛走,遲重瑞被當眾挑毛病,眾目睽睽下顏面掃地

      尸骨未寒!陳麗華剛走,遲重瑞被當眾挑毛病,眾目睽睽下顏面掃地

      一盅情懷
      2026-04-12 15:22:24
      “戲混子”又來霍霍年代劇?老氣橫秋、演技拉胯,難怪觀眾不買賬

      “戲混子”又來霍霍年代劇?老氣橫秋、演技拉胯,難怪觀眾不買賬

      科普100克克
      2026-03-27 00:17:05
      73歲的普京恐怕沒想到,和烏克蘭打了四年,最支持他的反而是這國

      73歲的普京恐怕沒想到,和烏克蘭打了四年,最支持他的反而是這國

      小小科普員
      2026-04-10 16:37:53
      美國宣布:今日起,封鎖伊朗港口海上交通!兩艘油輪在霍爾木茲海峽掉頭

      美國宣布:今日起,封鎖伊朗港口海上交通!兩艘油輪在霍爾木茲海峽掉頭

      中國航務周刊
      2026-04-13 08:10:41
      孫怡怒稱發布會是趙子琪淘汰會!宣布不當隊長,全網炸鍋

      孫怡怒稱發布會是趙子琪淘汰會!宣布不當隊長,全網炸鍋

      一盅情懷
      2026-04-12 15:56:31
      華為nova 16曝光:麒麟9020+7000mAh,這次配置有點東西

      華為nova 16曝光:麒麟9020+7000mAh,這次配置有點東西

      小柱解說游戲
      2026-04-13 09:35:51
      張杰16場鳥巢豪賭慘淡收場?演唱會票價腰斬背后,行業泡沫誰買單

      張杰16場鳥巢豪賭慘淡收場?演唱會票價腰斬背后,行業泡沫誰買單

      一盅情懷
      2026-04-12 16:13:23
      30分鐘直撲東北!美國派48架F-35兵臨城下,解放軍:敢動就全殲!

      30分鐘直撲東北!美國派48架F-35兵臨城下,解放軍:敢動就全殲!

      古史青云啊
      2026-04-13 09:27:32
      有一種頂級的認知:這世上90%的事不需要贏,只需要脫身

      有一種頂級的認知:這世上90%的事不需要贏,只需要脫身

      洞見
      2026-04-10 09:45:26
      河北邯鄲一佳人太漂亮了,五官精致, 身高169,美得讓人移不開眼

      河北邯鄲一佳人太漂亮了,五官精致, 身高169,美得讓人移不開眼

      寶哥精彩賽事
      2026-04-11 17:14:18
      中國“撿錢”時代將要來臨:若手中只有10萬,試下死啃這兩條線

      中國“撿錢”時代將要來臨:若手中只有10萬,試下死啃這兩條線

      混沌錄
      2026-04-03 17:28:23
      女人一般曖昧多久,才會主動和男人同房呢?

      女人一般曖昧多久,才會主動和男人同房呢?

      思絮
      2026-04-13 10:08:13
      黎巴嫩一國兩軍:真主黨這個“國中之國”,為何徹底綁架黎巴嫩?

      黎巴嫩一國兩軍:真主黨這個“國中之國”,為何徹底綁架黎巴嫩?

      環球情報員
      2026-04-11 21:23:51
      一周竟然7次,32歲男子心源性猝死,妻子:勸了很多次,就是不聽

      一周竟然7次,32歲男子心源性猝死,妻子:勸了很多次,就是不聽

      健康之光
      2026-04-08 10:56:55
      特朗普祭出“海峽封鎖令”,威脅切斷伊朗經濟命脈

      特朗普祭出“海峽封鎖令”,威脅切斷伊朗經濟命脈

      鳳凰網財經
      2026-04-13 10:02:25
      死腦筋!被一人投進9記三分,許帥卻束手無策,解說:變下防守呀

      死腦筋!被一人投進9記三分,許帥卻束手無策,解說:變下防守呀

      金山話體育
      2026-04-12 23:11:58
      2026-04-13 10:43:00
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1177文章數 64關注度
      往期回顧 全部

      科技要聞

      李想向黑水軍開炮!連發5條朋友圈

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      體育要聞

      創造歷史!五大聯賽首位女性主教練誕生

      娛樂要聞

      賭王女兒何超蕸病逝,常年和乳癌斗爭

      財經要聞

      封鎖,還是收費站?

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      游戲
      旅游
      數碼
      家居
      軍事航空

      頑皮狗多項目并行開發?曝《美末3》真的在做了

      旅游要聞

      大咖齊聚濟源 王屋山文旅節解鎖文旅融合新玩法

      數碼要聞

      聯蕓將開發PCIe Gen6消費級SSD主控MAP2001,瞄準28GB/s

      家居要聞

      復古風格 自然簡約

      軍事要聞

      美國副總統萬斯:美伊談判未能達成協議

      無障礙瀏覽 進入關懷版