<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      LlamaFactory v0.9.4 正式發布:告別 2025,全面升級的 LLM 微調框架來了

      0
      分享至




      2025 年 12 月 31 日,LlamaFactory 正式發布v0.9.4版本。這是一個具有里程碑意義的版本,被官方定義為不可變發布版本(Immutable Release),僅允許修改發布標題和發布說明內容。
      該版本以 “Farewell to 2025” 為主題,向整個 2025 年告別,同時也宣布 LlamaFactory 將在 2026 年持續為社區提供簡單、高效、先進的大模型微調框架

      以下為LlamaFactory v0.9.4的完整更新內容詳解。

      一、重要變更(Breaking Changes)

      本次版本包含多項對使用者影響較大的變更,升級前請務必關注:

      1. 1.項目倉庫名稱變更
        倉庫名稱已從LLaMA-Factory更新為LlamaFactory,后續所有官方資源將統一使用新名稱。

      2. 2.Python 版本要求升級
        Python 3.9 與 3.10 已正式廢棄。
        LlamaFactory 現在要求Python 3.11 – 3.13

      3. 3.包管理工具遷移
        項目從 pip 遷移至 uv。
        安裝方式更新為:
        使用uv pip install llamafactory

      4. 4.官方博客上線
        LlamaFactory 官方博客已正式發布:
        https://blog.llamafactory.net/en/

      二、重磅新特性(New Features)

      v0.9.4 在算法、訓練后端和工程能力上實現了全面增強:

      • ? 支持正交微調(Orthogonal Fine-Tuning, OFT)

      • ? 支持新增 Token 的語義初始化(Semantic Initialization)

      • ? 支持通過MCoreAdapter 進行 Megatron-LM 訓練

      • ? 支持KTransformers 后端

      • ? 支持MPO 算法

      • ? 支持FP8 精度訓練

      • ? 支持Transformers v5

      • ? 支持在函數調用消息中同時使用推理內容與純文本

      • ? 支持DeepSpeed AutoTP

      • ? 支持高效的 NPU 融合算子

      • ? 支持TRL 0.24

      這些新特性進一步提升了 LlamaFactory 在大規模模型訓練、分布式效率、硬件適配以及前沿算法支持方面的能力。

      三、模型支持更新(Models)

      v0.9.4 新增與擴展了大量前沿模型與多模態模型支持,覆蓋文本、視覺及多任務場景:

      • ? Falcon H1

      • ? Kimi-VL

      • ? GLM-4.5V

      • ? Gemma3n

      • ? Granite4

      • ? Qwen3-2507

      • ? MiniCPM-V 4.0

      • ? Intern-S1-mini

      • ? Seed-OSS

      • ? MiniCPM-V 4.5

      • ? InternVL-3.5

      • ? ERNIE-4.5-Text

      • ? ERNIE-4.5-VL

      • ? Ling-V2

      • ? Qwen3-VL

      • ? Qwen3-Omni

      • ? Hunyuan-mt

      • ? GLM-4.6V

      • ? Ministral 3

      • ? VibeThinker

      • ? MiMo-V2-Flash

      • ? MiniMax-M1

      • ? MiniMax-M2

      該版本在多模態、視覺語言建模和新一代通用模型支持方面達到了新的高度。

      四、總結

      代碼地址:github.com/hiyouga/LlamaFactory

      LlamaFactory v0.9.4不只是一次常規更新,而是一次承前啟后的關鍵版本:

      • ? 告別 2025,面向 2026 全面進化

      • ? Python、工具鏈與訓練體系全面升級

      • ? 覆蓋最新算法、硬件能力與模型生態

      • ? 繼續堅持“簡單 + 高效”的 LLM 微調理念

      如果你正在使用或計劃使用 LlamaFactory 進行大模型訓練與微調,v0.9.4 是一個值得重點關注和升級的版本。

      告別 2025,下一站,2026。

      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一批超級工程,來了!

      一批超級工程,來了!

      博聞財經
      2026-04-13 09:39:37
      印度首富小兒媳:棄帥模前男友,嫁300斤阿南特,如今成家族門面

      印度首富小兒媳:棄帥模前男友,嫁300斤阿南特,如今成家族門面

      照見古今
      2026-04-12 19:32:51
      鄭麗文贏麻了!返臺發表重磅講話,賴清德急跳腳,民眾黨1人攤牌

      鄭麗文贏麻了!返臺發表重磅講話,賴清德急跳腳,民眾黨1人攤牌

      奇思妙想生活家
      2026-04-13 07:20:37
      伊朗斷網1032小時:星鏈用戶面臨死刑,軍方啟用電子戰級干擾

      伊朗斷網1032小時:星鏈用戶面臨死刑,軍方啟用電子戰級干擾

      野生運營
      2026-04-13 08:26:48
      巴大批戰機抵達沙特,阿聯酋王儲坐不住了,火速訪華尋“定心丸”

      巴大批戰機抵達沙特,阿聯酋王儲坐不住了,火速訪華尋“定心丸”

      民間胡扯老哥
      2026-04-13 01:55:15
      特朗普轉發威脅伊朗的報道鏈接

      特朗普轉發威脅伊朗的報道鏈接

      新京報
      2026-04-12 12:43:07
      跳樓身亡、家里現金“堆成山”,偷養私生子,大衣哥的謠言太離譜

      跳樓身亡、家里現金“堆成山”,偷養私生子,大衣哥的謠言太離譜

      米果說識
      2026-04-12 10:20:30
      損傷閨蜜6.8萬紫貂大衣女子發聲:她工作丟了,要把閨蜜送進去

      損傷閨蜜6.8萬紫貂大衣女子發聲:她工作丟了,要把閨蜜送進去

      江山揮筆
      2026-04-12 09:32:03
      成年人的社交潛規則|無論誰幫了你,一定要送禮,不收也要送

      成年人的社交潛規則|無論誰幫了你,一定要送禮,不收也要送

      杏花煙雨江南的碧園
      2026-04-11 16:15:03
      7歲女兒從12樓墜落,丈夫事后鐵心離婚,甚至起訴離婚三次未果

      7歲女兒從12樓墜落,丈夫事后鐵心離婚,甚至起訴離婚三次未果

      潮鹿逐夢
      2026-04-12 13:12:37
      發現朋友孩子是唐氏兒,我該開口嗎?網友:關系再好都不會說

      發現朋友孩子是唐氏兒,我該開口嗎?網友:關系再好都不會說

      帶你感受人間冷暖
      2026-04-13 00:05:12
      這張章子怡1997年在學校宿舍拍的照片,當時她18歲,那顏值,絕了

      這張章子怡1997年在學校宿舍拍的照片,當時她18歲,那顏值,絕了

      TVB的四小花
      2026-04-13 10:05:57
      單程決死突擊!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機

      單程決死突擊!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機

      荷蘭豆愛健康
      2026-04-12 18:19:03
      隨著曼城3-0,熱刺0-1,維拉1-1,紐卡1-2,英超最新積分榜出爐

      隨著曼城3-0,熱刺0-1,維拉1-1,紐卡1-2,英超最新積分榜出爐

      側身凌空斬
      2026-04-13 03:08:52
      王石,最新發文!

      王石,最新發文!

      證券時報e公司
      2026-04-12 19:53:01
      打完這一仗,世界局勢基本就看清楚:以后大家主要拼的是經濟實力

      打完這一仗,世界局勢基本就看清楚:以后大家主要拼的是經濟實力

      人生錄
      2026-04-13 09:24:49
      又斬首一人,停火已經不可能了

      又斬首一人,?;鹨呀洸豢赡芰?/a>

      深度報
      2026-04-11 22:31:22
      4月14日起,這兩條航線暫停營運

      4月14日起,這兩條航線暫停營運

      上觀新聞
      2026-04-13 11:14:03
      1952年,黃克誠在岳父被判死刑后,找到負責的干部:能否幫個小忙

      1952年,黃克誠在岳父被判死刑后,找到負責的干部:能否幫個小忙

      云霄紀史觀
      2026-04-12 16:03:52
      超5萬美軍登陸伊朗為謠言,視頻實為2023年美軍在加州舉行飛行表演時的畫面

      超5萬美軍登陸伊朗為謠言,視頻實為2023年美軍在加州舉行飛行表演時的畫面

      界面新聞
      2026-04-13 13:38:45
      2026-04-13 15:00:49
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1177文章數 64關注度
      往期回顧 全部

      科技要聞

      傳榮耀與字節跳動接洽“豆包手機”合作

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      體育要聞

      一支球隊不夠爛,也是一種悲哀

      娛樂要聞

      賈玲減重后現身馮鞏生日宴 身材未反彈

      財經要聞

      封鎖,還是收費站?

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      家居
      本地
      數碼
      健康
      公開課

      家居要聞

      復古風格 自然簡約

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      數碼要聞

      消息稱TCL華星將推出4×雙模顯示器面板,支持640Hz刷新率

      干細胞抗衰4大誤區,90%的人都中招

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版