![]()
機器之心報道
編輯:Panda
剛剛,「歐洲的 DeepSeek」Mistral AI 再次開源,發布了其下一代代碼模型系列:Devstral 2
該系列開源模型包含兩個尺寸:Devstral 2 (123B) 和 Devstral Small 2 (24B)。用戶目前也可通過官方的 API 免費使用它們。
此外,Mistral AI 還發布了自家的原生 CLI:Mistral Vibe
![]()
Mistral AI 的進擊速度令人咋舌。僅僅一周前,他們才發布 Mistral 3 系列模型,被視為歐洲正式以此躋身 AI 前沿競爭的序幕。僅僅過了 7 天,Devstral 2 系列與 Mistral Vibe 便緊隨其后問世,這種高頻的發布節奏,似乎正在印證人們對歐洲 AI 崛起的判斷。
![]()
考慮到 Mistral 近期在歐洲的大幅擴張,以及圖靈獎得主 Yann LeCun 回到歐洲創業的消息,歐洲大陸這片 AI 熱土的未來風景,或許值得我們投入更多期待。
亮點匯總
下面是 Mistral 官方總結的核心亮點:
- Devstral 2: 針對代碼智能體(Agent)的 SOTA 開放模型,參數量僅為競爭對手的一小部分,并在 SWE-bench Verified 上達到了 72.2% 的高分。在實際任務中,其成本效率比 Claude Sonnet 高出達 7 倍。
- Mistral Vibe CLI: 一款原生、開源的終端智能體,可自主解決軟件工程任務。
- Devstral Small 2: 24B 參數模型,可通過 API 使用,也可在消費級硬件上本地部署。
- 兼容本地(On-prem)部署和自定義微調。
下面來具體看看 Mistral AI 今天新發布的模型和工具。
Devstral:下一代 SOTA 編程模型
模型地址:https://huggingface.co/collections/mistralai/devstral-2
Devstral 2 是一個 123B 參數的密集 Transformer 模型,支持 256K 上下文窗口。它在 SWE-bench Verified 上取得了 72.2% 的成績,「確立了其作為最佳開放權重模型之一的地位,同時保持了極高的成本效益。」
體量更輕的 Devstral Small 2 在 SWE-bench Verified 上得分為 68.0%,能與大其五倍的模型比肩,同時還具備在消費級硬件上本地運行的獨特優勢。
![]()
Mistral 官方指出:「Devstral 2(123B)和 Devstral Small 2(24B)分別比 DeepSeek V3.2 小 5 倍和 28 倍,比 Kimi K2 小 8 倍和 41 倍。這證明了緊湊型模型可以匹敵甚至超越更大型競爭對手的性能。」
![]()
專為生產級工作流打造
Devstral 2 支持探索代碼庫并在多個文件中編排變更,同時保持架構級的上下文理解。它能追蹤框架依賴關系、檢測故障并嘗試修正重試 —— 從而解決錯誤修復和遺留系統現代化等挑戰。
此外,該模型支持微調,允許企業針對特定編程語言或大型企業代碼庫進行深度優化。
Mistral 通過獨立標注提供商的人工評估,對比了 Devstral 2 與 DeepSeek V3.2 和 Claude Sonnet 4.5,任務通過 Cline 進行腳手架式編排。
根據發布的結果,Devstral 2 相對于 DeepSeek V3.2 有明顯優勢,勝率為 42.8%,敗率為 28.6%。然而,Claude Sonnet 4.5 仍然更受青睞,表明其與閉源模型之間仍存在差距。
![]()
許可證
值得注意的是,Devstral 2 采用的許可證是一種修改版 MIT 許可證
![]()
對比標準的 MIT 許可證,可以看到一個重大差異:新增的「收入限制條款」。
標準版 MIT 極度寬松。只要你保留版權聲明,你可以將代碼用于任何目的,包括商業用途、修改、分發、閉源發布,沒有任何收入或公司規模的限制。
Mistral 許可證則在第 2 條中增加了一個巨大的限制條件(毒丸條款):
You are not authorized to exercise any rights under this license if the global consolidated monthly revenue of your company... exceeds $20 million... for the preceding month.
如果你的公司全球合并月收入超過 2000 萬美元,你將無權行使本許可證下的任何權利。也就是說,超過收入門檻的公司必須聯系 Mistral AI 購買商業授權,或者使用他們的付費 API 服務。
并且這一限制不僅適用于原模型,還明確延伸到了「derivatives, modifications, or combined works」(衍生品、修改版或結合作品)。這意味著如果你基于這個模型微調了一個新模型,大公司依然不能免費使用你的微調版。
Mistral Vibe CLI
Mistral Vibe CLI 是一款由 Devstral 驅動的開源命令行編碼助手。
![]()
開源地址:https://github.com/mistralai/mistral-vibe
它能讓用戶在終端中使用自然語言,或通過智能體通信協議(Agent Communication Protocol)集成到用戶的 IDE 中,來探索、修改和執行整個代碼庫的變更。它依據 Apache 2.0 許可證發布。
Vibe CLI 提供了一個交互式聊天界面,包含文件操作、代碼搜索、版本控制和命令執行等工具。主要功能包括:
- 項目感知上下文: 自動掃描用戶的文件結構和 Git 狀態以提供相關上下文。
- 智能引用: 使用 @ 自動補全引用文件,使用!執行 Shell 命令,并使用斜杠命令進行配置更改。
- 多文件編排: 理解用戶的整個代碼庫(不僅僅是正被編輯的文件),從而實現架構級推理,這可以將 PR 周期時間縮短一半。
- 持久化歷史、自動補全和可自定義主題。
![]()
開發者可以通過編程方式運行 Vibe CLI 以進行腳本編寫,切換工具執行的自動批準功能,通過簡單的 config.toml 配置本地模型和提供商,并控制工具權限以匹配自己的工作流。
開始使用
Mistral 目前正通過其 API 免費提供 Devstral 2。
免費期結束后,API 定價為:Devstral 2 每百萬 token $0.40/$2.00(輸入/輸出);Devstral Small 2 為 $0.10/$0.30。
他們還宣布已與智能體工具 Kilo Code 和 Cline 合作,將 Devstral 2 帶入用戶現有的開發環境中。
Mistral Vibe CLI 也已作為 Zed 的擴展程序提供,因此用戶可以直接在 IDE 內部使用它。
Devstral 推薦部署配置
Mistral 表示,Devstral 2 針對數據中心 GPU 進行了優化,部署至少需要 4 個 H100 級別的 GPU。用戶今天就可以在 build.nvidia.com 上試用。
Devstral Small 2 專為單 GPU 運行而構建,可在廣泛的 NVIDIA 系統上運行,包括 DGX Spark 和 GeForce RTX。NVIDIA NIM 支持即將推出。
Devstral Small 也可以在消費級 GPU 以及無需獨立 GPU 的純 CPU 配置上運行。
為了獲得最佳性能,Mistral 官方建議將溫度設置為 0.2,并遵循 Mistral Vibe CLI 定義的最佳實踐:https://github.com/mistralai/mistral-vibe/blob/main/vibe/core/system_prompt.py
文中視頻鏈接:https://mp.weixin.qq.com/s/jEmpNsaLZDjxvBTt8kfTUg
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.