![]()
↑閱讀之前記得關注+星標??,,每天才能第一時間接收到更新
DeepSeek-V3.2系列模型正式上線
作為“為Agent構建的推理優先模型”,DeepSeek-V3.2包含兩個版本:
DeepSeek-V3.2:V3.2-Exp的官方繼任者,平衡了推理能力與生成長度,性能對標GPT-5,現已上線App、Web端及API
DeepSeek-V3.2-Speciale:專攻深度推理能力的極限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前僅通過API提供
![]()
技術報告顯示,DeepSeek-V3.2-Speciale在2025年國際數學奧林匹克(IMO)、國際信息學奧林匹克(IOI)、ICPC世界總決賽及CMO中均取得了金牌級成績
![]()
官方已公開上述競賽的最終提交結果,社區可通過assets/olympiad_cases進行二次驗證
![]()
技術報告:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf
![]()
以下是詳細信息
核心能力與技術突破
DeepSeek-V3.2基于三大技術突破,實現了高計算效率與卓越推理、Agent性能的統一:
1.DeepSeek Sparse Attention (DSA):引入高效注意力機制,大幅降低計算復雜度,并針對長上下文場景進行了優化
2.可擴展強化學習框架:通過穩健的RL協議與后訓練(post-training)算力擴展,實現了高性能表現
3.大規模Agent任務合成管線:涵蓋1800+環境及8.5萬+復雜指令
這一合成管線不僅提升了模型在復雜交互環境中的遵循度和泛化能力,更讓DeepSeek-V3.2將“思考”直接整合進工具使用(Tool-Use)的模型,同時支持在思考和非思考模式下使用工具
![]()
API更新與Speciale版限制
DeepSeek-V3.2:
API使用模式與V3.2-Exp保持一致,作為日常主力模型(Daily Driver),提供GPT-5級別的性能
DeepSeek-V3.2-Speciale:
該版本專為解決復雜任務設計,消耗更多Token,目前僅作為API提供,具體限制如下:
臨時端點:需使用
base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
服務期限:該端點服務至2025年12月15日 15:59 (UTC) 截止
功能限制:不支持工具調用(Tool Calls),僅用于支持社區評估與研究。
定價:與DeepSeek-V3.2保持一致
聊天模板重大調整
DeepSeek-V3.2不再提供Jinja格式模板,并引入了“帶工具思考”及新角色設定。
Python腳本編碼:官方提供了encoding文件夾,包含Python腳本(encoding_dsv32.py),用于將OpenAI兼容格式消息編碼為模型輸入字符串及解析輸出
Developer角色:模板新增developer角色,專門用于搜索Agent場景,官方API不接受分配給該角色的消息
輸出解析注意:提供的解析函數僅處理格式良好的字符串,生產環境需自行增加穩健的錯誤處理機制。
代碼示例如下:
本地部署建議import transformers
from encoding_dsv32 import encode_messagestokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
# 思考模式配置
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
模型結構與DeepSeek-V3.2-Exp相同。
采樣參數:建議設置 temperature = 1.0,top_p = 0.95。
Speciale版提示:本地部署Speciale版本時,同樣不支持工具調用功能
開源與協議
倉庫及模型權重均采用 MIT License 授權。
--end--
最后記得??我,這對我非常重要,每天都在更新:
歡迎點贊轉發推薦評論,別忘了關注我
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.