【CNMO科技信息】2月15日,微博科技發布一張圖片,來回顧DeepSeek的進階之路。CNMO注意到,2026年才過去兩個月,DeepSeek就已連續更新四次。
![]()
2025年1月20日,DeepSeek-R1的發布引起了廣泛關注。其訓練成本不到GPT-4o的十分之一,性能卻對齊OpenAI o1正式版。隨后,發布的DeepSeek Janus Pro進一步提升了多模態理解和文生圖能力。3月推出的DeepSeek-V3-0324,則在推理能力、數學和編程性能上擊敗了GPT-4.5。
2025年2月,DeepSeek開展了基礎設施開源周活動,在此期間開源了多個與基礎設施相關的技術成果。
在接下來的幾個月里,DeepSeek繼續保持著高速的發展態勢。在推理能力方面,DeepSeek-R1-0528推理能力重大升級,前端能力超過了Gemini 2.5 Pro;DeepSeek-V3.1更是實現了單一模型同時支持“思考模式”與“非思考模式”自由切換。
此外,DeepSeek-OCR以極高的視覺token壓縮效率,實現了“視覺token”取代“文本token”。而DeepSeek-Math-V2成為了行業首個達到國際奧數金牌水平且開源的模型,為數學教育和研究提供了新的工具和方法。
![]()
2026年,DeepSeek提出的mHC架構解決了訓練中信號不穩定與計算效率的矛盾;另一項創新架構——Engram內存模塊能將大語言模型中的靜態知識存儲與動態計算推理分離,大幅提升效率并降低對昂貴算力資源的依賴。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.