![]()
DeepSeek V4到底何時發布?不少人都在好奇和關注這一點。
之所以DeepSeek V4吊起了這么多人的胃口,主要是其發布時間已出現一再延期的現象。
原本在今年1月份時,傳出發布時間在春節期間,但當時沒有發布。時間來到3月份,有消息稱定在同月的十幾號,可到了3月30日還沒有發布。還有消息稱,其將于4月正式上線。
這一次,“靴子”會準時落地嗎?
1
DeepSeek V4距離上一次產品發布更新,已經過去三個月了。這在更新飆速的2025年,是不可想象的。
人工智能的技術迭代到底有多快?人們開玩笑地稱,不學或許是一種抵抗焦慮的方法。因為往往現實是,這個技術新品剛剛摸到點門道,下一秒已經過時了。
DeepSeek作為開源模型的“一代宗師”,勢必成為大眾關注的焦點。其距離現在最近的一次發布,是2025年12月1日DeepSeek V3.2發布。那之后便是一些修修補補類的更新,DeepSeek V4的發布時間則一再延期。
此前的2025年,DeepSeek的發布節奏大概維持在月更或兩月一更的狀態。2025年一年的時間里,DeepSeek陸陸續續發布了V3系列、R1推理模型、V3.2-Exp(稀疏注意力)、V3.2正式版等等模型。
![]()
讓人留意的是,整個人工智能行業的大方向,正從模型發布比拼轉向智能體能力。這與日前林俊旸在離開阿里后首度發長文提到的內容頗為一致。
在林俊旸看來,人工智能時代,正從“推理式思維”轉向至“智能體思維”。
林俊旸在文中回顧了OpenAI的o1和DeepSeek R1,在整個人工智能時代當中的符號意義,即證明和推廣了推理概念,然而未來這不再是時代主流。
林俊旸認為,未來的主流方向是“智能體思維”。其特點便是,在與環境的交互中不斷修正計劃。林俊旸將其形象地描述為:不再是“想更久”,而是“為了行動而想”。
讓人印象深刻的是,林俊旸在文中認為,未來更好的模型,僅僅是其中之一的競爭力,而非全部,更好的環境設計、更強的harness工程以及多個智能體之間的編排,都將成為未來不可或缺的競爭力。
比拼模型發布已經不再是重點,重點是如何讓模型實現“連續干活”。
這個時候,DeepSeek V4的發布一再延期,似乎就是情理之中的事情。
2
Agent時代到來,從梁文鋒以及DeepSeek的近況來看,他們已經開始逐漸轉變了方向和重點。
據爆料,梁文鋒的研究方向,近半年來主要鎖定了兩個重點,一個是模型的視覺內容處理,另一個則是AI搜索。
去年底發布的DeepSeek V3.2,其明顯特征是重點鎖定tool-use和agent訓練數據。按官方說法,其引入了覆蓋1800+真實環境、8.5萬+復雜指令的agent訓練數據合成方法。
這意味著什么?在DeepSeek V3.2身上,就已經顯現DeepSeek將目標鎖定在訓練一個“真正可執行的系統”,而非訓練“更聰明的模型”。
上述轉變,在梁文鋒帶領團隊新發布的論文當中也可窺一二。
2026年1月其發布的一篇署名論文則提出了條件記憶機制,稍早一點,2025年底,一篇署名論文呈現優化Transformer記憶與長上下文瓶頸的成果。
據爆料,DeepSeek V4可能將在多模態、長期記憶、代碼能力躍升等幾個方面呈現其特點。另外其還會深度適配國產芯片,比如向華為等國內廠商提供提前訪問權,以支持其優化處理器軟件,確保模型在硬件上高效運行。
若如爆料所述,可能即將發布的DeepSeek V4,不再單單是一個更強模型,而是一個涉及模型、工具、工作流以及生態的系統工程。
近來,模型領域的創新速度其實是越來越快的。一些海外大模型比如OpenAI和Anthropic,到了2026年更新速度明顯加快,甚至趕上2025年DeepSeek的更新狀態。
為什么DeepSeek卻變慢了?除了上述重點創新方向的轉變,創新難度加大之外,就是開源模式比閉源模式壓力更大。出牌若無大創新,這個牌反而不出更好一些。這恐怕也是DeepSeek V4一再延期的原因之一。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.