![]()
經過數月的等待之后,DeepSeek V4可能很快就會與用戶正式見面。
4月7日,有網友爆料,DeepSeek V4已經在部分用戶中啟動灰度測試。與之一起被爆料的是,這次在用戶界面上已經有所呈現。
另一個網友則爆料,DeepSeek V4預計將在4月中下旬發布,自2月開始發布時間一再延期后,這一次恐怕是真的。
1
有用戶打開DeepSeek的APP會發現,在對話界面頂部并排著三個選項:快速模式(default)、專家模式(expert)、視覺模式(vision)。
其中,快速模式是默認選項,其大概率是針對輕量級、響應快的模型。
而專家模式不支持文件上傳,其被推測是更大參數、更深度的推理模型。
視覺模式是這次最大的創新變動。據網友爆料,2月那輪灰度測試可實現OCR的文本提取,而DeepSeek V4灰度測試則實現了vision 模式,其多模態能力或將實現C端落地。
這并不意外,按照此前爆料,梁文鋒的研究方向,近半年來主要鎖定了兩個重點,一個是模型的視覺內容處理,另一個則是AI搜索。
而且近期梁文鋒團隊發布的論文,一篇論文提出條件記憶機制,另一篇則呈現優化Transformer記憶與長上下文瓶頸的成果。
由上可見,DeepSeek V4可能將在多模態、長期記憶、代碼能力躍升等幾個方面呈現其特點。
有網友表示,DeepSeek V4的架構可能達到Ultra-MoE 萬億級,總參數約為1.2萬億(MoE),每次僅激活320億,上下文窗口100萬tokens(≈4000頁書),其將實現“文本+圖像+音頻+視頻”的原生多模態特征。
2
DeepSeek V4可謂是千呼萬喚,此前可能已經數次延期。
原本在今年1月份時,傳出發布時間在春節期間,但當時沒有發布。時間來到3月份,有消息稱定在同月的十幾號,可到了3月30日還沒有發布。
最新的消息顯示,DeepSeek V4將在四月中下旬與用戶正式見面。
除了不斷延期的發布時間,還有近期DeepSeek經歷了數次的服務中斷,其中在3月30日左右,其經歷了一次大規模的服務中斷。
有人推測上述服務中斷現象,可能背后與DeepSeek V4灰度測試有關。
據The Information日前報道,發布時間延期主要原因是,DeepSeek與華為、寒武紀等國產AI芯片廠商進行合作,確保V4能在華為最新的昇騰(Ascend)芯片上流暢運行。
據了解,昇騰 950PR是華為3月發布的,搭載的是Atlas 350加速卡。其單卡算力被宣稱是英偉達H20的2.87倍,不過其功耗(600W)大約是H20的兩倍。
報道還透露一點,那就是DeepSeek V4發布前,未有給到美國芯片企業提供早期訪問權限,而是開放給了華為和寒武紀等中國芯片廠商。
另外,The Information報道稱,除了正版的DeepSeek V4,公司還開發了兩個V4變體版本,能力側重分別有所不同。
看來,DeepSeek V4可能真的要來了!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.