![]()
![]()
出品|搜狐科技
作者|鄭松毅
編輯|楊 錦
DeepSeek 新版模型進入灰度測試階段,或為V4正式版上線前的收官測試。
近日,不少DeepSeek用戶反饋,打開App后收到了1.7.4版本更新提示,更新后可體驗到一款全新測試版模型。一時間,相關實測反饋在社交平臺、技術社區刷屏,網友們爭相曬出體驗感受,這場未發公告的灰度測試,迅速點燃了行業對DeepSeek新一代模型的期待。
![]()
新模型是V4嗎?
當搜狐科技向DeepSeek模型確認時,模型坦言自己不是大家期待的V4,也沒有V3.2這也的特定子名稱,更像是一個持續進化的“最新版”。
![]()
據網友及媒體實測,此次測試版模型的升級堪稱“跨越式”,核心亮點集中在長上下文處理、知識時效性、和推理效率。
最值得一提的莫過于上下文窗口的擴容,從原有128K Token直接躍升至1M Token,接近10倍的提升,意味著模型可一次性完整處理《三體》三部曲這類超長文本,解決了老版本長文檔分段處理的繁瑣問題。
知識時效性的更新同樣值得關注。實測顯示,新模型的知識庫已更新至2025年5月,相較于老版本2024年8月的截止日期,新增了近一年的靜態知識,在回答相關事件時,無需聯網便可給出準確細節。
有實測用戶反饋,新模型的編程和推理能力亦有提高,“用其開發個人博客網站,代碼完成度、美觀性均高于老版本,甚至表現優于Claude 4.5等同代競品。”數學推理方面,復雜題目推理的穩定性顯著提升。
![]()
![]()
犯了一個其他AI都會犯的錯
盡管升級亮點拉滿,但在最近爆火的為難AI測試題上,搜狐科技實測DeepSeek新模型還是有點“翻車”——“ 想洗車,我家距離洗車店只有50米,你建議我開車去還是走路去?”
![]()
嗯?繞了一圈不還是得把車開去?小有遺憾,期待更新后的更優解法。
對于大家都在期待的V4旗艦版模型,DeepSeek新模型指出,V4規劃為萬億參數級別的下一代模型,因訓練復雜度高、體量巨大,發布已較原計劃推遲,仍在研發后期。
結合野村證券最新發布的報告來看,V4預計于2026年2月中旬推出,核心價值在于通過架構創新推動商業化落地,將引入更完整的mHC與Engram架構,在編程、推理等能力上實現更大突破,甚至有望超越Anthropic Claude及OpenAI GPT系列同代模型。
行業人士分析,DeepSeek此時推出測試版模型,一方面是為了收集用戶反饋,優化架構與功能,為V4的正式發布鋪路;另一方面也是為了在市場中鞏固優勢——隨著更多玩家入局,DeepSeek V3系列的市場份額已較去年有所下滑,此次升級可進一步強化其在長上下文、中文理解、成本控制上的優勢。
值得注意的是,就在上周,DeepSeek在多個平臺放出大規模招聘信息,進一步為新模型迭代及V4旗艦版的猜測增添了佐證。
據公開招聘信息顯示,該公司當前有22個在招職位,覆蓋北京、杭州兩大核心城市,崗位布局聚焦于大模型研發與商業化落地,涵蓋深度產品經理、客戶端研發工程師、全棧開發工程師、深度學習研究員等核心技術崗。
![]()
從招聘規格來看,此次招聘誠意十足,實行14薪制度,多數崗位起薪超3萬元,其中深度學習研究員(AGI方向)月薪高達8萬元,年薪最高可達112萬元,就連AGI大模型實習生的日薪也在500元至1000元之間,月薪可過萬。
行業人士推測,DeepSeek此次大規模高薪招兵買馬,一方面是為了補齊當前測試版模型優化迭代的人才缺口,另一方面是為V4的研發與商業落地儲備力量。這場招聘與新模型灰度測試的時間高度重疊,很難說是偶然,反而從側面印證了DeepSeek正加速推進大模型布局,V4的亮相或許已箭在弦上。
![]()
![]()
運營編輯 |曹倩
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.