網易首頁 > 網易號 > 正文申請入駐

實測DeepSeek新模型“翻車”：能一次性處理百萬字的《三體》，卻回答不好洗車問題？

2026-02-12 18:54:21　來源: 搜狐科技

北京舉報

分享至

出品｜搜狐科技

作者｜鄭松毅

編輯｜楊錦

DeepSeek 新版模型進入灰度測試階段，或為V4正式版上線前的收官測試。

近日，不少DeepSeek用戶反饋，打開App后收到了1.7.4版本更新提示，更新后可體驗到一款全新測試版模型。一時間，相關實測反饋在社交平臺、技術社區刷屏，網友們爭相曬出體驗感受，這場未發公告的灰度測試，迅速點燃了行業對DeepSeek新一代模型的期待。

新模型是V4嗎？

當搜狐科技向DeepSeek模型確認時，模型坦言自己不是大家期待的V4，也沒有V3.2這也的特定子名稱，更像是一個持續進化的“最新版”。

據網友及媒體實測，此次測試版模型的升級堪稱“跨越式”，核心亮點集中在長上下文處理、知識時效性、和推理效率。

最值得一提的莫過于上下文窗口的擴容，從原有128K Token直接躍升至1M Token，接近10倍的提升，意味著模型可一次性完整處理《三體》三部曲這類超長文本，解決了老版本長文檔分段處理的繁瑣問題。

知識時效性的更新同樣值得關注。實測顯示，新模型的知識庫已更新至2025年5月，相較于老版本2024年8月的截止日期，新增了近一年的靜態知識，在回答相關事件時，無需聯網便可給出準確細節。

有實測用戶反饋，新模型的編程和推理能力亦有提高，“用其開發個人博客網站，代碼完成度、美觀性均高于老版本，甚至表現優于Claude 4.5等同代競品。”數學推理方面，復雜題目推理的穩定性顯著提升。

犯了一個其他AI都會犯的錯

盡管升級亮點拉滿，但在最近爆火的為難AI測試題上，搜狐科技實測DeepSeek新模型還是有點“翻車”——“ 想洗車，我家距離洗車店只有50米，你建議我開車去還是走路去？”

嗯？繞了一圈不還是得把車開去？小有遺憾，期待更新后的更優解法。

對于大家都在期待的V4旗艦版模型，DeepSeek新模型指出，V4規劃為萬億參數級別的下一代模型，因訓練復雜度高、體量巨大，發布已較原計劃推遲，仍在研發后期。

結合野村證券最新發布的報告來看，V4預計于2026年2月中旬推出，核心價值在于通過架構創新推動商業化落地，將引入更完整的mHC與Engram架構，在編程、推理等能力上實現更大突破，甚至有望超越Anthropic Claude及OpenAI GPT系列同代模型。

行業人士分析，DeepSeek此時推出測試版模型，一方面是為了收集用戶反饋，優化架構與功能，為V4的正式發布鋪路；另一方面也是為了在市場中鞏固優勢——隨著更多玩家入局，DeepSeek V3系列的市場份額已較去年有所下滑，此次升級可進一步強化其在長上下文、中文理解、成本控制上的優勢。

值得注意的是，就在上周，DeepSeek在多個平臺放出大規模招聘信息，進一步為新模型迭代及V4旗艦版的猜測增添了佐證。

據公開招聘信息顯示，該公司當前有22個在招職位，覆蓋北京、杭州兩大核心城市，崗位布局聚焦于大模型研發與商業化落地，涵蓋深度產品經理、客戶端研發工程師、全棧開發工程師、深度學習研究員等核心技術崗。

從招聘規格來看，此次招聘誠意十足，實行14薪制度，多數崗位起薪超3萬元，其中深度學習研究員（AGI方向）月薪高達8萬元，年薪最高可達112萬元，就連AGI大模型實習生的日薪也在500元至1000元之間，月薪可過萬。

行業人士推測，DeepSeek此次大規模高薪招兵買馬，一方面是為了補齊當前測試版模型優化迭代的人才缺口，另一方面是為V4的研發與商業落地儲備力量。這場招聘與新模型灰度測試的時間高度重疊，很難說是偶然，反而從側面印證了DeepSeek正加速推進大模型布局，V4的亮相或許已箭在弦上。

運營編輯 |曹倩

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

今天，OpenClaw能用DeepSeek-V4了！還設成了默認模型

智東西 2026-04-26 12:35:19
25 跟貼 25
梁文鋒把token價格打下來了！DeepSeek V4暴降75%，百萬token只要兩毛五

智東西 2026-04-26 10:38:14
21 跟貼 21

Claude終于認了！降智坐實，越聊越傻，3個bug全曝光

量子位 2026-04-26 17:57:07
0 跟貼 0

DeepSeek過于樸素了

虎嗅APP 2026-04-25 17:32:05
129 跟貼 129
翻完DeepSeek報告，我們發現了中國AI的默契

機器之心Pro 2026-04-26 13:21:55
3 跟貼 3

程序員上班遭辭退，當場刪庫跑路讓公司癱瘓，這次不是賠錢的事了

歡樂小丑的舞臺 2026-04-25 16:42:49
1 跟貼 1

字節養的“蝦”與1500億賬本背后

鈦媒體APP 2026-04-25 16:44:18
0 跟貼 0
南方多省電價突然飆升專家：與霍爾木茲海峽局勢有關

每日經濟新聞 2026-04-25 20:30:11
20243 跟貼 20243

在OpenAI把Chronicle做成訂閱功能48小時后，一群00后把它開源了

機器之心Pro 2026-04-26 13:23:34
2 跟貼 2
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4
蘇超最新積分榜出爐！

無錫博報 2026-04-25 21:51:59
152 跟貼 152
空警600vsE-2D預警機：核心參數與性能對比全解析

因果 2026-04-25 10:02:10
0 跟貼 0
美國富豪非洲打獵被5頭大象踩死

看看新聞Knews 2026-04-25 19:38:18
4699 跟貼 4699
華人再破硅谷天花板！AI黑馬新任CTO，中科大80后

量子位 2026-04-25 11:47:08
34 跟貼 34
南京一通信公司高管組織40多名員工上班時間干私活，研發競品長達9年，被按法定上限判賠580萬元

環球網資訊 2026-04-26 16:19:07
6 跟貼 6
英偉達重回巔峰+DeepSeek突傳利好！明天，A股會怎么走？還能“追光”嗎？

每日經濟新聞 2026-04-26 13:43:09
1 跟貼 1
現場視頻：遼寧艦曾遭遇外軍兩個航母編隊跟蹤監視，我軍殲-15掛彈起飛，從高度8000米一直纏斗至2000米，最終成功驅離外軍機

北京青年報 2026-04-25 18:58:06
1479 跟貼 1479
一個解決問題的頂級思路：簡單、直接、有效

啃書少年 2026-04-26 10:49:05
9 跟貼 9
“月薪1.6萬招人放羊”老板再發聲：多人通過初選，但擔心條件艱苦留不住人；稱就算降薪也要交社保

極目新聞 2026-04-25 16:12:24
2405 跟貼 2405
控糖大半年實測！真正不升糖的只有3類食物，糖友直接抄作業

胡又扯 2026-04-24 00:36:36
12 跟貼 12
重達7530噸！全球單機容量最大，開始安裝

環球網資訊 2026-04-25 19:52:08
1314 跟貼 1314
30萬級MPV智能大考！嵐圖夢想家冠軍版成都全場景智駕實測

科技客評 2026-04-23 00:28:11
5 跟貼 5
從數學博士到英國“納稅王”：他用AI撐起千億美金量化帝國

DeepTech深科技 2026-04-26 17:13:46
0 跟貼 0
歐爾班宣布退出匈牙利國會

參考消息 2026-04-26 13:18:23
0 跟貼 0
實測混元Hy3 preview：騰訊AI，終于能打了？

鈦媒體APP 2026-04-26 15:15:26
0 跟貼 0
制作直升機遙控模型，阿帕奇AH-64

制造科技 2026-04-22 16:29:03
0 跟貼 0
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
趙心童兩階段9-7領先丁俊暉 “中國德比”今日17時決勝負

齊魯壹點 2026-04-26 07:18:18
505 跟貼 505
谷歌收200美元的AI動態圖表功能，今天被Claude免費開放！

新智元 2026-04-26 18:06:15
0 跟貼 0
為什么三體問題解不出來？

富貴春天 2026-04-26 07:16:51
0 跟貼 0
自學編程盜文40萬部，他栽了

IT之家 2026-04-26 16:47:13
0 跟貼 0
國家出手整治了！花唄、白條將從付款頁徹底消失

吉刻新聞 2026-04-26 13:14:40
67 跟貼 67
從“產品競爭”向“價值共鳴”，一家大型車企的深層進化

新京報 2026-04-26 16:51:20
5 跟貼 5
不卷參數！長安這次只聊“過日子” 一年能省4000塊油

玩車教授 2026-04-26 13:04:03
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
董宇輝離隊后東方甄選主播流失，僅剩yoyo能撐多久？

后世的君子 2026-04-26 11:35:56
2 跟貼 2
誰說海港不行了？！

新民晚報 2026-04-26 10:21:17
42 跟貼 42
Anthropic CEO：如果我是25歲，不會選編程，會選

機器之心Pro 2026-04-18 12:00:00
0 跟貼 0
全球首個醫療視頻理解大模型開源！6k+組精標測試集/英雄榜上線

量子位 2026-04-26 13:27:25
0 跟貼 0
罕見！超級牛散，進入中信證券前十大股東！

證券時報 2026-04-26 14:12:15
84 跟貼 84

手機 / 數碼

房產 / 家居

實測DeepSeek新模型“翻車”：能一次性處理百萬字的《三體》，卻回答不好洗車問題？

漲價浪潮下，DeepSeek推動AI“價格戰”

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

森林狼3比1掘金：逆境中殺出了多孫穆？！

僅次《指環王》的美劇，有第二季

事關新就業群體，中辦、國辦發文

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

IU的臉，真的有自己的時間線

18幅 列賓美院教師Artem Tikhonov風景寫生

#健康躍動生活#孩子碰頭別大意，出現這5種情況，立刻就醫

伊朗總統：不會在壓力、威脅下進行談判

預售19.38萬元起哈弗猛龍PLUS七座版亮相

18幅列賓美院教師Artem Tikhonov風景寫生