網易首頁 > 網易號 > 正文申請入駐

等待DeepSeek的145天｜深度

2026-04-27 12:47:07　來源: 鈦媒體APP

北京舉報

分享至

DeepSeek的擁躉正在流失。

至少在2026年4月24日之前，是這樣的光景。

過去幾個月里，不少以DeepSeek為主題，綴以“布道者”“走向未來”“鐵粉”等的賬號停更、轉型。在不同的社交平臺上，針對DeepSeek的失意之語，疊加了意思若有若無的落寞，“為什么DeepSeek會變成這樣了”。

原本不是這樣的——2024年底至2025年初接連V3和R1后，這款中國AI模型紅遍全球，諸多光環加身，贏得一眾擁躉。

“早期對比過后，很明顯DeepSeek在生成中文對話，甚至鋪排情節、預寫方面都是最強的。沒那么多AI味，水文的比例更少。”一位自稱“忠粉”的用戶王冰（化名）曾如此總結，他與DeepSeek結緣于副業：用后者調試自己創作的網絡小說。

長期的對話與助益，也讓他對DeepSeek的認同感愈發深入，會在各類場合積極為自己的“偶像”說話甚至與人爭吵。當然，“理想主義”“顛覆者”“國產之光”等標簽，也讓當一名DeepSeek粉絲被賦予了更多的意義。

裂縫出現在今年2月，一次更新后，DeepSeek輸出的內容突然變得陳腐、老套，無論怎么調整提示詞，效果都不理想。更多用戶反饋DeepSeek變冷淡了，缺少溫度甚至“登味十足”，包括所謂“粉絲”在內的一些社群甚至興起了“聯名書”項目，希望在各渠道發聲讓DeepSeek“找回自己”。

DeepSeek自己生成的答案一度被當作官方回應：并非刻意冷淡，而是因為效率上的調整和對邊界感的注重。

“挺不好受的，想脫粉的肯定不少，但我覺得還要等”，王冰說。

愿意留下來的人，等的正是V4的發布。作為同樣需要經營自己讀者的網文創作者來說，這一回答可能比事實本身更讓人失望，但因為有更大的事件即將到來，關注和期待仍然持續。

事實上，關于DeepSeek V4的上線時間，一直牽動人心。從去年12月1日V3.2正式版發布后，DeepSeek就“斷更”了，但The Information等媒體早已“預告”，這家公司會在春節期間發布V4。不少人滿懷期冀，暢想一年前的“DeepSeek時刻”再次上演。

外界的期待在膨脹，但故事的主角，卻愈發沉默。

今年初接連發布兩篇重要論文后，DeepSeek幾乎缺席了這個冬春之交的所有重要事件。

春節大戰、龍蝦Agent，AI世界的主線劇情頻繁切換，而DeepSeek的故事線，卻始終若即若離。

漸漸地，人們適應了DeepSeek的缺席。而等待，也已變成了一種習慣。

網文作者在等待中嘗試了很多其他工具，包括頻繁迭代的國產大模型、專門輔助創作的Agent等等。

“重新用起來才發現，AI能力發展得太快，認為DeepSeek一直有獨一無二的優勢，才是幻覺吧。”袪魅來得有些突然，但似乎也順理成章，甚至都沒等到新模型的正式發布。

如今看來，所有人等待DeepSeek，并不僅僅是等待這個大模型本身——人們等待的，是一個新的高光時刻，正如一年多之前，那個被標識為中國AI的“破圈”的時刻。

那時，對于更廣泛的國內受眾來說，ChatGPT等頂級大模型的能力仍是“只聞其名，未見其實”。即使只是聊天，能多數能用到的模型也不盡如人意，它們無論在性能、知名度還是期待值上，都囿于有限圈層內。

直到DeepSeek橫空出世，在那個氛圍感十足的春節檔，才讓人們看到了AI會思考、說人話，甚至能干活，這是本土產出的大模型第一次具備比肩全球頂級的性能。對于很多人來說，這是第一次真正接觸AI，除了手機里多了一個App，生活、生產方式也開始悄然變化；對于很多人來說，大預言模型、提示詞、訓練與推理等AI術語第一次有了實體，甚至不少人對復雜的參數和Benchmark的榜單有了興趣。

這緣于DeepSeek，行業也在這種氣氛下加速。競爭激烈了起來，大家都在加速，DeepSeek卻好像慢了下來。

在漫長的等待中，他們會通過各種契機接觸到所謂“競品”或新事物，并驚覺它們能夠填補那個缺席的空洞。

而即使對于更為硬核的開發者、業內人士，對DeepSeek的看法和心態，似乎也已被重置。

4月24日，V4終于正式登場，人們等來了新的世界最強開源模型，等來了大幅提升的Agent能力，也等來了“國產模型+國產芯片”的深度適配。

如果回到V3.2發布時的節點來看，這似乎正是曾經的期許。

但社群、評論區的關注已不在此，一些不滿的聲音認為DeepSeek在“固步自封”，而且沒有在自己專精的道路上真正擠進“最強梯隊”。而關于遲到的原因與代價，包括與國產算力的深度綁定，也愈發成為爭議焦點。

兩次更新之間，145天過去了，DeepSeek還在“深度求索”那個答案，關于顛覆性創新、關于開源生態、關于AGI。

可它面對的問題，卻變了。

氣氛到了，V4卻沒來

在等待DeepSeek的時間里，AI行業發生了很多事。

最新的感知是，AI需要賺錢了。

這是2025年底到2026年初行業最重要的事情。

Meta重金收購Agent初創公司Manus，無疑是其中最大的故事。后者是2025年繼DeepSeek后又一個引發全球關注的由中國團隊主導的AI公司。

這一年，始于DeepSeek橫空出世，終于Manus委身巨頭。

跨年后，劇情再次加速。1月8日，智譜率先敲鐘，Minimax次日掛牌——自此，大模型廠商有了明確的市場價格，而且將不斷接受“何時盈利”的詰問。

作為全球風向標的OpenAI和Anthropic，也都在開年宣布入局“AI+醫療”，前者還啟動了廣告業務。

相較于迭代速度和性能指標的較量，模型發布時的“商業變現”能力被更加凸顯了出來，幾乎每款重要模型都會精準鎖定一些辦公或商業場景，錨定更加直接的“經濟價值兌現”。

那時的DeepSeek，仍被認為是“合唱”的一員。盡管彼時在這家刻意低調的公司身上還看不到太多商業訴求，但其對Agent能力、編程等領域的探索，均是行業主流方向。而且，畢竟梁文鋒的老本行是量化投資，畢竟，“把價格打下來”這件事，DeepSeek也一直是最重要的推手。

行業里，幾乎每天都有新變化。熱鬧的間歇，總有人在等著DeepSeek。

零星的消息偶爾傳來。The Information報道稱DeepSeek 將于2月中旬的馬年春節前后發布新一代模型，知情人士則透露其主打編碼能力，內部初步測試超越了“編程之王”Claude。而在1月1日和13日，DeepSeek發布了兩篇論文，分別聚焦mHC和Engram，解決規模和記憶這兩大關鍵問題，被當作新模型的前奏。

一位開發者回憶稱，由于一直在與全球頂級模型“掰手腕”，大家會習慣性地認為DeepSeek會與OpenAI、Anthropic一直在同一擂臺上較量，而且對國產大模型有引領作用。“提升生產力和實用價值是一定的，至于商業變現，很多人預期DeepSeek會在發布新模型的同時找到自己的商業模式，而這并不影響開源的生態。”

一切看起來，都是蓄勢待發的模樣，但事后看來，很多時間節點，更像是外界強加的想象——那一時期外界AI商業化浪潮的沖擊，遠較DeepSeek自己預期的節奏更猛烈。

根據晚點等媒體的報道，王炳宣、魏浩然、郭達雅等核心貢獻者在2025年底至今年3月間相繼出走大廠，雖然單看流失率還不到2%，但此前“DeepSeek員工極難挖角”的敘事已經松動。而“不融資”導致員工手中期權兌現無期甚至難以估價，被視為人才流失的重要原因。

在內部，梁文鋒開始考慮融資，更多提及產品化，同時還要推進V4，面對其與國產芯片深度適配的復雜問題；而競爭對手在快速迭代模型，并持續挖角DeepSeek的人才……

當然，人們事后才知道這些暗流。但在水面上，仍不乏線索，比如1月到2月期間DeepSeek在模型性能排名、下載量、活躍用戶排行榜上出現下滑。而不少外媒和機構也關注到了，這家致力于開發全球最頂尖大模型的公司，在因地緣問題無法持續獲取英偉達先進芯片的情況下，可能面臨著較為嚴峻的算力制約。

情況不樂觀，但只要V4足夠強，以那時的氛圍來看，就能扭轉勢頭。

1月中旬起，DeepSeek鮮少“拋頭露面”，被認為進入了重大模型更新前的“靜默期”。

1月下旬至春節前，以“龍蝦”為標志的Agent——OpenClaw、字節的視頻模型Seedance 2.0相繼爆火。曾為DeepSeek給出高度評價的OpenAI聯合創始人安德烈·卡帕西（Andrej Karpathy）、打造出《黑神話：悟空》的游戲科學創始人馮驥，以類似的風格分別給予了新事物極大贊許。

而在討論中，它們也常被稱作“2026年的DeepSeek時刻”，這讓屬于DeepSeek自己的時刻，被愈發寄予厚望。

此后的馬年春節，AI圈愈發不平靜，甚至席卷了更多的領域。

Anthorpic發布的插件導致Saas行業遭遇“替代危機”，美股軟件板塊持續暴跌；而騰訊、阿里、字節、百度等中國大廠則打起了一場耗資近百億元人民幣的“春節AI大戰”。

氣氛烘托到這，人們也一度十分篤定，V4會在某個時刻登場。

但直到春節結束，人們才真的相信DeepSeek“爽約”了，盡管官方從未給出過任何發布時間線。

一位GPU“小龍”公司的研發人員對我們回憶稱，為了在24小時以內給V4做適配，公司提前做了不少準備，假期也一直安排員工待命，但沒怎么想到最終會是“一場空等”。

實際上，從芯片、云廠商，到以DeepSeek為主模型的騰訊等大廠、競爭對手，以及更渴求用到新品的AI應用企業和開發者，都在苦等V4的“閃亮登場”。

這種熱切到有些焦急的盼望，在3月有了歸宿，不過主角不是DeepSeek，而是OpenClaw。

“龍蝦”與“鯨魚”

OpenClaw在中國的火爆有些突然。

這只號稱讓“AI長了手和腳，能動手干活”的“龍蝦”Agent早在1月下旬就從硅谷“破圈”。

但在國內更廣泛的知名度，則集中在春節過后，兩會期間。

在上海，出現了三百多人排隊安裝“龍蝦”的景象；在深圳，騰訊在自己的大廈前擺攤派“蝦”吸引了千人到場。有人花100多元買“站票”只為聽一堂“手把手教養蝦”的課課程，也有人在閑魚上做起了上門安裝的生意，據說單價都要500元，有人月入六位數。

騰訊、字節、阿里等巨頭隨之下場，密集進行在線部署，并推出了多款“蝦”系產品。

這一切，都像極了2025年春節期間，由以鯨魚為標志的DeepSeek所引發的那波熱潮。

而很大程度上，正是DeepSeek V4的“遲到”，促成了OpenClaw的火爆。

那時盛行的一個段子，是美國AI在卷技術、卷編程、卷生產力，而中國的春節AI大戰在卷補貼、卷紅包、卷奶茶。

人們在等待一個新的爆款，最好能夠代表技術前沿，最好能夠許諾開啟新的時代，最好還能富有故事性且平易近人。

去年的那條“鯨魚”始終不肯浮出水面，積攢的情緒就找到了“龍蝦”。它的誕生同樣充滿了極客精神和戲劇性，甚至多了些游戲感，它還被視作“AI進入Agent時代”的標志性事件。

這個早春需要這只“蝦”，即使它是舶來品，即使早在一個多月前就火過一輪了。

端邊AI芯片廠商后摩智能的一位高管告訴我們，無論是DeepSeek還是OpenClaw，跑通并不是問題。這些新事物的意義更類似“風”，能把芯片、算力企業帶到市場面前。

他舉例稱，DeepSeek V3問世后，國產推理芯片的商業機會不斷釋放，與客戶的“溝通成本”降低很多，只要以DeepSeek為例，用戶就能明白。而“龍蝦”作為一個新物種，也讓大家看到了Agent是一個確定性的趨勢，對于芯片行業來說，它帶來的算力需求暴增、輕量化本地化部署場景的增多、對異構計算的推動，都是機會所在。

就連行業老大英偉達也在全速跟進，在3月中旬的GTC大會上，“龍蝦”成為了貫穿全場的主角，該公司推出了自己的“龍蝦”平臺NemoClaw，黃仁勛更是將其作為“Agentic AI拐點已至”的重要論據。有趣的是，DeepSeek在2025年被稱作GTC大會上潛在的主角，雖然黃仁勛未過多直接提及，但彼時英偉達芯片在推理場景、MoE架構上的調整和闡發，背后都是DeepSeek的影子。畢竟，它曾經讓這個全球市值最高公司的股價一天跌了約17%。

截圖來自英偉達GTC大會官方直播視頻

當然，“等風來”的不只芯片層，從云、模型，到應用、設備，所有環節都在忙著給自己貼上“蝦標”。

“龍蝦”產品對大模型的調用量形成了單獨的榜單，而“龍蝦本”、Agent box等新的設備也相繼走紅，就像DeepSeek去年爆火時批量面世的DeepSeek一體機一樣。

而壓力，也再次來到了DeepSeek身上。

一位開發者解釋稱，OpenClaw等Agent框架，既依賴大模型進行工作的執行調度，給模型廠商帶來Token消耗的增量，也在一定程度上能拉平各個模型的性能表現。

頻繁更新、更能適配OpenClaw的競爭對手，以及手頭握有有“大龍蝦”之稱的Codex和Claude Code的OpenAI和Anthropic，在這波浪潮中風頭更勁。

而對于仍然只有一個聊天機器人產品的DeepSeek來說，人們的興趣在減弱。這個3月，是“龍蝦月”，是屬于Agent的月份，也是DeepSeek被談論最少的一個月。

等待也變得愈發不耐煩，更多對“拖更”的吐槽冒了出來。就在V4發布之前，人們談論DeepSeek的坐標已經不一樣了。

答案依舊，問題變了

3月29日晚到31日，DeepSeek連續三天遭遇宕機，最長的一次長達13個小時。

較為意外地，對于這次讓DeepSeek重登熱搜的“史上最大事故”，期待甚至蓋過了埋怨，業界猜測故障是因“為V4進行灰度測試”。至少，DeepSeek不再沉默，人們始終希望它“搞出些大事”。

果然，在不乏大事件的4月，DeepSeek仍頻頻成為輿論焦點。

晚點、The Information等媒體接連發布報道，包括上文提及的員工跳槽大廠、公司尋求首次外部融資等信息為更多人所知。

而且，V4的發布時間也終于相對可靠地被錨定在了4月下旬，據稱這是梁文鋒在內部溝通中給出的時間，而且得到了多方信源確認。

這讓關于DeepSeek近況的解析一直持續到V4登場。

但是，如果回看100多天前的討論，會發現人們更多會談及DeepSeek將在Agent、記憶模塊和編程等場景上實現哪些技術和性能上的突破。

而在發布前的20多天中，經過業內“不要抱太高期待”的“預防針”，和被視為已具有V4基因的網頁版、APP并不驚艷的表現，技術和性能層面的討論變得越來越少。

而被推向臺前的，一是DeepSeek的融資和估值；二是與國產算力的深度適配；三是這家公司將何時及如何開啟模商業化變現之路。

從目前的信息來看，融資金額尚無定論，流傳較多的是200億美金，而國資和互聯網大廠很可能率先進場。人們對這一轉變的態度也頗有些矛盾。“不融資”的DeepSeek，更能成就一個特立獨行的形象，堅持自己并名滿天下，一直是最受歡迎的故事。但如果這個象征走向失敗，就會讓一切索然無味。出于對商業邏輯的信奉，多數觀點仍對DeepSeek拿出股權“待價而沽”給予認可。

而在國產算力適配方面，爭議顯得更大，某種程度上期待也更大。

實際上，作為此次深度適配傳言中的主角之一，寒武紀方面曾提示我們，早在去年9月DeepSeek發布V3.2-Exp（實驗版）發布時，公司就完成了Day 0適配。作為國產頂級模型和國產芯片，這種合作很正常也并不神秘。而在12月V3.2正式版發布時，華為昇騰、寒武紀、海光信息三家國產芯片廠商也都宣布在當天完成適配。

不過，在近期的相關討論中，不少消息都將V4遲到的原因指向“去英偉達CUDA”而遷移到國產芯片生態上，進而，值不值得以及誰主導了相關決策，都引起了不同的看法。一位芯片從業者即認為，DeepSeek更多是被交辦了一項任務，而這項任務的復雜性和難度，超過了公司在這個階段的能力和預期。

另一方面，從結果上來說，這次深度適配又不斷刺激出龐大的期待。尤其是黃仁勛在4月中旬做客達瓦克什·帕特爾（Dwarkesh Patel）的播客節目時，將DeepSeek優先適配國產芯片視為美國的“重大損失”，更讓這次事先張揚的生態協作引發了更多遐想。

而對于商業化變現，人們從DeepSeek的招聘信息到4月網頁版更新時的“快速模式”與“專家模式”分層，孜孜尋找著蛛絲馬跡，但似乎都很難論證它如何堅持免費開源、專注AGI探索的同時，還能賺到市場的錢。實際上，DeepSeek公開的商業化路徑目前只有API調用，而且，在其他模型快速迭代的背景下，這一模式也越來因云服務商越來越多地免費部署而出現波動。

這些新的問題、新的討論，就是V4發布前的氛圍。

在4月24日這一天，DeepSeek交出的技術答卷仍是完整的：100萬Token上下文，通過架構創新大幅提升長文本處理和記憶能力；Agent得到凸顯，V4-Pro在Agentic Coding評測中獲得高分；而且性價比仍大幅領先業內同行。

雖然性能的提升和“價格屠夫”的屬性仍得到不少贊許，但這款史上最強開源模型，也在不少反饋中被冠以“失望”的評語。

我們在部分開發者社群看到的評價也不算積極，有開發者注意到其技術報告對比的仍是閉源巨頭的上一代模型，認為DeepSeek將性能測評“說得很含蓄”，實際上與GPT與Claude的差距變大了，甚至在國產模型中優勢也不明顯。還有開發者直言，其“Pro版本的發布太匆忙”，推理過程變得十分漫長，簡單問題也要吐幾萬token的思維鏈，邏輯和輸出結果卻顯得怪異，不少不符合常識的內容，可能是后訓練沒做安全對齊。更多聲音則認為，在多模態、Agent越來越強，還不斷冒出“新玩法”的當下，V4顯得有些平庸和無趣。

而且，關于備受期待的國產模型與國產芯片的深度適配，這次發布同樣鮮少著墨，50余頁的技術報告僅提到華為一次。雖然更多的國產芯片宣布了Day 0適配，但至少目前還看不到對CUDA生態的真正沖擊。

也有從業者提示，適配問題需等待進一步消息的披露。但考慮到性能和表現并不驚艷，后續更新的細節能激起多大浪花，還有待觀察。值得注意的是，DeepSeek在V4的token價格表后附言：受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格會大幅下調。這也成了未來一段時間頗值得期待的進展。

截圖來自DeepSeek官微

或許是感受到了周身氛圍的變化，DeepSeek在V4發布文章的末尾寫下了一段話：

“不誘于譽，不恐于誹，率道而行，端然正己。”

并稱公司將“始終秉持長期主義的原則理念，在嘗試與思考中踏實前行，努力向實現 AGI 的目標不斷靠近”。

這場漫長的等待終于結束了。我們也能更清晰地看到，等待DeepSeek的人們，究竟在等待些什么。

是遠不止一個版本的迭代，一次性能的提升，抑或一家公司再次證明自己的故事。人們在等待預期之外的技術和故事，這也是AI時代所獨特賦予的：永遠超乎想象。

V4沒有交出這份不存在標準答案的答卷，但它依然高舉著AGI的旗幟。正如行業內曾流行一句話：假裝AGI已經存在的人，才能先做出AGI。

DeepSeek會在未來再次成為時代顛覆者嗎？或許，在多年后再回看這次等待，我們才更能了解其意義。

（作者｜胡珈萌，編輯｜楊林）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.