![]()
DeepSeek的擁躉正在流失。
至少在2026年4月24日之前,是這樣的光景。
過去幾個月里,不少以DeepSeek為主題,綴以“布道者”“走向未來”“鐵粉”等的賬號停更、轉型。在不同的社交平臺上,針對DeepSeek的失意之語,疊加了意思若有若無的落寞,“為什么DeepSeek會變成這樣了”。
原本不是這樣的——2024年底至2025年初接連V3和R1后,這款中國AI模型紅遍全球,諸多光環加身,贏得一眾擁躉。
“早期對比過后,很明顯DeepSeek在生成中文對話,甚至鋪排情節、預寫方面都是最強的。沒那么多AI味,水文的比例更少。”一位自稱“忠粉”的用戶王冰(化名)曾如此總結,他與DeepSeek結緣于副業:用后者調試自己創作的網絡小說。
長期的對話與助益,也讓他對DeepSeek的認同感愈發深入,會在各類場合積極為自己的“偶像”說話甚至與人爭吵。當然,“理想主義”“顛覆者”“國產之光”等標簽,也讓當一名DeepSeek粉絲被賦予了更多的意義。
裂縫出現在今年2月,一次更新后,DeepSeek輸出的內容突然變得陳腐、老套,無論怎么調整提示詞,效果都不理想。更多用戶反饋DeepSeek變冷淡了,缺少溫度甚至“登味十足”,包括所謂“粉絲”在內的一些社群甚至興起了“聯名書”項目,希望在各渠道發聲讓DeepSeek“找回自己”。
DeepSeek自己生成的答案一度被當作官方回應:并非刻意冷淡,而是因為效率上的調整和對邊界感的注重。
“挺不好受的,想脫粉的肯定不少,但我覺得還要等”,王冰說。
愿意留下來的人,等的正是V4的發布。作為同樣需要經營自己讀者的網文創作者來說,這一回答可能比事實本身更讓人失望,但因為有更大的事件即將到來,關注和期待仍然持續。
事實上,關于DeepSeek V4的上線時間,一直牽動人心。從去年12月1日V3.2正式版發布后,DeepSeek就“斷更”了,但The Information等媒體早已“預告”,這家公司會在春節期間發布V4。不少人滿懷期冀,暢想一年前的“DeepSeek時刻”再次上演。
外界的期待在膨脹,但故事的主角,卻愈發沉默。
今年初接連發布兩篇重要論文后,DeepSeek幾乎缺席了這個冬春之交的所有重要事件。
春節大戰、龍蝦Agent,AI世界的主線劇情頻繁切換,而DeepSeek的故事線,卻始終若即若離。
漸漸地,人們適應了DeepSeek的缺席。而等待,也已變成了一種習慣。
網文作者在等待中嘗試了很多其他工具,包括頻繁迭代的國產大模型、專門輔助創作的Agent等等。
“重新用起來才發現,AI能力發展得太快,認為DeepSeek一直有獨一無二的優勢,才是幻覺吧。”袪魅來得有些突然,但似乎也順理成章,甚至都沒等到新模型的正式發布。
如今看來,所有人等待DeepSeek,并不僅僅是等待這個大模型本身——人們等待的,是一個新的高光時刻,正如一年多之前,那個被標識為中國AI的“破圈”的時刻。
那時,對于更廣泛的國內受眾來說,ChatGPT等頂級大模型的能力仍是“只聞其名,未見其實”。即使只是聊天,能多數能用到的模型也不盡如人意,它們無論在性能、知名度還是期待值上,都囿于有限圈層內。
直到DeepSeek橫空出世,在那個氛圍感十足的春節檔,才讓人們看到了AI會思考、說人話,甚至能干活,這是本土產出的大模型第一次具備比肩全球頂級的性能。對于很多人來說,這是第一次真正接觸AI,除了手機里多了一個App,生活、生產方式也開始悄然變化;對于很多人來說,大預言模型、提示詞、訓練與推理等AI術語第一次有了實體,甚至不少人對復雜的參數和Benchmark的榜單有了興趣。
這緣于DeepSeek,行業也在這種氣氛下加速。競爭激烈了起來,大家都在加速,DeepSeek卻好像慢了下來。
在漫長的等待中,他們會通過各種契機接觸到所謂“競品”或新事物,并驚覺它們能夠填補那個缺席的空洞。
而即使對于更為硬核的開發者、業內人士,對DeepSeek的看法和心態,似乎也已被重置。
4月24日,V4終于正式登場,人們等來了新的世界最強開源模型,等來了大幅提升的Agent能力,也等來了“國產模型+國產芯片”的深度適配。
如果回到V3.2發布時的節點來看,這似乎正是曾經的期許。
但社群、評論區的關注已不在此,一些不滿的聲音認為DeepSeek在“固步自封”,而且沒有在自己專精的道路上真正擠進“最強梯隊”。而關于遲到的原因與代價,包括與國產算力的深度綁定,也愈發成為爭議焦點。
兩次更新之間,145天過去了,DeepSeek還在“深度求索”那個答案,關于顛覆性創新、關于開源生態、關于AGI。
可它面對的問題,卻變了。
氣氛到了,V4卻沒來
在等待DeepSeek的時間里,AI行業發生了很多事。
最新的感知是,AI需要賺錢了。
這是2025年底到2026年初行業最重要的事情。
Meta重金收購Agent初創公司Manus,無疑是其中最大的故事。后者是2025年繼DeepSeek后又一個引發全球關注的由中國團隊主導的AI公司。
這一年,始于DeepSeek橫空出世,終于Manus委身巨頭。
跨年后,劇情再次加速。1月8日,智譜率先敲鐘,Minimax次日掛牌——自此,大模型廠商有了明確的市場價格,而且將不斷接受“何時盈利”的詰問。
作為全球風向標的OpenAI和Anthropic,也都在開年宣布入局“AI+醫療”,前者還啟動了廣告業務。
相較于迭代速度和性能指標的較量,模型發布時的“商業變現”能力被更加凸顯了出來,幾乎每款重要模型都會精準鎖定一些辦公或商業場景,錨定更加直接的“經濟價值兌現”。
那時的DeepSeek,仍被認為是“合唱”的一員。盡管彼時在這家刻意低調的公司身上還看不到太多商業訴求,但其對Agent能力、編程等領域的探索,均是行業主流方向。而且,畢竟梁文鋒的老本行是量化投資,畢竟,“把價格打下來”這件事,DeepSeek也一直是最重要的推手。
行業里,幾乎每天都有新變化。熱鬧的間歇,總有人在等著DeepSeek。
零星的消息偶爾傳來。The Information報道稱DeepSeek 將于2月中旬的馬年春節前后發布新一代模型,知情人士則透露其主打編碼能力,內部初步測試超越了“編程之王”Claude。而在1月1日和13日,DeepSeek發布了兩篇論文,分別聚焦mHC和Engram,解決規模和記憶這兩大關鍵問題,被當作新模型的前奏。
一位開發者回憶稱,由于一直在與全球頂級模型“掰手腕”,大家會習慣性地認為DeepSeek會與OpenAI、Anthropic一直在同一擂臺上較量,而且對國產大模型有引領作用。“提升生產力和實用價值是一定的,至于商業變現,很多人預期DeepSeek會在發布新模型的同時找到自己的商業模式,而這并不影響開源的生態。”
一切看起來,都是蓄勢待發的模樣,但事后看來,很多時間節點,更像是外界強加的想象——那一時期外界AI商業化浪潮的沖擊,遠較DeepSeek自己預期的節奏更猛烈。
根據晚點等媒體的報道,王炳宣、魏浩然、郭達雅等核心貢獻者在2025年底至今年3月間相繼出走大廠,雖然單看流失率還不到2%,但此前“DeepSeek員工極難挖角”的敘事已經松動。而“不融資”導致員工手中期權兌現無期甚至難以估價,被視為人才流失的重要原因。
在內部,梁文鋒開始考慮融資,更多提及產品化,同時還要推進V4,面對其與國產芯片深度適配的復雜問題;而競爭對手在快速迭代模型,并持續挖角DeepSeek的人才……
當然,人們事后才知道這些暗流。但在水面上,仍不乏線索,比如1月到2月期間DeepSeek在模型性能排名、下載量、活躍用戶排行榜上出現下滑。而不少外媒和機構也關注到了,這家致力于開發全球最頂尖大模型的公司,在因地緣問題無法持續獲取英偉達先進芯片的情況下,可能面臨著較為嚴峻的算力制約。
情況不樂觀,但只要V4足夠強,以那時的氛圍來看,就能扭轉勢頭。
1月中旬起,DeepSeek鮮少“拋頭露面”,被認為進入了重大模型更新前的“靜默期”。
1月下旬至春節前,以“龍蝦”為標志的Agent——OpenClaw、字節的視頻模型Seedance 2.0相繼爆火。曾為DeepSeek給出高度評價的OpenAI聯合創始人安德烈·卡帕西(Andrej Karpathy)、打造出《黑神話:悟空》的游戲科學創始人馮驥,以類似的風格分別給予了新事物極大贊許。
而在討論中,它們也常被稱作“2026年的DeepSeek時刻”,這讓屬于DeepSeek自己的時刻,被愈發寄予厚望。
![]()
此后的馬年春節,AI圈愈發不平靜,甚至席卷了更多的領域。
Anthorpic發布的插件導致Saas行業遭遇“替代危機”,美股軟件板塊持續暴跌;而騰訊、阿里、字節、百度等中國大廠則打起了一場耗資近百億元人民幣的“春節AI大戰”。
氣氛烘托到這,人們也一度十分篤定,V4會在某個時刻登場。
但直到春節結束,人們才真的相信DeepSeek“爽約”了,盡管官方從未給出過任何發布時間線。
一位GPU“小龍”公司的研發人員對我們回憶稱,為了在24小時以內給V4做適配,公司提前做了不少準備,假期也一直安排員工待命,但沒怎么想到最終會是“一場空等”。
實際上,從芯片、云廠商,到以DeepSeek為主模型的騰訊等大廠、競爭對手,以及更渴求用到新品的AI應用企業和開發者,都在苦等V4的“閃亮登場”。
這種熱切到有些焦急的盼望,在3月有了歸宿,不過主角不是DeepSeek,而是OpenClaw。
“龍蝦”與“鯨魚”
OpenClaw在中國的火爆有些突然。
這只號稱讓“AI長了手和腳,能動手干活”的“龍蝦”Agent早在1月下旬就從硅谷“破圈”。
但在國內更廣泛的知名度,則集中在春節過后,兩會期間。
在上海,出現了三百多人排隊安裝“龍蝦”的景象;在深圳,騰訊在自己的大廈前擺攤派“蝦”吸引了千人到場。有人花100多元買“站票”只為聽一堂“手把手教養蝦”的課課程,也有人在閑魚上做起了上門安裝的生意,據說單價都要500元,有人月入六位數。
騰訊、字節、阿里等巨頭隨之下場,密集進行在線部署,并推出了多款“蝦”系產品。
這一切,都像極了2025年春節期間,由以鯨魚為標志的DeepSeek所引發的那波熱潮。
而很大程度上,正是DeepSeek V4的“遲到”,促成了OpenClaw的火爆。
那時盛行的一個段子,是美國AI在卷技術、卷編程、卷生產力,而中國的春節AI大戰在卷補貼、卷紅包、卷奶茶。
人們在等待一個新的爆款,最好能夠代表技術前沿,最好能夠許諾開啟新的時代,最好還能富有故事性且平易近人。
去年的那條“鯨魚”始終不肯浮出水面,積攢的情緒就找到了“龍蝦”。它的誕生同樣充滿了極客精神和戲劇性,甚至多了些游戲感,它還被視作“AI進入Agent時代”的標志性事件。
這個早春需要這只“蝦”,即使它是舶來品,即使早在一個多月前就火過一輪了。
端邊AI芯片廠商后摩智能的一位高管告訴我們,無論是DeepSeek還是OpenClaw,跑通并不是問題。這些新事物的意義更類似“風”,能把芯片、算力企業帶到市場面前。
他舉例稱,DeepSeek V3問世后,國產推理芯片的商業機會不斷釋放,與客戶的“溝通成本”降低很多,只要以DeepSeek為例,用戶就能明白。而“龍蝦”作為一個新物種,也讓大家看到了Agent是一個確定性的趨勢,對于芯片行業來說,它帶來的算力需求暴增、輕量化本地化部署場景的增多、對異構計算的推動,都是機會所在。
就連行業老大英偉達也在全速跟進,在3月中旬的GTC大會上,“龍蝦”成為了貫穿全場的主角,該公司推出了自己的“龍蝦”平臺NemoClaw,黃仁勛更是將其作為“Agentic AI拐點已至”的重要論據。有趣的是,DeepSeek在2025年被稱作GTC大會上潛在的主角,雖然黃仁勛未過多直接提及,但彼時英偉達芯片在推理場景、MoE架構上的調整和闡發,背后都是DeepSeek的影子。畢竟,它曾經讓這個全球市值最高公司的股價一天跌了約17%。
![]()
截圖來自英偉達GTC大會官方直播視頻
當然,“等風來”的不只芯片層,從云、模型,到應用、設備,所有環節都在忙著給自己貼上“蝦標”。
“龍蝦”產品對大模型的調用量形成了單獨的榜單,而“龍蝦本”、Agent box等新的設備也相繼走紅,就像DeepSeek去年爆火時批量面世的DeepSeek一體機一樣。
而壓力,也再次來到了DeepSeek身上。
一位開發者解釋稱,OpenClaw等Agent框架,既依賴大模型進行工作的執行調度,給模型廠商帶來Token消耗的增量,也在一定程度上能拉平各個模型的性能表現。
頻繁更新、更能適配OpenClaw的競爭對手,以及手頭握有有“大龍蝦”之稱的Codex和Claude Code的OpenAI和Anthropic,在這波浪潮中風頭更勁。
而對于仍然只有一個聊天機器人產品的DeepSeek來說,人們的興趣在減弱。這個3月,是“龍蝦月”,是屬于Agent的月份,也是DeepSeek被談論最少的一個月。
等待也變得愈發不耐煩,更多對“拖更”的吐槽冒了出來。就在V4發布之前,人們談論DeepSeek的坐標已經不一樣了。
答案依舊,問題變了
3月29日晚到31日,DeepSeek連續三天遭遇宕機,最長的一次長達13個小時。
較為意外地,對于這次讓DeepSeek重登熱搜的“史上最大事故”,期待甚至蓋過了埋怨,業界猜測故障是因“為V4進行灰度測試”。至少,DeepSeek不再沉默,人們始終希望它“搞出些大事”。
果然,在不乏大事件的4月,DeepSeek仍頻頻成為輿論焦點。
晚點、The Information等媒體接連發布報道,包括上文提及的員工跳槽大廠、公司尋求首次外部融資等信息為更多人所知。
而且,V4的發布時間也終于相對可靠地被錨定在了4月下旬,據稱這是梁文鋒在內部溝通中給出的時間,而且得到了多方信源確認。
這讓關于DeepSeek近況的解析一直持續到V4登場。
但是,如果回看100多天前的討論,會發現人們更多會談及DeepSeek將在Agent、記憶模塊和編程等場景上實現哪些技術和性能上的突破。
而在發布前的20多天中,經過業內“不要抱太高期待”的“預防針”,和被視為已具有V4基因的網頁版、APP并不驚艷的表現,技術和性能層面的討論變得越來越少。
而被推向臺前的,一是DeepSeek的融資和估值;二是與國產算力的深度適配;三是這家公司將何時及如何開啟模商業化變現之路。
從目前的信息來看,融資金額尚無定論,流傳較多的是200億美金,而國資和互聯網大廠很可能率先進場。人們對這一轉變的態度也頗有些矛盾。“不融資”的DeepSeek,更能成就一個特立獨行的形象,堅持自己并名滿天下,一直是最受歡迎的故事。但如果這個象征走向失敗,就會讓一切索然無味。出于對商業邏輯的信奉,多數觀點仍對DeepSeek拿出股權“待價而沽”給予認可。
而在國產算力適配方面,爭議顯得更大,某種程度上期待也更大。
實際上,作為此次深度適配傳言中的主角之一,寒武紀方面曾提示我們,早在去年9月DeepSeek發布V3.2-Exp(實驗版)發布時,公司就完成了Day 0適配。作為國產頂級模型和國產芯片,這種合作很正常也并不神秘。而在12月V3.2正式版發布時,華為昇騰、寒武紀、海光信息三家國產芯片廠商也都宣布在當天完成適配。
不過,在近期的相關討論中,不少消息都將V4遲到的原因指向“去英偉達CUDA”而遷移到國產芯片生態上,進而,值不值得以及誰主導了相關決策,都引起了不同的看法。一位芯片從業者即認為,DeepSeek更多是被交辦了一項任務,而這項任務的復雜性和難度,超過了公司在這個階段的能力和預期。
另一方面,從結果上來說,這次深度適配又不斷刺激出龐大的期待。尤其是黃仁勛在4月中旬做客達瓦克什·帕特爾(Dwarkesh Patel)的播客節目時,將DeepSeek優先適配國產芯片視為美國的“重大損失”,更讓這次事先張揚的生態協作引發了更多遐想。
而對于商業化變現,人們從DeepSeek的招聘信息到4月網頁版更新時的“快速模式”與“專家模式”分層,孜孜尋找著蛛絲馬跡,但似乎都很難論證它如何堅持免費開源、專注AGI探索的同時,還能賺到市場的錢。實際上,DeepSeek公開的商業化路徑目前只有API調用,而且,在其他模型快速迭代的背景下,這一模式也越來因云服務商越來越多地免費部署而出現波動。
這些新的問題、新的討論,就是V4發布前的氛圍。
在4月24日這一天,DeepSeek交出的技術答卷仍是完整的:100萬Token上下文,通過架構創新大幅提升長文本處理和記憶能力;Agent得到凸顯,V4-Pro在Agentic Coding評測中獲得高分;而且性價比仍大幅領先業內同行。
雖然性能的提升和“價格屠夫”的屬性仍得到不少贊許,但這款史上最強開源模型,也在不少反饋中被冠以“失望”的評語。
我們在部分開發者社群看到的評價也不算積極,有開發者注意到其技術報告對比的仍是閉源巨頭的上一代模型,認為DeepSeek將性能測評“說得很含蓄”,實際上與GPT與Claude的差距變大了,甚至在國產模型中優勢也不明顯。還有開發者直言,其“Pro版本的發布太匆忙”,推理過程變得十分漫長,簡單問題也要吐幾萬token的思維鏈,邏輯和輸出結果卻顯得怪異,不少不符合常識的內容,可能是后訓練沒做安全對齊。更多聲音則認為,在多模態、Agent越來越強,還不斷冒出“新玩法”的當下,V4顯得有些平庸和無趣。
而且,關于備受期待的國產模型與國產芯片的深度適配,這次發布同樣鮮少著墨,50余頁的技術報告僅提到華為一次。雖然更多的國產芯片宣布了Day 0適配,但至少目前還看不到對CUDA生態的真正沖擊。
也有從業者提示,適配問題需等待進一步消息的披露。但考慮到性能和表現并不驚艷,后續更新的細節能激起多大浪花,還有待觀察。值得注意的是,DeepSeek在V4的token價格表后附言:受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。這也成了未來一段時間頗值得期待的進展。
![]()
截圖來自DeepSeek官微
或許是感受到了周身氛圍的變化,DeepSeek在V4發布文章的末尾寫下了一段話:
“不誘于譽,不恐于誹,率道而行,端然正己。”
并稱公司將“始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向實現 AGI 的目標不斷靠近”。
這場漫長的等待終于結束了。我們也能更清晰地看到,等待DeepSeek的人們,究竟在等待些什么。
是遠不止一個版本的迭代,一次性能的提升,抑或一家公司再次證明自己的故事。人們在等待預期之外的技術和故事,這也是AI時代所獨特賦予的:永遠超乎想象。
V4沒有交出這份不存在標準答案的答卷,但它依然高舉著AGI的旗幟。正如行業內曾流行一句話:假裝AGI已經存在的人,才能先做出AGI。
DeepSeek會在未來再次成為時代顛覆者嗎?或許,在多年后再回看這次等待,我們才更能了解其意義。
(作者|胡珈萌,編輯|楊林)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.