網易首頁 > 網易號 > 正文申請入駐

DeepSeek：不應被神化的技術與現實

2025-03-04 18:29:21　來源: 濤哥銳評

湖北舉報

分享至

引子：我們總是對從 0 到 1 的創新滿懷期待，渴望見證石破天驚的突破。但客觀來講，邁出第一步和邁出第一萬步，在本質上并沒有區別，每一步都同樣重要。

新年伊始，本該沉浸在休息放松的愜意時光里，可面對讀者們熱情滿滿的催更，實在讓我難以招架，尤其是關于DeepSeek的討論呼聲，熱度簡直居高不下。本以為只有科技圈對它格外關注，結果在一個搞笑博主的評論區里，都能看到網友焦急地發問：“你怎么還不講 DeepSeek？它血洗美國股市，把美國人的幻想都干碎了，那些歐美科技公司都坐不住啦！” 這關注度，著實超乎想象！

這股 “DeepSeek 熱” 不僅沒有降溫，反而愈演愈烈。各種夸張的言論甚囂塵上：

“科技巨頭全報廢了”
“AGI 馬上實現”
“普通人再不學 DeepSeek 就晚了”

仿佛一夜之間，DeepSeek 成了改寫科技史的超級英雄。更離譜的是，還有人編造出 DeepSeek 遭受境外大規模網絡攻擊，中國紅客高手隱跡江湖出手相救的熱血爽文劇情，這想象力，不去寫小說都可惜了。

輿論的走向愈發失控，我們似乎只要一談到 DeepSeek，就會陷入一種盲目狂熱的情緒之中。不可否認，DeepSeek 自身實力確實出色，加上這幾年 AI 行業本就火爆，這些因素都為它的熱度添了一把柴。但其中地緣因素的推動作用也不容忽視，很多人內心深處渴望聽到一個 “歪果仁怕了、服了” 的科技故事，DeepSeek 的出現，就像是一場及時雨，滿足了大家這種心理需求。

媒體和公眾人物也紛紛下場，為這種情緒推波助瀾，把對 DeepSeek 的討論上升到哲學、國運、歷史走向的高度。這些討論在流量的放大鏡下，被不斷放大、斷章取義，讓一款 AI 模型背負了遠超它本身的地位、責任和期待，硬生生地被推上了神壇。

可神壇之上，真的是一片坦途嗎？回顧過往，我們不難發現，被捧得越高，往往摔得就越慘，“傷仲永”“泡沫破裂” 的輿論反噬屢見不鮮。對于剛剛嶄露頭角的 DeepSeek 和它的研發團隊來說，這種過度追捧帶來的負面影響，很可能遠遠超過正面意義。

所以，是時候冷靜下來，拆掉這座輿論堆砌的神壇，還 DeepSeek 一個真實、樸素的面貌，基于客觀的共識，重新審視它。

一、它并非從 0 到 1 的開創性突破

先拋出一個可能會讓不少人驚訝的觀點：與社交媒體上那些夸張的說法不同，DeepSeek 其實并沒有實現從 0 到 1 的核心技術突破。

DeepSeek 爆火之后，研發團隊和科技產業的相關人士都在強調中國 AI 不能只是亦步亦趨，必須要完成從 0 到 1 的蛻變。這個觀點無疑是正確的，可就目前的情況來看，DeepSeek 還難以成為這個觀點的有力例證。

所謂的核心技術突破，要么是主要技術路徑發生根本性變化，要么是達成的效果有質的飛躍。DeepSeek 目前最引人注目的技術能力，一個是 R1 模型帶火的思維鏈推理過程，另一個是其聯網檢索的RAG效果表現出色。

但這兩條技術路線都不是 DeepSeek 的首創。思維鏈的興起，一般認為是 OpenAI 發布的 o1 模型引發的。去年 9 月 o1 模型公布后，全球主流大模型紛紛跟進，推出了類似的思維鏈、推理大模型等能力，雖然各家的名稱可能不太一樣，但整體技術路線高度一致。DeepSeek 確實把思維鏈的過程展示得更加完整、詳細，可仔細觀察就會發現，其中大模型幻覺的問題依然十分嚴重。

在聯網檢索方面，其他廠商也早就開始布局，也就是所謂的 RAG 檢索－增強－生成機制。這項技術最初是為了解決大模型缺乏實時信息的問題，同時幫助矯正大模型幻覺。早在 2023 年，百度發布文心一言時，RAG 就已經是其核心能力的重要組成部分。

不過，沒有從 0 到 1 的創新，并不代表沒有創新。DeepSeek 在模型能力的優化上付出了諸多努力，做了大量開拓性工作，比如通過 GRPO 算法讓模型運行更加高效?？梢哉f，DeepSeek 集成了業界主流且經過驗證的技術路線，并在此基礎上實現了模型優化、能力提升和用戶體驗升級。

我們總是對從 0 到 1 的創新滿懷期待，渴望見證石破天驚的突破。但客觀來講，邁出第一步和邁出第一萬步，在本質上并沒有區別，每一步都同樣重要。

二、真正的價值在于降低 AI 算力成本

那么，DeepSeek 究竟憑什么能引發全球關注呢？在經過一個春節的瘋狂發酵后，很多人可能都快忘記了它最初出圈的原因 —— 通過軟件和架構創新，以極低的算力成本完成了 DeepSeek - V3 模型的訓練。

DeepSeek - V3 是我們現在使用的 R1 模型的基礎模型。從研發團隊發表的論文中可以了解到，他們僅僅花費了 550 萬美元的算力訓練成本，就完成了 6710 億參數大模型的訓練。即便這個統計只涵蓋了基礎模型訓練的算力成本，不包括后續應用模型的強化學習、模型推理，以及人才成本、綜合成本等項目，但這已經足以顛覆大模型訓練的主流成本模型。

最終，DeepSeek 實現的效果基本達到了以 o1 為代表的主流大模型水平。雖然在模型效果上很難說全面超越了其他模型，但它確實憑借軟件算法的革新，實現了硬件成本的大幅下降，讓低成本模型的效果不遜色于高成本模型，也讓開源模型的效果逐漸追趕閉源模型。

而 DeepSeek “降低 AI 算力成本” 的這一突破，恰好發生在全球主流 AI 玩家瘋狂囤積高端 GPU，以此構筑產業護城河，以及美國對中國禁售高端 AI 芯片，企圖打壓中國 AI 發展的關鍵節點上。這就使得 DeepSeek 被賦予了實現 AI 民主化，甚至助力打破地緣科技壟斷的特殊意義，于是就有了中國 AI 大模型讓美國股市遭遇震蕩的戲劇性一幕。

DeepSeek 實現的訓練效率提升與訓練成本下降，在特殊的產業環境和國際環境下引發了連鎖反應。但問題是，很多平時不太關注 AI 的朋友，可能根本不知道 AI 大模型算力越大效果越好的 Scaling Laws，也不了解算力壟斷和禁售的背景信息，只知道短視頻里說 DeepSeek 橫空出世，把外國人都嚇得不輕。這種缺乏前因后果的片面認知，給 DeepSeek 憑空塑造了一座不屬于它的神壇。

推而廣之，我們很多人都熱衷于追捧那些天才式、戲劇化的創新。但在現實世界里，往往只有通過不斷地工程化實踐，持續調優、降本、提效，技術創新才有可能得到廣泛應用和普及。就像我們都知道愛迪生發明了電燈，卻容易忽略大規模電網建設對降低電力成本的巨大作用。要是每家都得自己發電，那世界恐怕真的會陷入一片黑暗。

“我們把成本打下來了。” 這句看似荒誕、俗套，甚至帶點反諷意味的話，恰恰是中國產業化能力的真實寫照。我們不妨大大方方地承認，包括 DeepSeek 在內的中國 AI，在未來很長一段時間里，最擅長的就是把成本狠狠降下來。

三、成功背后，人文能力至關重要

DeepSeek 爆火之后，很多人都將其歸功于技術的巨大勝利，甚至有人預言 AI 的崛起會讓人文學科和人文工作失去價值，“DeepSeek 來了，學文科還有意義嗎？” 這樣的話題還登上了熱搜。

但只要我們多使用 DeepSeek，仔細分析它與其他模型的差異，就會發現一個截然不同的觀點：DeepSeek 恰恰證明了文科與人文能力，在 AI 時代有著不可替代的重要性。

隨機詢問一些人對 DeepSeek 的使用體驗，他們大多會說跟 DeepSeek 對話感覺更有人情味。但這種人味，并非源于理解、推理等 AI 技術層面，而是模型在對話過程中展現出了豐富的幽默感、網感，以及更符合年輕群體的對話習慣。此外，DeepSeek 還具有相對精妙的修辭能力、優美的文筆和不錯的綜合人文素養。

這些能力，讓 DeepSeek 更契合年輕用戶的對話習慣和審美需求，能夠給出更具話題度和傳播度的回答?？申P鍵在于，這些能力與技術的關聯不大，更多地與訓練語料的選取等人文能力密切相關。

比如，讓 DeepSeek 寫首詩，它能寫出文藝青年喜愛的語調與修辭；而其他主流國內大模型，雖然也能寫得平仄工整、辭藻華麗，卻總給人一種打油詩般的 “老干體” 感覺。再比如，讓 DeepSeek 預測未來趨勢等問題，它的回答就像網絡科幻小說，雖然經不起仔細推敲，但就是能讓年輕人覺得特別厲害、特別燃。

這些優點的背后，是研發團隊的年輕化、高審美，以及對模型訓練過程中人文要素的重視。反觀很多主流大模型，由于最終聽取匯報的領導層普遍是 45 歲以上、缺乏人文學科背景的中年男士，導致大模型對話充滿 “官腔”，讓人提不起興趣。與其說是年輕人在支持 DeepSeek，不如說是年輕人在支持自己的話語權和審美權。

順便提一句，DeepSeek 目前還有些 “百無禁忌”，但監管遲早會介入，大家也不必對 AI 的犀利和大膽抱有過多幻想。

DeepSeek 以一種巧妙的方式，實現了更好的用戶對話體驗和更優秀的傳播效果。這或許能促使 AI 公司反思產品體驗，重視人文能力的培養。如果我們只一味地吹噓 DeepSeek 的技術，而忽略了它在人文體驗方面的優勢，那可就太可惜了。

四、客觀看待，穩步前行

綜合以上這些方面，我們可以勾勒出一個完整、真實的 DeepSeek，它不再被神圣的光暈籠罩：

它是一次綜合性的突破，融合了技術創新、人文素養、開源和低成本策略等要素，并且在特殊的產業周期和國際環境背景下被不斷放大。

DeepSeek 不是石破天驚的技術革命，但它足夠成熟，也足夠有新意。這也在一定程度上解釋了，為什么歐美的 AI 大佬與專家，對它的評價比較一致：令人印象深刻。

DeepSeek 沒有一步登天，我們也不必幻想一步登天。它只是前進了一大步，我們完全可以為這一步的邁出而感到自信和驕傲。

我堅決反對 “中國只有 DeepSeek”

這種片面的言論。事實上，中國有著清晰的 AI 產業格局，堅實的自主化 AI 軟硬件體系，數十萬 AI 開發者，以及積極的 AI 政策導向。這些都是孕育更多優秀 AI 成果的肥沃土壤。有了這些因素的支撐，我堅信會有更多像 DeepSeek 這樣的優秀成果不斷涌現，直到 AI 工業革命全面開啟，直到 AGI 的曙光真正降臨。

所以，何不把 DeepSeek 帶下神壇？理性、從容地看待它，用好它，用好中國 AI 事業的一切成果，這才是 AI 在中國真正成熟的標志。

王陽明說：“山高萬仞，只登一步?！盌eepSeek 這一步，有著它獨特的意義。邁出這一步后，我們不妨停下來，聽聽山風，享受一下階段性的成果。但同時也要清醒地認識到，我們還在攀登的路上。休息好了，高興夠了，我們唯一要做的，就是堅定地邁出下一步。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.