引子:我們總是對從 0 到 1 的創(chuàng)新滿懷期待,渴望見證石破天驚的突破。但客觀來講,邁出第一步和邁出第一萬步,在本質(zhì)上并沒有區(qū)別,每一步都同樣重要。
![]()
新年伊始,本該沉浸在休息放松的愜意時光里,可面對讀者們熱情滿滿的催更,實在讓我難以招架,尤其是關(guān)于DeepSeek的討論呼聲,熱度簡直居高不下。本以為只有科技圈對它格外關(guān)注,結(jié)果在一個搞笑博主的評論區(qū)里,都能看到網(wǎng)友焦急地發(fā)問:“你怎么還不講 DeepSeek?它血洗美國股市,把美國人的幻想都干碎了,那些歐美科技公司都坐不住啦!” 這關(guān)注度,著實超乎想象!
![]()
這股 “DeepSeek 熱” 不僅沒有降溫,反而愈演愈烈。各種夸張的言論甚囂塵上:
- “科技巨頭全報廢了”
- “AGI 馬上實現(xiàn)”
- “普通人再不學(xué) DeepSeek 就晚了”
仿佛一夜之間,DeepSeek 成了改寫科技史的超級英雄。更離譜的是,還有人編造出 DeepSeek 遭受境外大規(guī)模網(wǎng)絡(luò)攻擊,中國紅客高手隱跡江湖出手相救的熱血爽文劇情,這想象力,不去寫小說都可惜了。
![]()
輿論的走向愈發(fā)失控,我們似乎只要一談到 DeepSeek,就會陷入一種盲目狂熱的情緒之中。不可否認(rèn),DeepSeek 自身實力確實出色,加上這幾年 AI 行業(yè)本就火爆,這些因素都為它的熱度添了一把柴。但其中地緣因素的推動作用也不容忽視,很多人內(nèi)心深處渴望聽到一個 “歪果仁怕了、服了” 的科技故事,DeepSeek 的出現(xiàn),就像是一場及時雨,滿足了大家這種心理需求。
媒體和公眾人物也紛紛下場,為這種情緒推波助瀾,把對 DeepSeek 的討論上升到哲學(xué)、國運、歷史走向的高度。這些討論在流量的放大鏡下,被不斷放大、斷章取義,讓一款 AI 模型背負(fù)了遠(yuǎn)超它本身的地位、責(zé)任和期待,硬生生地被推上了神壇。
![]()
可神壇之上,真的是一片坦途嗎?回顧過往,我們不難發(fā)現(xiàn),被捧得越高,往往摔得就越慘,“傷仲永”“泡沫破裂” 的輿論反噬屢見不鮮。對于剛剛嶄露頭角的 DeepSeek 和它的研發(fā)團(tuán)隊來說,這種過度追捧帶來的負(fù)面影響,很可能遠(yuǎn)遠(yuǎn)超過正面意義。
![]()
所以,是時候冷靜下來,拆掉這座輿論堆砌的神壇,還 DeepSeek 一個真實、樸素的面貌,基于客觀的共識,重新審視它。
一、它并非從 0 到 1 的開創(chuàng)性突破
先拋出一個可能會讓不少人驚訝的觀點:與社交媒體上那些夸張的說法不同,DeepSeek 其實并沒有實現(xiàn)從 0 到 1 的核心技術(shù)突破。
DeepSeek 爆火之后,研發(fā)團(tuán)隊和科技產(chǎn)業(yè)的相關(guān)人士都在強調(diào)中國 AI 不能只是亦步亦趨,必須要完成從 0 到 1 的蛻變。這個觀點無疑是正確的,可就目前的情況來看,DeepSeek 還難以成為這個觀點的有力例證。
![]()
所謂的核心技術(shù)突破,要么是主要技術(shù)路徑發(fā)生根本性變化,要么是達(dá)成的效果有質(zhì)的飛躍。DeepSeek 目前最引人注目的技術(shù)能力,一個是 R1 模型帶火的思維鏈推理過程,另一個是其聯(lián)網(wǎng)檢索的RAG效果表現(xiàn)出色。
但這兩條技術(shù)路線都不是 DeepSeek 的首創(chuàng)。思維鏈的興起,一般認(rèn)為是 OpenAI 發(fā)布的 o1 模型引發(fā)的。去年 9 月 o1 模型公布后,全球主流大模型紛紛跟進(jìn),推出了類似的思維鏈、推理大模型等能力,雖然各家的名稱可能不太一樣,但整體技術(shù)路線高度一致。DeepSeek 確實把思維鏈的過程展示得更加完整、詳細(xì),可仔細(xì)觀察就會發(fā)現(xiàn),其中大模型幻覺的問題依然十分嚴(yán)重。
![]()
在聯(lián)網(wǎng)檢索方面,其他廠商也早就開始布局,也就是所謂的 RAG 檢索-增強-生成機制。這項技術(shù)最初是為了解決大模型缺乏實時信息的問題,同時幫助矯正大模型幻覺。早在 2023 年,百度發(fā)布文心一言時,RAG 就已經(jīng)是其核心能力的重要組成部分。
![]()
不過,沒有從 0 到 1 的創(chuàng)新,并不代表沒有創(chuàng)新。DeepSeek 在模型能力的優(yōu)化上付出了諸多努力,做了大量開拓性工作,比如通過 GRPO 算法讓模型運行更加高效。可以說,DeepSeek 集成了業(yè)界主流且經(jīng)過驗證的技術(shù)路線,并在此基礎(chǔ)上實現(xiàn)了模型優(yōu)化、能力提升和用戶體驗升級。
我們總是對從 0 到 1 的創(chuàng)新滿懷期待,渴望見證石破天驚的突破。但客觀來講,邁出第一步和邁出第一萬步,在本質(zhì)上并沒有區(qū)別,每一步都同樣重要。
![]()
二、真正的價值在于降低 AI 算力成本
那么,DeepSeek 究竟憑什么能引發(fā)全球關(guān)注呢?在經(jīng)過一個春節(jié)的瘋狂發(fā)酵后,很多人可能都快忘記了它最初出圈的原因 —— 通過軟件和架構(gòu)創(chuàng)新,以極低的算力成本完成了 DeepSeek - V3 模型的訓(xùn)練。
DeepSeek - V3 是我們現(xiàn)在使用的 R1 模型的基礎(chǔ)模型。從研發(fā)團(tuán)隊發(fā)表的論文中可以了解到,他們僅僅花費了 550 萬美元的算力訓(xùn)練成本,就完成了 6710 億參數(shù)大模型的訓(xùn)練。即便這個統(tǒng)計只涵蓋了基礎(chǔ)模型訓(xùn)練的算力成本,不包括后續(xù)應(yīng)用模型的強化學(xué)習(xí)、模型推理,以及人才成本、綜合成本等項目,但這已經(jīng)足以顛覆大模型訓(xùn)練的主流成本模型。
![]()
最終,DeepSeek 實現(xiàn)的效果基本達(dá)到了以 o1 為代表的主流大模型水平。雖然在模型效果上很難說全面超越了其他模型,但它確實憑借軟件算法的革新,實現(xiàn)了硬件成本的大幅下降,讓低成本模型的效果不遜色于高成本模型,也讓開源模型的效果逐漸追趕閉源模型。
![]()
而 DeepSeek “降低 AI 算力成本” 的這一突破,恰好發(fā)生在全球主流 AI 玩家瘋狂囤積高端 GPU,以此構(gòu)筑產(chǎn)業(yè)護(hù)城河,以及美國對中國禁售高端 AI 芯片,企圖打壓中國 AI 發(fā)展的關(guān)鍵節(jié)點上。這就使得 DeepSeek 被賦予了實現(xiàn) AI 民主化,甚至助力打破地緣科技壟斷的特殊意義,于是就有了中國 AI 大模型讓美國股市遭遇震蕩的戲劇性一幕。
![]()
DeepSeek 實現(xiàn)的訓(xùn)練效率提升與訓(xùn)練成本下降,在特殊的產(chǎn)業(yè)環(huán)境和國際環(huán)境下引發(fā)了連鎖反應(yīng)。但問題是,很多平時不太關(guān)注 AI 的朋友,可能根本不知道 AI 大模型算力越大效果越好的 Scaling Laws,也不了解算力壟斷和禁售的背景信息,只知道短視頻里說 DeepSeek 橫空出世,把外國人都嚇得不輕。這種缺乏前因后果的片面認(rèn)知,給 DeepSeek 憑空塑造了一座不屬于它的神壇。
![]()
推而廣之,我們很多人都熱衷于追捧那些天才式、戲劇化的創(chuàng)新。但在現(xiàn)實世界里,往往只有通過不斷地工程化實踐,持續(xù)調(diào)優(yōu)、降本、提效,技術(shù)創(chuàng)新才有可能得到廣泛應(yīng)用和普及。就像我們都知道愛迪生發(fā)明了電燈,卻容易忽略大規(guī)模電網(wǎng)建設(shè)對降低電力成本的巨大作用。要是每家都得自己發(fā)電,那世界恐怕真的會陷入一片黑暗。
“我們把成本打下來了。” 這句看似荒誕、俗套,甚至帶點反諷意味的話,恰恰是中國產(chǎn)業(yè)化能力的真實寫照。我們不妨大大方方地承認(rèn),包括 DeepSeek 在內(nèi)的中國 AI,在未來很長一段時間里,最擅長的就是把成本狠狠降下來。
![]()
三、成功背后,人文能力至關(guān)重要
DeepSeek 爆火之后,很多人都將其歸功于技術(shù)的巨大勝利,甚至有人預(yù)言 AI 的崛起會讓人文學(xué)科和人文工作失去價值,“DeepSeek 來了,學(xué)文科還有意義嗎?” 這樣的話題還登上了熱搜。
但只要我們多使用 DeepSeek,仔細(xì)分析它與其他模型的差異,就會發(fā)現(xiàn)一個截然不同的觀點:DeepSeek 恰恰證明了文科與人文能力,在 AI 時代有著不可替代的重要性。
![]()
隨機詢問一些人對 DeepSeek 的使用體驗,他們大多會說跟 DeepSeek 對話感覺更有人情味。但這種人味,并非源于理解、推理等 AI 技術(shù)層面,而是模型在對話過程中展現(xiàn)出了豐富的幽默感、網(wǎng)感,以及更符合年輕群體的對話習(xí)慣。此外,DeepSeek 還具有相對精妙的修辭能力、優(yōu)美的文筆和不錯的綜合人文素養(yǎng)。
![]()
這些能力,讓 DeepSeek 更契合年輕用戶的對話習(xí)慣和審美需求,能夠給出更具話題度和傳播度的回答。可關(guān)鍵在于,這些能力與技術(shù)的關(guān)聯(lián)不大,更多地與訓(xùn)練語料的選取等人文能力密切相關(guān)。
比如,讓 DeepSeek 寫首詩,它能寫出文藝青年喜愛的語調(diào)與修辭;而其他主流國內(nèi)大模型,雖然也能寫得平仄工整、辭藻華麗,卻總給人一種打油詩般的 “老干體” 感覺。再比如,讓 DeepSeek 預(yù)測未來趨勢等問題,它的回答就像網(wǎng)絡(luò)科幻小說,雖然經(jīng)不起仔細(xì)推敲,但就是能讓年輕人覺得特別厲害、特別燃。
![]()
這些優(yōu)點的背后,是研發(fā)團(tuán)隊的年輕化、高審美,以及對模型訓(xùn)練過程中人文要素的重視。反觀很多主流大模型,由于最終聽取匯報的領(lǐng)導(dǎo)層普遍是 45 歲以上、缺乏人文學(xué)科背景的中年男士,導(dǎo)致大模型對話充滿 “官腔”,讓人提不起興趣。與其說是年輕人在支持 DeepSeek,不如說是年輕人在支持自己的話語權(quán)和審美權(quán)。
順便提一句,DeepSeek 目前還有些 “百無禁忌”,但監(jiān)管遲早會介入,大家也不必對 AI 的犀利和大膽抱有過多幻想。
![]()
DeepSeek 以一種巧妙的方式,實現(xiàn)了更好的用戶對話體驗和更優(yōu)秀的傳播效果。這或許能促使 AI 公司反思產(chǎn)品體驗,重視人文能力的培養(yǎng)。如果我們只一味地吹噓 DeepSeek 的技術(shù),而忽略了它在人文體驗方面的優(yōu)勢,那可就太可惜了。
![]()
四、客觀看待,穩(wěn)步前行
綜合以上這些方面,我們可以勾勒出一個完整、真實的 DeepSeek,它不再被神圣的光暈籠罩:
它是一次綜合性的突破,融合了技術(shù)創(chuàng)新、人文素養(yǎng)、開源和低成本策略等要素,并且在特殊的產(chǎn)業(yè)周期和國際環(huán)境背景下被不斷放大。
![]()
DeepSeek 不是石破天驚的技術(shù)革命,但它足夠成熟,也足夠有新意。這也在一定程度上解釋了,為什么歐美的 AI 大佬與專家,對它的評價比較一致:令人印象深刻。
DeepSeek 沒有一步登天,我們也不必幻想一步登天。它只是前進(jìn)了一大步,我們完全可以為這一步的邁出而感到自信和驕傲。
![]()
我堅決反對 “中國只有 DeepSeek”
這種片面的言論。事實上,中國有著清晰的 AI 產(chǎn)業(yè)格局,堅實的自主化 AI 軟硬件體系,數(shù)十萬 AI 開發(fā)者,以及積極的 AI 政策導(dǎo)向。這些都是孕育更多優(yōu)秀 AI 成果的肥沃土壤。有了這些因素的支撐,我堅信會有更多像 DeepSeek 這樣的優(yōu)秀成果不斷涌現(xiàn),直到 AI 工業(yè)革命全面開啟,直到 AGI 的曙光真正降臨。
所以,何不把 DeepSeek 帶下神壇?理性、從容地看待它,用好它,用好中國 AI 事業(yè)的一切成果,這才是 AI 在中國真正成熟的標(biāo)志。
![]()
王陽明說:“山高萬仞,只登一步。”DeepSeek 這一步,有著它獨特的意義。邁出這一步后,我們不妨停下來,聽聽山風(fēng),享受一下階段性的成果。但同時也要清醒地認(rèn)識到,我們還在攀登的路上。休息好了,高興夠了,我們唯一要做的,就是堅定地邁出下一步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.