前言
中國科技的舞臺上,又一顆新星閃耀。
梁文鋒,這位40歲的AI創業者,靠DeepSeek-R1模型,在國際上連續刷屏。
![]()
美國硅谷巨頭震驚,中國AI產業也為之沸騰。曾經認為中國只是“追趕者”的觀念,正在被徹底打破。
這不僅是一家公司的勝利,更是一場全球科技秩序的潛在重構……
DeepSeek 強勢封神
這一現象級的震動,甚至讓《自然》期刊打破常規,將年度十大科學人物的一席之地,留給了這股風暴的始作俑者——梁文鋒。
![]()
作為AI領域的“科技顛覆者”,這個名字對于大多數美國科技大佬來說稍顯陌生,但其展現出的殺傷力卻讓他們無法忽視。
就在那個動蕩的交易日之前幾天,1月20日上線的DeepSeek-R1推理模型,以一種令人難以置信的姿態登頂了美國蘋果AppStore的免費榜,將那個長期霸榜、曾經不可一世的ChatGPT狠狠甩在了身后。這一切不僅是對中國創新速度的證明,更像是一次對硅谷“算力霸權”的公然嘲諷。
![]()
外界震驚的不僅僅是性能,當DeepSeek-R1在各項任務中展現出與OpenAI王牌模型o1難分伯仲的能力時,更深層的恐懼源于其摧毀性的成本控制邏輯。
這是一個關于“用十分之一的錢,辦同樣事”的故事。據悉,這套讓全球資本市場膽寒的模型,其設計費用竟然不到600萬美元。在每一次API調用的成本上,它比OpenAI的o1便宜了整整93%。
![]()
在那些習慣了“大力出奇跡”、瘋狂堆砌顯卡的硅谷巨頭眼中,這不僅是技術的追趕,更是對現有商業模式地基的抽離。這種極致的性價比意味著,建立在昂貴算力壟斷上的護城河,可能并沒有想象中那么牢不可破。
要理解這種近乎偏執的效率追求,我們得把目光投向這一切的起點,卻不是去翻閱某本計算機科學的教材,而是要去探究一個數學天才的交易直覺。
現年40歲的梁文鋒,在躋身《2025年財富雜志500創富榜》前十名、坐擁1800億元身家之前,最顯著的標簽并非“企業家”,而是一個在數字迷宮中尋找最優解的探路者。17歲那年,他以全校第一的成績考入浙江大學攻讀電子信息工程,后來深造主攻機器視覺。
![]()
早在2008年那場席卷全球的金融危機中,尚未畢業的他沒有像同齡人那樣對未來感到恐慌,反而敏銳地察覺到了自動化算法在動蕩中的商業潛能。
這種在危機中尋找縫隙的本能,深刻地烙印在了DeepSeek的基因里。不同于硅谷推崇的“資源飽和式攻擊”,梁文鋒走的是一條典型的“理工男”路線:死磕算法,壓榨硬件極限。
![]()
他在租來的小房子里埋頭鉆研算法的日子,最終化作了幻方量化千億級的管理規模。2016年建立的基于GPU的高頻交易系統,實際上是一次昂貴的“預演”。那是用真金白銀在毫秒級博弈中磨練出來的算力敏感度,這種經驗被他原封不動地移植到了大模型的訓練中。
當DeepSeek在2023年正式用金融賺來的錢反哺科技夢想時,他們的目標從一開始就透著一股精明的瘋狂——用最低的算力,換取最高的智能。
全面開源
這一策略的成效是驚人的,甚至可以說是“反常識”的。以DeepSeekV3為例,它僅用2000張GPU就干出了原本需要1.6萬張GPU才能完成的活。
![]()
這不僅僅是數字的游戲,這是對摩爾定律的一次“降維打擊”。對于那些還在瘋狂囤積算力卡的美國科技公司來說,這簡直是個噩夢。因為這意味著大模型對高端硬件的絕對依賴被削弱了。
這種沖擊在2024年5月就已經顯露端倪,當時發布的V2開源模型,將推理成本降至每百萬token僅需1塊錢,是當時GPT-4Turbo成本的七十分之一。國內的字節、騰訊、百度等大廠被迫卷入這場“價格戰”,紛紛降價,行業的游戲規則在毫厘之間被徹底改寫。
![]()
更讓競爭對手感到棘手的是,梁文鋒并沒有試圖將這項技術鎖在保險柜里待價而沽。相反,他選擇了一種更具野心的打法——全面開源。2025年2月底,那場轟動業界的“開源周”,梁文鋒將訓練技術的細節如同散發傳單一樣公之于眾。
紐約大學的圖靈獎得主楊立昆(YannLeCun)對此贊不絕口,他一針見血地指出,DeepSeek的成功關鍵在于堅持開源,這證明了AI技術并不存在絕對的、不可逾越的壁壘。加州大學的研究員們更是不得不承認,中國龐大的科技人才庫在如何高效利用有限計算資源方面,似乎找到了一條更為高明的路徑。
![]()
這種“廣撒網”的策略,直接帶動了公司估值的飆升。憑著1.05萬億元的估值,DeepSeek一躍成為僅次于字節跳動的中國第二大公司,也是全球第六大初創獨角獸。
但這并不是一條鋪滿鮮花的坦途,在這個極度內卷的賽道上,技術的迭代速度快得驚人,任何瞬間的懈怠都可能導致被反超。
數據的波動最能說明問題:DeepSeekApp的月活數據一度在3月份攀升至1.94億的巔峰,將騰訊元寶、豆包等甩在身后,但在隨后幾個月的新鮮感消退期,月活下滑至1.45億,一度被豆包反超。
![]()
這場戰爭還遠未結束,甚至可以說剛剛進入白熱化階段。真正的巨頭們已經從最初的震驚中回過神來,開始揮舞著支票簿進行反撲。
在大模型領域一度“掉隊”的字節跳動,2024年一年就砸下了近800億元研發費用,甚至有證券預測其今年的AI總投入將翻倍至1600億元,其中絕大部分用于購買那些DeepSeek試圖“弱化”的算力卡。大洋彼岸的微軟、谷歌和Meta也不甘示弱,僅一個財季的資本支出合計就達到了780億美元,這是一場金錢與智慧的終極較量。
面對這股反撲的浪潮,梁文鋒似乎早有準備,并沒有選擇坐以待斃,而是拿出了硬實力進行回擊。就在競爭對手試圖用資本淹沒市場的時候,12月1日,兩款新模型DeepSeek-V3.2和DeepSeek-V3.2Speciale正式登場。
![]()
前者在性能上直逼GPT-5水平,僅略遜于Gemini-3.0-Pro,而且大幅降低了輸出長度,進一步壓縮了用戶等待時間和計算開銷。后者更是橫掃了IMO、CMO、ICPC等四大頂級數學與編程賽事。
如果說,之前的成功還帶有一絲“突襲”的意味,那么這一輪的技術發布,則是正面戰場的陣地戰。那個曾經被視為“追趕者”的角色,正在用一種近乎殘酷的“全開源、低成本”策略,逼迫整個行業重新思考未來的方向。
結語
正如他在采訪中所透露的那樣,這一切不僅僅是為了商業上的盈利,而是為了走到科技的最前沿,去推動整個生態的發展。在這場從“時運”到“實力”的辯證中,梁文鋒和他的團隊正在用實際行動證明,改變世界的或許不是擁有最多的資源,而是擁有最極致的效率。
![]()
那些關于“中國團隊只會追趕”的舊有觀念,在2000張GPU的高效運轉聲中,正在土崩瓦解。
信息源: 投資家:《浙大天才,震驚全球》 觀察者網:《DeepSeek-R1開創歷史,梁文鋒論文登上《自然》封面》
#優質圖文扶持計劃#
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.