網易首頁 > 網易號 > 正文申請入駐

一顆新星閃耀！中國AI用 “極致省錢”，打贏了這場翻身仗

2025-12-18 10:08:17　來源: 筆尖視界

河南舉報

分享至

前言

中國科技的舞臺上，又一顆新星閃耀。

梁文鋒，這位40歲的AI創業者，靠DeepSeek-R1模型，在國際上連續刷屏。

美國硅谷巨頭震驚，中國AI產業也為之沸騰。曾經認為中國只是“追趕者”的觀念，正在被徹底打破。

這不僅是一家公司的勝利，更是一場全球科技秩序的潛在重構……

DeepSeek 強勢封神

這一現象級的震動，甚至讓《自然》期刊打破常規，將年度十大科學人物的一席之地，留給了這股風暴的始作俑者——梁文鋒。

作為AI領域的“科技顛覆者”，這個名字對于大多數美國科技大佬來說稍顯陌生，但其展現出的殺傷力卻讓他們無法忽視。

就在那個動蕩的交易日之前幾天，1月20日上線的DeepSeek-R1推理模型，以一種令人難以置信的姿態登頂了美國蘋果AppStore的免費榜，將那個長期霸榜、曾經不可一世的ChatGPT狠狠甩在了身后。這一切不僅是對中國創新速度的證明，更像是一次對硅谷“算力霸權”的公然嘲諷。

外界震驚的不僅僅是性能，當DeepSeek-R1在各項任務中展現出與OpenAI王牌模型o1難分伯仲的能力時，更深層的恐懼源于其摧毀性的成本控制邏輯。

這是一個關于“用十分之一的錢，辦同樣事”的故事。據悉，這套讓全球資本市場膽寒的模型，其設計費用竟然不到600萬美元。在每一次API調用的成本上，它比OpenAI的o1便宜了整整93%。

在那些習慣了“大力出奇跡”、瘋狂堆砌顯卡的硅谷巨頭眼中，這不僅是技術的追趕，更是對現有商業模式地基的抽離。這種極致的性價比意味著，建立在昂貴算力壟斷上的護城河，可能并沒有想象中那么牢不可破。

要理解這種近乎偏執的效率追求，我們得把目光投向這一切的起點，卻不是去翻閱某本計算機科學的教材，而是要去探究一個數學天才的交易直覺。

現年40歲的梁文鋒，在躋身《2025年財富雜志500創富榜》前十名、坐擁1800億元身家之前，最顯著的標簽并非“企業家”，而是一個在數字迷宮中尋找最優解的探路者。17歲那年，他以全校第一的成績考入浙江大學攻讀電子信息工程，后來深造主攻機器視覺。

早在2008年那場席卷全球的金融危機中，尚未畢業的他沒有像同齡人那樣對未來感到恐慌，反而敏銳地察覺到了自動化算法在動蕩中的商業潛能。

這種在危機中尋找縫隙的本能，深刻地烙印在了DeepSeek的基因里。不同于硅谷推崇的“資源飽和式攻擊”，梁文鋒走的是一條典型的“理工男”路線：死磕算法，壓榨硬件極限。

他在租來的小房子里埋頭鉆研算法的日子，最終化作了幻方量化千億級的管理規模。2016年建立的基于GPU的高頻交易系統，實際上是一次昂貴的“預演”。那是用真金白銀在毫秒級博弈中磨練出來的算力敏感度，這種經驗被他原封不動地移植到了大模型的訓練中。

當DeepSeek在2023年正式用金融賺來的錢反哺科技夢想時，他們的目標從一開始就透著一股精明的瘋狂——用最低的算力，換取最高的智能。

全面開源

這一策略的成效是驚人的，甚至可以說是“反常識”的。以DeepSeekV3為例，它僅用2000張GPU就干出了原本需要1.6萬張GPU才能完成的活。

這不僅僅是數字的游戲，這是對摩爾定律的一次“降維打擊”。對于那些還在瘋狂囤積算力卡的美國科技公司來說，這簡直是個噩夢。因為這意味著大模型對高端硬件的絕對依賴被削弱了。

這種沖擊在2024年5月就已經顯露端倪，當時發布的V2開源模型，將推理成本降至每百萬token僅需1塊錢，是當時GPT-4Turbo成本的七十分之一。國內的字節、騰訊、百度等大廠被迫卷入這場“價格戰”，紛紛降價，行業的游戲規則在毫厘之間被徹底改寫。

更讓競爭對手感到棘手的是，梁文鋒并沒有試圖將這項技術鎖在保險柜里待價而沽。相反，他選擇了一種更具野心的打法——全面開源。2025年2月底，那場轟動業界的“開源周”，梁文鋒將訓練技術的細節如同散發傳單一樣公之于眾。

紐約大學的圖靈獎得主楊立昆（YannLeCun）對此贊不絕口，他一針見血地指出，DeepSeek的成功關鍵在于堅持開源，這證明了AI技術并不存在絕對的、不可逾越的壁壘。加州大學的研究員們更是不得不承認，中國龐大的科技人才庫在如何高效利用有限計算資源方面，似乎找到了一條更為高明的路徑。

這種“廣撒網”的策略，直接帶動了公司估值的飆升。憑著1.05萬億元的估值，DeepSeek一躍成為僅次于字節跳動的中國第二大公司，也是全球第六大初創獨角獸。

但這并不是一條鋪滿鮮花的坦途，在這個極度內卷的賽道上，技術的迭代速度快得驚人，任何瞬間的懈怠都可能導致被反超。

數據的波動最能說明問題：DeepSeekApp的月活數據一度在3月份攀升至1.94億的巔峰，將騰訊元寶、豆包等甩在身后，但在隨后幾個月的新鮮感消退期，月活下滑至1.45億，一度被豆包反超。

這場戰爭還遠未結束，甚至可以說剛剛進入白熱化階段。真正的巨頭們已經從最初的震驚中回過神來，開始揮舞著支票簿進行反撲。

在大模型領域一度“掉隊”的字節跳動，2024年一年就砸下了近800億元研發費用，甚至有證券預測其今年的AI總投入將翻倍至1600億元，其中絕大部分用于購買那些DeepSeek試圖“弱化”的算力卡。大洋彼岸的微軟、谷歌和Meta也不甘示弱，僅一個財季的資本支出合計就達到了780億美元，這是一場金錢與智慧的終極較量。

面對這股反撲的浪潮，梁文鋒似乎早有準備，并沒有選擇坐以待斃，而是拿出了硬實力進行回擊。就在競爭對手試圖用資本淹沒市場的時候，12月1日，兩款新模型DeepSeek-V3.2和DeepSeek-V3.2Speciale正式登場。

前者在性能上直逼GPT-5水平，僅略遜于Gemini-3.0-Pro，而且大幅降低了輸出長度，進一步壓縮了用戶等待時間和計算開銷。后者更是橫掃了IMO、CMO、ICPC等四大頂級數學與編程賽事。

如果說，之前的成功還帶有一絲“突襲”的意味，那么這一輪的技術發布，則是正面戰場的陣地戰。那個曾經被視為“追趕者”的角色，正在用一種近乎殘酷的“全開源、低成本”策略，逼迫整個行業重新思考未來的方向。

結語

正如他在采訪中所透露的那樣，這一切不僅僅是為了商業上的盈利，而是為了走到科技的最前沿，去推動整個生態的發展。在這場從“時運”到“實力”的辯證中，梁文鋒和他的團隊正在用實際行動證明，改變世界的或許不是擁有最多的資源，而是擁有最極致的效率。

那些關于“中國團隊只會追趕”的舊有觀念，在2000張GPU的高效運轉聲中，正在土崩瓦解。

信息源: 投資家：《浙大天才，震驚全球》觀察者網：《DeepSeek-R1開創歷史，梁文鋒論文登上《自然》封面》

#優質圖文扶持計劃#

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.