![]()
這幾天,DeepSeek將在春節(jié)前推出新一代旗艦AI模型的消息,刷屏了。
其實(shí)這事兒爆料非常早,開年就有風(fēng)聲,1月9日英國“路透社”還專門做了報(bào)道。
為啥最近才發(fā)酵?主要DeepSeek最新發(fā)布的FlashMLA代碼里,出現(xiàn)了新模型的架構(gòu),相當(dāng)于官方實(shí)錘。
這個(gè)時(shí)間點(diǎn)挺微妙的。
記得去年,也是1月20日,DeepSeek帶著R1橫空出世,那時(shí)候?yàn)榱四茼槙秤蒙纤恢卸嗌偃朔榱俗圆渴鸾坛蹋€有人上淘寶花錢買所謂的“滿血版”應(yīng)用。
幾乎是瞬間,DeepSeek就屠榜了各類應(yīng)用下載榜單,而且是長時(shí)間霸榜,無人可望其項(xiàng)背。
那時(shí)候,文心一言和豆包打得正歡,大有兩分天下之勢,而DeepSeek的出現(xiàn),則直接殺死了比賽。甚至,元寶僅靠著接入DeepSeek的操作,就硬生生地?cái)D上了國內(nèi)AI競爭的牌桌。
有人給這場顛覆起了一個(gè)名字叫:
DeepSeek時(shí)刻。
一年后的今天,在一部分人的眼里,DeepSeek似乎已經(jīng)掉隊(duì)了。
它不追熱點(diǎn),不搞宣發(fā),雖然有幾次更新,但皆不如R1震撼,在一眾恨不得把全能、多模態(tài)、AI搜索寫在臉上的競品里,DeepSeek顯得有些格格不入。
如今的App Store的排行榜,免費(fèi)應(yīng)用下載榜的前三名,已經(jīng)被豆包、千問、元寶牢牢占據(jù),而DeepSeek排在:
第七。
但這正是最有意思的地方。
即便在今天,國外一眾AI巨頭聊起中國AI的競爭力時(shí),提到最多的名字,依舊是DeepSeek。
開年,微軟發(fā)布了《2025 全球 AI 普及報(bào)告》,將 DeepSeek 的崛起列為 2025 年“最意想不到的發(fā)展之一”。
目前,DeepSeek相關(guān)的模型調(diào)用,仍是多數(shù)平臺的首選。
在國外,出現(xiàn)了反向“套殼”,許多美國AI初創(chuàng)公司,已經(jīng)默認(rèn)使用DeepSeek模型作為基座,比如Cogito v2.1,其實(shí)就是V3的微調(diào)版。
歐洲科技界甚至還掀起了“打造歐洲版 DeepSeek”的競賽。
問題來了,為什么?
因?yàn)镈eepSeek直接掀了桌子。
在硅谷的邏輯里,要做出頂級模型,得燒掉一個(gè)中等國家的GDP。馬斯克的xAI前幾天剛剛?cè)诹?00億美元,用來維系昂貴的算力競賽。
但在DeepSeek這里,邏輯完全變了。
根據(jù)技術(shù)社區(qū)和公開報(bào)告的測算,DeepSeek-V3的研發(fā)與訓(xùn)練成本僅在600萬美元左右。對比之下,像Llama 3或GPT-4這類同量級的美國模型,其訓(xùn)練開銷保守估計(jì)都在十倍以上。
相當(dāng)于用攛摩托車的錢,造了輛頂級超跑。
珠玉在前,這讓過去那些拿著PPT,去華爾街動(dòng)輒融資數(shù)億美金的AI大廠們,怎么辦?
這種邏輯的崩塌是致命的。
同時(shí),這種成本結(jié)構(gòu)上的代差,直接導(dǎo)致了API端的價(jià)格血戰(zhàn),當(dāng)美國頂級模型的百萬Token定價(jià)還在幾美金徘徊時(shí),DeepSeek直接給出了0.1到0.2美元的“地價(jià)”。
在老外眼里,DeepSeek就是AI版的拼多多,關(guān)鍵這個(gè)拼多多,還能給出京東的品質(zhì)。
低價(jià)兼具高效。
數(shù)據(jù)顯示,在所有發(fā)布不滿一年的新模型中,中國模型的總下載量已經(jīng)超越了美國。
在那些被西方巨頭忽略的全球南方市場,開發(fā)者正成群結(jié)隊(duì)投向DeepSeek的懷抱。
數(shù)據(jù)顯示,在非洲,其使用率是其他地區(qū)的2到4倍;在白俄羅斯和古巴,其市場份額分別高達(dá)56%和49%
在被西方忽略的角落,DeepSeek 幾乎成了唯一選擇。微軟總裁布拉德·史密斯直言:
在非西方國家,中國DeepSeek已經(jīng)贏了。
這是農(nóng)村包圍城市的勝利。
這種滲透,也為中國AI爭取到了最寶貴的發(fā)展時(shí)間。
關(guān)鍵,還在于DeepSeek的“沉默”。
平時(shí)一聲不吭,沒事就甩出兩篇頂級學(xué)術(shù)論文,不玩騷操作,基本功扎實(shí),還有創(chuàng)新能力,老外最怕這種。
什么下載榜單排名,人家根本不care,就是埋頭搞技術(shù)。
為啥,不缺票子。
在這個(gè)所有人都急著向投資人交作業(yè)、急著變現(xiàn)的時(shí)代,DeepSeek至今保持著零外部融資的紀(jì)錄,它的母公司幻方量化,大A的股東朋友們都熟。
2025年幻方量化的收入超過7億美元,也就是約50億元人民幣。
創(chuàng)始人梁文鋒直接用這筆錢供養(yǎng)AI夢。
前段時(shí)間,DeepSeek又開始悄悄發(fā)論文了,還把之前的R1論文更新了,一年里所有的訓(xùn)練細(xì)節(jié)、失敗嘗試,甚至那些不為人知的坑,全部補(bǔ)齊。
兩篇新論文,一篇講最新的模型訓(xùn)練方法,另一篇,探究如何用便宜內(nèi)存,取代昂貴的HBM。
這一次,它想顛覆現(xiàn)在大模型訓(xùn)練的底層基石。
這才是DeepSeek的底色,在所有人都在卷資源的時(shí)候,它在卷效率;在所有人都在追逐商業(yè)化的時(shí)候,它在追逐技術(shù)極限。
當(dāng)然,DeepSeek的模式可能很難復(fù)制,畢竟既是創(chuàng)始人團(tuán)隊(duì)、技術(shù)團(tuán)隊(duì),又是金主爸爸的情況太少了,但這種愿意沉淀下來的心態(tài),一定是未來AI發(fā)展需要的。
大家都在討論,中國AI的下個(gè)“DeepSeek時(shí)刻”會(huì)出現(xiàn)在誰的身上?
也許,還是DeepSeek。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.