<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      梁文鋒登《自然》封面,曝DeepSeek增量訓(xùn)練成本僅29.4萬美元!

      0
      分享至



      文 / 汪淼

      美編 / 顧青青

      出品 / 網(wǎng)界

      中國團(tuán)隊登上了《自然》封面。

      9月18日,由DeepSeek團(tuán)隊研發(fā)、梁文鋒擔(dān)任通訊作者的DeepSeek-R1推理模型研究論文登上《自然》封面。

      但比“登刊”更狠的是,他們干脆自曝家底,DeepSeek-R1的增量訓(xùn)練成本,只要29.4萬美元



      要知道,過去OpenAI、谷歌練個大模型,動不動燒掉幾千萬美元。而DeepSeek只用512張英偉達(dá)H800顯卡、耗時80小時,就完成了核心訓(xùn)練。這筆賬,相當(dāng)于用買一輛跑車的錢,干出了別人蓋工廠的活。

      更關(guān)鍵的是,《自然》親自下場蓋章,在評論報道文章中用了“里程碑式論文揭示DeepSeekAI模型的秘密”、“創(chuàng)造歷史”等詞匯表達(dá)了對DeepSeek贊賞和肯定。這幾乎是在打臉整個行業(yè)長期以來的“黑箱操作”。

      01

      29.4萬美元背后

      當(dāng)DeepSeek在論文里寫下“29.4萬美元”這個數(shù)字時,很多人第一反應(yīng)是:是不是少寫了個零?

      但數(shù)據(jù)是實的:512張H800顯卡、80小時訓(xùn)練、每GPU小時租賃價2美元。而且,這還只是增量成本,是指在已經(jīng)花掉600萬美元開發(fā)的基座模型(DeepSeek-V3Base)之上,做強(qiáng)化學(xué)習(xí)的開銷。

      為什么這么便宜? 關(guān)鍵是他們用了“純強(qiáng)化學(xué)習(xí)”框架(GRPO)。簡單說,就是只告訴模型“答案對不對”,而不教它“步驟該怎么寫”。模型自己琢磨怎么解題,答對了給獎勵,答錯了就調(diào)整。這種“放養(yǎng)式訓(xùn)練”反而逼出了它的推理能力。



      但便宜也引來質(zhì)疑。年初就有人猜:是不是偷偷用了OpenAI的GPT-4生成數(shù)據(jù)來做蒸餾? 否則怎么可能這么低成本達(dá)到高性能?

      這次《自然》論文里,DeepSeek直接回應(yīng):訓(xùn)練數(shù)據(jù)全來自普通網(wǎng)頁和電子書,雖然網(wǎng)上可能混了GPT-4生成的內(nèi)容,但“絕非故意加入”。他們還補(bǔ)充了去污染流程,光數(shù)學(xué)題就刪了600萬條可能泄露測試答案的數(shù)據(jù)。

      02

      《自然》為什么破例?

      AI論文登《自然》不稀奇,但AlphaGo、AlphaFold都是首發(fā)。而DeepSeek-R1的論文1月就發(fā)在arXiv上,現(xiàn)在卻還能上封面,《自然》甚至為它配發(fā)社論,這幾乎是從未有過的待遇。

      原因很簡單:它是第一個愿意被“扒光”的大模型。8位評審專家提了上百個問題,從“數(shù)據(jù)是否污染”到“推理步驟是不是瞎編的”,甚至摳到單詞單復(fù)數(shù)用法。DeepSeek團(tuán)隊寫了64頁回復(fù),幾乎等于重寫半篇論文。



      比如評審問:“你說模型開源了,但‘開源’定義模糊,到底開了多少?”團(tuán)隊立刻補(bǔ)上數(shù)據(jù)鏈接和授權(quán)細(xì)節(jié)。

      還有人擔(dān)心:“模型會不會為了拿獎勵亂寫步驟?” 他們馬上加實驗證明“步驟與答案的一致性”。

      這種透明,戳中了AI行業(yè)的痛點。過去大模型廠商總說自己“遙遙領(lǐng)先”,但測試數(shù)據(jù)不公開、訓(xùn)練方法遮遮掩掩。《自然》社論說得直接:AI宣傳未經(jīng)證實,可能對社會帶來真實風(fēng)險。

      而DeepSeek把代碼、數(shù)據(jù)、訓(xùn)練日志全攤開,等于告訴行業(yè):以后想讓人信你,先學(xué)我“曬數(shù)據(jù)”。

      03

      國產(chǎn)AI芯片的機(jī)會來了?

      29.4萬美元的成本,不僅打了歐美巨頭的臉,還可能給國產(chǎn)芯片撕開一道口子。DeepSeek在論文里沒提任何芯片公司,但明眼人都能算賬:如果訓(xùn)練成本降到原來的十分之一,那是不是用性價比更高的國產(chǎn)芯片也能跑?

      華為昇騰、寒武紀(jì)這些企業(yè)一直被卡在“生態(tài)不足”上,客戶嫌性能不夠穩(wěn),不敢大規(guī)模用。但如果算法能優(yōu)化到DeepSeek這個程度,硬件壓力會小很多。



      DeepSeek創(chuàng)始人梁文鋒

      事實上,華為和浙大最近已經(jīng)聯(lián)合發(fā)了基于昇騰芯片的DeepSeek-R1-Safe模型,雖然這是另一個項目,但證明了一件事:國產(chǎn)芯片能扛住千億級大模型訓(xùn)練。

      不過業(yè)內(nèi)人也提醒:這還只是“可能”,不是“必然”。國產(chǎn)芯片真要接住這波機(jī)會,還得在軟件生態(tài)和穩(wěn)定性上下硬功夫。

      總結(jié)

      開放、透明才是AI的未來

      DeepSeek這次登上《自然》封面,不只是一個人的成功,也不只是一個公司的成功。它代表中國AI行業(yè)真正走到了世界前沿。

      DeepSeek也證明了三件事:第一,大模型不一定靠燒錢,算法優(yōu)化能大幅降低成本;第二,AI行業(yè)不能再閉門吹牛,必須接受同行評審的檢驗;第三,中國團(tuán)隊有能力從技術(shù)追隨者變成規(guī)則制定者。

      但DeepSeek的價值不止于“被膜拜”,《人民日報》說得好:“它的最大價值是被超越。”

      如果后續(xù)國產(chǎn)模型都能用更低成本、更透明的方式練出來,如果國產(chǎn)芯片能借此打開市場,如果AI研發(fā)從此告別“黑箱”走向開放,那今天這篇論文,才會真正變成中國AI的轉(zhuǎn)折點。

      畢竟,梁文鋒自己說過:“中國AI不能永遠(yuǎn)做跟隨者。”現(xiàn)在,他們真的走到了前沿。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      最振聾發(fā)聵的演講:普京的貼身男仆

      最振聾發(fā)聵的演講:普京的貼身男仆

      西樓飲月
      2025-12-17 23:25:23
      越南工廠連夜拆生產(chǎn)線!只因中國電價便宜到他們不敢報價

      越南工廠連夜拆生產(chǎn)線!只因中國電價便宜到他們不敢報價

      潮鹿逐夢
      2025-12-17 14:33:19
      烏克蘭再攻入俄羅斯本土別爾哥羅德!摧毀兩套S400

      烏克蘭再攻入俄羅斯本土別爾哥羅德!摧毀兩套S400

      項鵬飛
      2025-12-17 17:21:51
      純電生死戰(zhàn),打掉理想千億市值

      純電生死戰(zhàn),打掉理想千億市值

      市值榜
      2025-12-16 13:11:59
      海南封關(guān)動了誰的奶酪?答案顯而易見:新加坡為代表的傳統(tǒng)中轉(zhuǎn)港

      海南封關(guān)動了誰的奶酪?答案顯而易見:新加坡為代表的傳統(tǒng)中轉(zhuǎn)港

      知法而形
      2025-12-17 09:45:58
      住建部部長倪虹最新署名文章:推動房地產(chǎn)高質(zhì)量發(fā)展

      住建部部長倪虹最新署名文章:推動房地產(chǎn)高質(zhì)量發(fā)展

      新京報政事兒
      2025-12-16 09:22:26
      芬蘭總理正式向中韓日民眾道歉:“種族主義和歧視在芬蘭沒有立足之地”

      芬蘭總理正式向中韓日民眾道歉:“種族主義和歧視在芬蘭沒有立足之地”

      環(huán)球網(wǎng)資訊
      2025-12-17 22:36:37
      一夜之間有關(guān)大師的文章正在被全網(wǎng)刪除,答案或許就在這里!

      一夜之間有關(guān)大師的文章正在被全網(wǎng)刪除,答案或許就在這里!

      清哲木觀察
      2025-12-17 10:59:57
      小米、華為鴻蒙智行、理想等先后報警,煙臺公安:打掉一個炒作新能源汽車負(fù)面信息團(tuán)伙

      小米、華為鴻蒙智行、理想等先后報警,煙臺公安:打掉一個炒作新能源汽車負(fù)面信息團(tuán)伙

      河南交通廣播1041
      2025-12-17 21:20:08
      越扒瓜越大!女教師跳樓再添猛料,原來不止被父母逼婚這么簡單

      越扒瓜越大!女教師跳樓再添猛料,原來不止被父母逼婚這么簡單

      奇思妙想草葉君
      2025-12-17 23:52:42
      國籍爭議不到1年,人民日報公開點名谷愛凌,鄧亞萍的話有人信了

      國籍爭議不到1年,人民日報公開點名谷愛凌,鄧亞萍的話有人信了

      法老不說教
      2025-12-17 16:27:33
      超級“大空頭”:熊市警告!

      超級“大空頭”:熊市警告!

      中國基金報
      2025-12-17 17:31:41
      文班亞馬賽后鼻子都哭紅了!美記曝他祖母去世 低迷真因找到了?

      文班亞馬賽后鼻子都哭紅了!美記曝他祖母去世 低迷真因找到了?

      顏小白的籃球夢
      2025-12-17 14:58:47
      大連地鐵領(lǐng)導(dǎo)帶頭“工資緩發(fā)”:月薪高于4000的按4000元發(fā)

      大連地鐵領(lǐng)導(dǎo)帶頭“工資緩發(fā)”:月薪高于4000的按4000元發(fā)

      六子吃涼粉
      2025-12-17 16:53:42
      海南封關(guān),不單是為再建一個香港,關(guān)鍵是對美國制造業(yè)釜底抽薪

      海南封關(guān),不單是為再建一個香港,關(guān)鍵是對美國制造業(yè)釜底抽薪

      林小明商業(yè)評說
      2025-12-17 12:45:12
      禁開燃油車接送學(xué)生?河南一地學(xué)校通知惹眾議,官方回應(yīng)遭質(zhì)疑

      禁開燃油車接送學(xué)生?河南一地學(xué)校通知惹眾議,官方回應(yīng)遭質(zhì)疑

      Mr王的飯后茶
      2025-12-17 20:38:28
      汪蘇瀧已兒女雙全?最新回應(yīng)

      汪蘇瀧已兒女雙全?最新回應(yīng)

      臺州交通廣播
      2025-12-17 23:12:17
      河南美女“大晨”去世,年僅28歲,日常開奧迪,一口能喝三兩白酒

      河南美女“大晨”去世,年僅28歲,日常開奧迪,一口能喝三兩白酒

      阿纂看事
      2025-12-17 09:32:11
      特朗普宣布馬杜羅政府為“外國恐怖組織”:封鎖所有進(jìn)出委內(nèi)瑞拉油輪

      特朗普宣布馬杜羅政府為“外國恐怖組織”:封鎖所有進(jìn)出委內(nèi)瑞拉油輪

      可達(dá)鴨面面觀
      2025-12-17 11:54:07
      31省份出生人口數(shù)量一覽,最能生娃省份排名來了

      31省份出生人口數(shù)量一覽,最能生娃省份排名來了

      第一財經(jīng)資訊
      2025-12-17 16:58:59
      2025-12-18 08:00:49
      網(wǎng)界 incentive-icons
      網(wǎng)界
      科技互聯(lián)網(wǎng)行業(yè)深度媒體。
      268文章數(shù) 9關(guān)注度
      往期回顧 全部

      科技要聞

      Gemini3 Flash來了:性能不輸Pro 成本僅1/4

      頭條要聞

      馬克龍發(fā)文:歐盟必須對中國開放 但有個前提

      頭條要聞

      馬克龍發(fā)文:歐盟必須對中國開放 但有個前提

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝?zé)岵〗愕軕僬嬲劻耍浚浚?/h3>

      財經(jīng)要聞

      重大改革,身關(guān)14億人的政策徹底變了!

      汽車要聞

      一車多動力+雙姿態(tài) 長城歐拉5上市 限時9.18萬元起

      態(tài)度原創(chuàng)

      教育
      房產(chǎn)
      旅游
      親子
      時尚

      教育要聞

      影響成績好壞的因素都有哪些?

      房產(chǎn)要聞

      封關(guān)前夕!豪庭銘苑超前交付,敬呈海口生活新范本

      旅游要聞

      嘿重慶丨去麻花博物館,解鎖美食奇遇

      親子要聞

      近視風(fēng)險可預(yù)測,首個兒童“遠(yuǎn)視儲備”國家標(biāo)準(zhǔn)今在滬發(fā)布

      你算老幾?我算老己!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久www免费人成_网站| 国产亚洲精品??码| 国内精品久久久久久无码不卡| 精品成人中文无码专区| 国产乱子伦日B视频| 中国极品少妇xxxxx| 南昌县| 99热久久这里只有精品| 中国极品少妇XXXXX| 亚洲精品久久久中文字幕痴女| 亚洲国产精品自产在线播放| 合肥市| 91色在线视频| 超碰人人澡| 欧美精品亚洲精品日韩专 | 亚洲综合无码一区二区三区 | 99re最新6| a片入口| 久久婷婷五月综合| 激情影院内射美女| 2014AV天堂网| 亚洲爆乳精品无码一区二区| 曲阳县| 3P免费视频| 欧美成人www免费全部网站| 1769国内精品视频在线播放| 亚洲欧美一区二区三区在线| 欧美丝袜另类| 国产精成人| 欧美色欧美亚洲高清在线观看| 成人无码av一区二区| 欧州人妻天天躁Av| 久久不卡精品| 亚洲国产精品特色大片观看完整版| xxx综合网| 日韩无码毛片| 少妇无码av无码一区| 国产在线精品成人一区二区| 大足县| 青青草99| 亚洲高清中文字幕|