<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      當(dāng)我們談?wù)揇eepSeek時(shí),是在談?wù)撌裁?/h1>
      0
      分享至



      (圖片來源:pixabay)



      連日來,隨著DeepSeek持續(xù)霸榜熱搜,其創(chuàng)始人梁文峰的許多觀點(diǎn)也熱傳于網(wǎng)絡(luò)。

      "中國(guó)AI和美國(guó)有一兩年差距,但真實(shí)的gap是原創(chuàng)和模仿之差"“過去三十多年IT浪潮里,我們基本沒有參與到真正的技術(shù)創(chuàng)新里” "經(jīng)驗(yàn)包袱太重的人,創(chuàng)新動(dòng)力不足”……他的話語(yǔ)樸實(shí)且坦誠(chéng),道理講得很白,卻給人耳目一新之感。這一點(diǎn),與大家在使用DeepSeek時(shí)的感受是相當(dāng)一致的。

      在國(guó)內(nèi)輿論場(chǎng)中,梁文峰本人與DeepSeek是深度捆綁的,有人稱他是人工智能上甘嶺的“黃繼光”,有人說他是中國(guó)的“馬斯克”,但在筆者看來,更重要的或許在于做好DeepSeek與梁文峰思維的解碼,換言之,大家應(yīng)當(dāng)更加清楚地知道,當(dāng)我們?cè)谡務(wù)揇eepSeek時(shí),到底在談?wù)撌裁矗蛘哒f應(yīng)該談?wù)撌裁础?/p>

      其一:突圍,山重水復(fù)疑無(wú)路

      ChatGPT問世以來,全球AI競(jìng)賽正式進(jìn)入“大力出奇跡”時(shí)代。巨參數(shù)、大數(shù)據(jù)、強(qiáng)算力成為大模型研發(fā)的基礎(chǔ),規(guī)模法則(scaling law)被認(rèn)為是智能“涌現(xiàn)”的核心:OpenAI的GPT-4參數(shù)規(guī)模突破1.8萬(wàn)億,訓(xùn)練數(shù)據(jù)集包含13萬(wàn)億token;微軟、谷歌等一眾科技巨頭均斥巨資囤積算力。而在規(guī)模法則的另一面,全球高質(zhì)量文本數(shù)據(jù)迅速枯竭;單次訓(xùn)練成本逐漸失控;美國(guó)對(duì)芯片采取針對(duì)性出口管制,以維護(hù)其算力霸權(quán)及AI技術(shù)優(yōu)勢(shì)。

      當(dāng)美國(guó)科技大廠已投入巨資,構(gòu)建起了一套由他們制定的行業(yè)標(biāo)準(zhǔn)、生存法則時(shí),當(dāng)很多人潛意識(shí)中已默許,AI領(lǐng)域未來發(fā)展的話語(yǔ)權(quán)、主導(dǎo)權(quán)和控制權(quán)正牢牢掌握在西方手中時(shí),來自中國(guó)的DeepSeek卻突然闖了進(jìn)來。

      其用架構(gòu)算法、訓(xùn)練方式、工程優(yōu)化等系統(tǒng)性創(chuàng)新,在千億參數(shù)規(guī)模下展現(xiàn)出與GPT-o1-1217相當(dāng)?shù)耐评砟芰?,以顯著降低的訓(xùn)練成本,走出一條震驚世界的差異化技術(shù)路徑,實(shí)現(xiàn)國(guó)產(chǎn)大模型的突圍。

      正如有論者指出,DeepSeek讓許多人認(rèn)識(shí)到一個(gè)一直存在但被忽視的重要趨勢(shì),那就是中國(guó)在生成式AI領(lǐng)域正在快速追趕美國(guó)。要知道,拜登政府2022年實(shí)施并在此后多次收緊禁止向中國(guó)出售最先進(jìn)芯片及芯片制造設(shè)備的禁令,目的就是限制中國(guó)獲取尖端技術(shù)。DeepSeek團(tuán)隊(duì)正是在美國(guó)AI芯片禁運(yùn)的壓力下,不得不在較低性能的H800 GPU上訓(xùn)練模型。但正是這樣的“降維”,反而推動(dòng)了算法優(yōu)化的突破。

      其二:創(chuàng)新,東風(fēng)夜放花千樹

      DeepSeek的成功,挑戰(zhàn)了AI領(lǐng)域“規(guī)模至上”的傳統(tǒng)思維。那么從技術(shù)角度看,DeepSeek主要?jiǎng)?chuàng)造了哪些核心創(chuàng)新?

      首先是模型架構(gòu)?;旌蠈<夷P停∕oE)通過將模型分成多個(gè)專家,并在每個(gè)特定任務(wù)中只激活少量合適的專家,從而在推理過程中減少參數(shù)量,提升效率。據(jù)透露,GPT-4便采用了MoE框架,而DeepSeek-V3對(duì)MoE框架進(jìn)行了重要?jiǎng)?chuàng)新,新框架包含細(xì)粒度多數(shù)量的專業(yè)專家和更通用的共享專家。

      就MoE框架而言,其面臨的一個(gè)重要難題是如何確定哪個(gè)標(biāo)記(token)會(huì)到達(dá)哪個(gè)專家或子模塊。DeepSeek引入了新的無(wú)損負(fù)載均衡技術(shù)和路由網(wǎng)絡(luò)方法,有效降低了通信開銷,突破了傳統(tǒng)方法增加通信開銷換取高效推理的瓶頸,使得新框架更加穩(wěn)定高效。

      其次是算法突破。多頭潛在注意力機(jī)制(Multi-Head Latent Attention,MLA)是DeepSeek最關(guān)鍵的技術(shù)突破,它顯著降低了模型推理成本。在過去,推理能力最大的限制之一即為加載上下文所需的內(nèi)存: KV緩存是Transformer中的一種內(nèi)存機(jī)制,它將每一步生成的鍵(Key)和值(Value)保存到緩存中,隨著上下文長(zhǎng)度的增加,KV緩存顯著增加。而MLA可將每個(gè)查詢所需的KV緩存降低90%以上。

      第三是訓(xùn)練方式。DeepSeek-R1-Zero首次證明了基于大規(guī)模強(qiáng)化學(xué)習(xí)(RL)與高質(zhì)量合成數(shù)據(jù)(Synthetic Data)結(jié)合的技術(shù)路徑,可在不依賴標(biāo)注數(shù)據(jù)、監(jiān)督微調(diào)(SFT)的情況下,獲得高水平推理能力。在R1-Zero訓(xùn)練中,DeepSeek應(yīng)用組相對(duì)優(yōu)化策略(GRPO)和兩個(gè)簡(jiǎn)單的獎(jiǎng)勵(lì)函數(shù)(回答準(zhǔn)確性和思維過程格式準(zhǔn)確性獎(jiǎng)勵(lì)),使得R1-Zero自發(fā)形成了評(píng)估和優(yōu)化推理的能力,產(chǎn)生令人驚嘆的“頓悟時(shí)刻”(Aha Moment)。

      DeepSeek-R1則是在R1-Zero基礎(chǔ)上,進(jìn)一步利用少量標(biāo)注數(shù)據(jù)監(jiān)督微調(diào)作為冷啟動(dòng),并結(jié)合強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練,顯著提升了模型生成結(jié)果的可讀性及面向開放問題的推理能力。此外,DeepSeek也驗(yàn)證了模型蒸餾技術(shù)在推理能力上的有效性。

      第四是數(shù)據(jù)策略。DeepSeek采用高質(zhì)量合成數(shù)據(jù)的數(shù)據(jù)策略與其訓(xùn)練方式、推理任務(wù)相匹配,極大降低了數(shù)據(jù)成本。“數(shù)據(jù)質(zhì)量?jī)?yōu)先”的核心原則也已逐漸成為領(lǐng)域共識(shí):比數(shù)據(jù)規(guī)模更重要的是數(shù)據(jù)質(zhì)量與知識(shí)密度,相應(yīng)地,DeepSeek采取了拒絕采樣(rejection sampling)等基于驗(yàn)證的數(shù)據(jù)篩選與增強(qiáng)方法。

      最后是工程技術(shù)。除了在架構(gòu)、算法、技術(shù)路徑等方面形成“軟突破”,成功降低訓(xùn)練成本,提升模型效率,DeepSeek團(tuán)隊(duì)強(qiáng)大的工程優(yōu)化能力也同樣令人驚嘆。DeepSeek繞過了英偉達(dá)的通用編程框架CUDA,使用了更底層也更復(fù)雜的PTX(Parallel Thread Execution)匯編語(yǔ)言直接操控GPU指令集,從而實(shí)現(xiàn)芯片算力的效用最大化。這一“硬突破”也一定程度上威脅到英偉達(dá)生態(tài)的護(hù)城河,為未來適配國(guó)產(chǎn)GPU留下巨大的想象空間。

      其三:未來,長(zhǎng)風(fēng)破浪會(huì)有時(shí)

      DeepSeek的橫空出世讓人們重新反思大模型、AGI領(lǐng)域暴力美學(xué)式的思維慣性,也重新關(guān)注算法、架構(gòu)、優(yōu)化等技術(shù)創(chuàng)新的巨大潛力。更重要的是,DeepSeek-R1還可以免費(fèi)使用,而且是開源的。低成本與開放性的強(qiáng)強(qiáng)聯(lián)合可能有助于普及AI技術(shù),讓其他國(guó)家(尤其是美國(guó)以外)的開發(fā)者能夠入局。當(dāng)美國(guó)公司在為試圖進(jìn)入該領(lǐng)域的競(jìng)爭(zhēng)對(duì)手設(shè)置盡可能多的障礙時(shí),中國(guó)卻在開放這項(xiàng)技術(shù),這確實(shí)是一種諷刺。

      曾幾何時(shí),硅谷將AI技術(shù)塑造為一個(gè)珍貴且神奇的成就,將埃隆·馬斯克、薩姆·奧爾特曼等領(lǐng)軍人物描繪成引領(lǐng)人類進(jìn)入新世界的先知。而DeepSeek撕掉了此前籠罩在AI之上的神秘面紗。

      它專注創(chuàng)新,在人工智能全球競(jìng)爭(zhēng)白熱化的關(guān)鍵時(shí)期形成突破,為中國(guó)的智能生態(tài)構(gòu)建奠定關(guān)鍵基礎(chǔ);它擁抱開源,拒絕“Close AI”,為全世界技術(shù)社區(qū)做出堅(jiān)實(shí)貢獻(xiàn)。當(dāng)我們贊嘆DeepSeek產(chǎn)品的巨大成功,也應(yīng)當(dāng)關(guān)注其團(tuán)隊(duì)的系統(tǒng)性創(chuàng)新能力,這既包含多方面的技術(shù)突破,也包括如何聚合“高密度技術(shù)人才”、如何為年輕團(tuán)隊(duì)提供高效的創(chuàng)新土壤。

      最后,也要指出DeepSeek的關(guān)鍵破局點(diǎn),是在保持推理能力相當(dāng)?shù)那闆r下,實(shí)現(xiàn)了訓(xùn)練及計(jì)算成本的極大降低。而從數(shù)學(xué)原理上說,并未跳出大模型浪潮范疇,這也意味著,DeepSeek也無(wú)法解決這一技術(shù)路線下不可解釋、幻覺等內(nèi)在問題。因此,關(guān)于智能“涌現(xiàn)”的根本奧秘,關(guān)于現(xiàn)有模型的智能邊界與潛力,關(guān)于模型的解釋性、泛化性、穩(wěn)定性,尤其是幻覺引發(fā)的認(rèn)知安全風(fēng)險(xiǎn),仍是值得深入探索的重要議題;長(zhǎng)期而言,算力依然是人工智能的基礎(chǔ)設(shè)施,我們也期待芯片領(lǐng)域誕生屬于中國(guó)的DeepSeek時(shí)刻。

      (文/王鑫 北京航空航天大學(xué)人工智能學(xué)院副教授)

      歡迎下載“北京青年報(bào)”客戶端

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      特朗普通告全球,稱美國(guó)將替代聯(lián)合國(guó),認(rèn)為中方在臺(tái)海虛張聲勢(shì)

      特朗普通告全球,稱美國(guó)將替代聯(lián)合國(guó),認(rèn)為中方在臺(tái)海虛張聲勢(shì)

      影孖看世界
      2025-12-30 11:58:09
      軍艦開到家門口,炮口快懟臉上,第一反應(yīng)竟是:有多少錢賠人家!

      軍艦開到家門口,炮口快懟臉上,第一反應(yīng)竟是:有多少錢賠人家!

      百態(tài)人間
      2025-12-17 16:30:23
      火箭三連勝收官升西部第四!KD在場(chǎng)+64太強(qiáng)勢(shì) 37歲已經(jīng)十場(chǎng)30+

      火箭三連勝收官升西部第四!KD在場(chǎng)+64太強(qiáng)勢(shì) 37歲已經(jīng)十場(chǎng)30+

      顏小白的籃球夢(mèng)
      2025-12-30 12:17:29
      臺(tái)媒:臺(tái)中市大規(guī)模停電,引發(fā)民眾恐慌

      臺(tái)媒:臺(tái)中市大規(guī)模停電,引發(fā)民眾恐慌

      參考消息
      2025-12-30 07:53:10
      新華社消息|外交部:任何在臺(tái)灣問題上越線挑釁的惡劣行徑必將遭到中方堅(jiān)決回?fù)?>
    </a>
        <h3>
      <a href=新華社
      2025-12-29 20:13:04
      炎亞綸的150人斬!

      炎亞綸的150人斬!

      八卦瘋叔
      2025-12-30 11:26:51
      知青往事:回城后他娶了高干家的閨女,整整十八年岳母不讓進(jìn)家門

      知青往事:回城后他娶了高干家的閨女,整整十八年岳母不讓進(jìn)家門

      草根情感故事茶社
      2025-12-24 10:21:40
      11天票房沖破59億,奪下全球冠軍,2025年最強(qiáng)電影誕生了

      11天票房沖破59億,奪下全球冠軍,2025年最強(qiáng)電影誕生了

      陳意小可愛
      2025-12-30 09:39:11
      突然一聲爆響!河南一地連夜通報(bào):請(qǐng)廣大市民不必恐慌

      突然一聲爆響!河南一地連夜通報(bào):請(qǐng)廣大市民不必恐慌

      都市快報(bào)橙柿互動(dòng)
      2025-12-30 00:16:06
      52歲何晴腦瘤康復(fù)后素顏報(bào)平安,這張舊照藏著太多堅(jiān)韌!

      52歲何晴腦瘤康復(fù)后素顏報(bào)平安,這張舊照藏著太多堅(jiān)韌!

      無(wú)心小姐姐
      2025-12-27 22:19:42
      別再可憐李詠了!離世7年后醫(yī)生揭秘離世真相,難怪選擇葬身美國(guó)

      別再可憐李詠了!離世7年后醫(yī)生揭秘離世真相,難怪選擇葬身美國(guó)

      LULU生活家
      2025-12-29 18:30:47
      龐家在香港發(fā)布會(huì)上“火力全開”,龐家發(fā)言怒懟:你們也配是記者

      龐家在香港發(fā)布會(huì)上“火力全開”,龐家發(fā)言怒懟:你們也配是記者

      范剬舍長(zhǎng)
      2025-12-23 22:52:07
      火箭126-119送步行者九連敗,杜蘭特30+6+5,小賈21+10

      火箭126-119送步行者九連敗,杜蘭特30+6+5,小賈21+10

      懂球帝
      2025-12-30 11:27:30
      確認(rèn)了:浙江雨夾雪、雪、中到大雪來了!上班時(shí)間有變

      確認(rèn)了:浙江雨夾雪、雪、中到大雪來了!上班時(shí)間有變

      臺(tái)州交通廣播
      2025-12-30 06:07:50
      山西前首富攜妻潛逃英國(guó)!曾騙貸2600多億,超3萬(wàn)老百姓被他坑慘

      山西前首富攜妻潛逃英國(guó)!曾騙貸2600多億,超3萬(wàn)老百姓被他坑慘

      蜉蝣說
      2025-12-18 16:06:23
      C羅:我退役后也許會(huì)重返伯納烏,皇馬是我非常尊重的俱樂部

      C羅:我退役后也許會(huì)重返伯納烏,皇馬是我非常尊重的俱樂部

      懂球帝
      2025-12-30 09:18:10
      誰(shuí)能想到,馬云對(duì)美團(tuán)王興的復(fù)仇,一等就是整整十年

      誰(shuí)能想到,馬云對(duì)美團(tuán)王興的復(fù)仇,一等就是整整十年

      流蘇晚晴
      2025-12-29 18:31:44
      賴清德最新民調(diào)出爐,民眾連續(xù)6個(gè)月對(duì)其不滿意度超過5成

      賴清德最新民調(diào)出爐,民眾連續(xù)6個(gè)月對(duì)其不滿意度超過5成

      海峽導(dǎo)報(bào)社
      2025-12-30 11:52:04
      王陽(yáng):盡管我和蔣欣有過戀情,但余生絕不會(huì)辜負(fù)苦等我6年的高斯

      王陽(yáng):盡管我和蔣欣有過戀情,但余生絕不會(huì)辜負(fù)苦等我6年的高斯

      小熊侃史
      2025-12-20 10:55:51
      湖人大勝國(guó)王!36歲德羅贊和41歲的詹姆斯已根本不在一個(gè)級(jí)別!

      湖人大勝國(guó)王!36歲德羅贊和41歲的詹姆斯已根本不在一個(gè)級(jí)別!

      田先生籃球
      2025-12-29 13:48:47
      2025-12-30 12:44:49

      團(tuán)結(jié)湖參考 incentive-icons
      團(tuán)結(jié)湖參考
      國(guó)內(nèi)頂尖的時(shí)政新聞評(píng)論
      916文章數(shù) 57409關(guān)注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨(dú)角獸

      頭條要聞

      鄭麗文盼明年出訪北京與華盛頓 將"先去北京"列為優(yōu)先

      頭條要聞

      鄭麗文盼明年出訪北京與華盛頓 將"先去北京"列為優(yōu)先

      體育要聞

      這個(gè)59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰官宣文案爭(zhēng)議!女方名字都不提

      財(cái)經(jīng)要聞

      朱光耀:美關(guān)稅政策正使WTO名存實(shí)亡

      汽車要聞

      標(biāo)配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態(tài)度原創(chuàng)

      家居
      游戲
      教育
      親子
      軍事航空

      家居要聞

      當(dāng)歸之宅 三胎圓滿居所

      曝次世代主機(jī)或推遲發(fā)售!內(nèi)存漲得實(shí)在太兇了

      教育要聞

      娃們的好日子在后頭,前提是別卷廢了

      親子要聞

      后續(xù)!3歲“熊孩子”頭卡石像懷中,家長(zhǎng)回應(yīng)!評(píng)論區(qū)笑不活了!

      軍事要聞

      福建海警艦艇與臺(tái)海巡船對(duì)峙航行

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产一級A片免费看| 五月丁香六月综合缴情在线 | 国产精品又黄又爽又色无遮挡| 日韩精品人妻一区二区中文八零网| 中文字幕亚洲精品| 1769国内精品视频在线播放| 色午夜一av男人的天堂| 日韩乱码人妻无码系列中文字幕| 中文字幕少妇人妻| 久久草视频在线| 黑人变态另类videos| 欧美日本在线| 99精品久久久久久久婷婷| 精品人妻无码中文内容| 久久发布国产伦子伦精品| 伊人精品成人久久综合97| 风流少妇又紧又爽又丰满| 先锋影音av最新资源| 国产福利萌白酱在线观看视频| 3751色视频| 国产av福利| 3p露脸在线播放| 精品尤物TV福利院在线网站| 国模欢欢炮交啪啪150| 久久久综合九色合综| 综合一区二区 | 国产女同疯狂作爱系列| 亚洲电影在线观看| 91丨九色丨人妻丨白浆| 亚州色综合| 亚卅精品| 久久精品| 牛牛AV| 大香伊蕉在人线国产免费| 免费视频爱爱太爽了激情| 国产后入又长又硬| 国产又大又硬又粗| 狠狠综合久久久久综合网址 | 摸丰满大乳奶水www免费| 人妻久久精品天天中文字幕| 泽库县|