<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      一文看懂DeepSeek與清北最新論文:劇透V4底層架構(gòu),或改寫大模型推理格局

      0
      分享至



      出品|搜狐科技

      作者鄭松毅

      編輯| 楊 錦

      就在全世界都盯著V4發(fā)布時,DeepSeek先給了波劇透。

      數(shù)小時前,DeepSeek攜手北京大學(xué)、清華大學(xué),共同發(fā)布了一篇足以改寫大模型推理格局的技術(shù)論文,推出了面向大模型智能體的全新推理系統(tǒng)DualPath,瞬間引爆AI圈。


      作為中國大模型產(chǎn)學(xué)研協(xié)同創(chuàng)新的標(biāo)桿之作,這篇論文跳出“拼參數(shù)、堆算力”的老路子,直擊當(dāng)下大模型核心痛點,敘述著中國大模型從“拼能力”到“拼效率”轉(zhuǎn)型的新方向。


      雙路徑架構(gòu)攻I/O瓶頸,解“巧婦難為無米之炊”

      眼下,大模型已邁入智能體時代,它要像人一樣思考、規(guī)劃,但一個長期被忽視的難題,正在制約著它的發(fā)展——GPU算力始終沒能充分發(fā)揮出來,核心問題就是I/O瓶頸在“拖后腿”。

      換言之,今天大模型的痛點,已不是模型不夠聰明,而是跑得不夠快、成本下不來。DualPath的出現(xiàn),就是為了解決這個癥結(jié)。

      很多人會問,什么是“I/O瓶頸”,又怎么拖后腿了?

      這里可以簡單比喻下:如果把大模型推理過程看作是廚子炒菜,GPU的角色就是手藝頂尖、手腳飛快的廚師;顯存/內(nèi)存/網(wǎng)絡(luò)可以看成廚房的通道、傳送帶;模型每生成一句話,要用到的歷史對話緩存(KV-Cache),就是大廚要用到的配菜、調(diào)料、半成品。而I/O,則是把食材從倉庫運到灶臺的全過程——搬運、傳遞、輸送。

      大廚再厲害,配菜送不上來,大廚就只能在灶臺前干等。換言之,GPU再強(qiáng),如果數(shù)據(jù)傳不過來,它就只能空轉(zhuǎn)、浪費等數(shù)據(jù),這就是行業(yè)內(nèi)最致命的“I/O瓶頸”。

      過去幾年,大模型越做越大,用戶越來越多,對話數(shù)據(jù)越來越長,需要搬運的食材——歷史對話緩存(KV-Cache)也就越多。結(jié)果就是傳輸通道越來越擁擠,GPU利用率越來越低,成本越來越高。

      而DeepSeek這次和清北合作提出的 DualPath雙路徑架構(gòu),本質(zhì)就是修了兩條各具功能的專用傳輸通道,解決堵塞問題。

      具體來看,DualPath改變了傳統(tǒng)的存儲至預(yù)填充引擎(Storage-to-Prefill)單路徑加載模式,引入了存儲至解碼引擎(Storage-to-Decode)的第二條路徑。


      傳統(tǒng)路徑下,緩存直接讀入預(yù)填充(PE)。而新路徑下,緩存先讀入解碼(DE)的緩沖池,再通過RDMA傳輸給預(yù)填充(PE)。通過兩條路徑間的動態(tài)選擇,DualPath重新分配了網(wǎng)絡(luò)負(fù)載,緩解了預(yù)填充引擎?zhèn)鹊膸拤毫Α?/p>

      我們可以把預(yù)填充引擎看作是主路徑,把解碼引擎看作是輔助路徑。主路徑負(fù)責(zé)準(zhǔn)備當(dāng)下大廚立刻要用的食材,保證伸手抓的時候就有,不耽誤火候。而輔助路徑負(fù)責(zé)趁不忙時,提前把食材運來備好,不耽誤主通道工作,打好配合。


      性能翻倍,與清北多次聯(lián)手破題

      值得一提的是,這套理論并不只是實驗室故事,而是真的在GPU集群上驗證過了:DualPath將離線推理吞吐量最高提升1.87倍,在線服務(wù)吞吐量平均提升1.96倍,請求承載能力最高提升2.25倍。


      業(yè)內(nèi)觀點認(rèn)為,這些亮眼數(shù)據(jù)的背后,是大模型服務(wù)成本的大幅降低,更是規(guī)模化落地能力的顯著提升。對企業(yè)來說,同樣的算力投入能獲得兩倍的服務(wù)產(chǎn)出,無疑會進(jìn)一步降低AI應(yīng)用門檻。對開發(fā)者來說,此前難以實現(xiàn)的長上下文、多輪交互等功能,如今能穩(wěn)定落地,給智能體的創(chuàng)新應(yīng)用打開了新空間。

      事實上,這已不是三方的首次合作。

      近半年來,DeepSeek已與北大、清華聯(lián)手推出了多項重磅成果:比如ACL 2025最佳論文中提出的原生稀疏注意力(NSA)技術(shù),把長文本處理速度提升了11倍;還有2026年1月發(fā)布的條件記憶(Engram)架構(gòu),通過把“記憶”與“計算”拆分開來,大幅降低了推理成本和內(nèi)存占用。


      V4箭在弦上

      巧合的是,就在這篇論文發(fā)布的同時,業(yè)內(nèi)對DeepSeek V4版本的發(fā)布猜測也達(dá)到了頂峰。

      大家普遍認(rèn)為,這篇DualPath論文絕不是簡單的技術(shù)發(fā)布,而是DeepSeek V4的底層架構(gòu)官宣。

      從目前行業(yè)流傳的消息來看,DeepSeek V4的發(fā)布窗口已經(jīng)鎖定在未來一周,代號為“Sealion-lite”的V4輕量版,已經(jīng)在部分推理服務(wù)商處開展閉門測試,華為等國內(nèi)芯片廠商也提前拿到了模型訪問權(quán)限,完成了國產(chǎn)算力平臺的適配優(yōu)化。

      種種信號表明,V4版本已經(jīng)進(jìn)入了發(fā)布前的最后倒計時。

      關(guān)于DeepSeek V4的核心能力,業(yè)內(nèi)的猜測高度一致,并充滿期待。其中最受關(guān)注的是百萬級上下文窗口——預(yù)計將從V3.2版本的128K tokens躍升至100萬tokens,提升近8倍。相當(dāng)于模型能一次性讀完多部專業(yè)書籍、大型代碼庫,徹底解決了長文本處理的痛點。

      其次是原生多模態(tài)能力,V4預(yù)計將支持文本、圖像等多種格式,從流出的SVG生成示例來看,它在貼合提示詞、形狀準(zhǔn)確性和細(xì)節(jié)豐富度上,都比前代V3.2版本強(qiáng)了不少。

      除此之外,智能體能力也是V4的核心亮點,讓模型能更高效地完成復(fù)雜任務(wù)。更值得一提的是,V4還打破行業(yè)慣例,把訪問權(quán)限優(yōu)先給了國內(nèi)芯片廠商,助力國產(chǎn)化AI生態(tài)的構(gòu)建。

      前兩日,美國AI巨頭Anthropic還在指控包括DeepSeek在內(nèi)的中國AI企業(yè)蒸餾抄襲,呼吁嚴(yán)控高端芯片出口。如今DeepSeek就向外展示了“靠人不如靠自己”的態(tài)度,連外媒都開始擔(dān)憂,英偉達(dá)股價也應(yīng)聲下跌。

      接下來,就期待著新模型登場了。



      運營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      上海曝光特大醫(yī)保騙保案,涉案金額超千萬元

      上海曝光特大醫(yī)保騙保案,涉案金額超千萬元

      健識局
      2026-02-27 19:38:12
      簽約達(dá)成!前快船2米13大中鋒,成功殺回NBA!

      簽約達(dá)成!前快船2米13大中鋒,成功殺回NBA!

      鬼魅突破上籃
      2026-02-28 00:19:57
      做藝人沒有藝德!在上海被抓捕的 4 位明星,你們知道都有誰嗎?

      做藝人沒有藝德!在上海被抓捕的 4 位明星,你們知道都有誰嗎?

      她時尚丫
      2026-02-17 21:56:13
      斯文掃地!北大教授爆粗罵漢服:雜種、畜生,矛頭直指未成年孩子

      斯文掃地!北大教授爆粗罵漢服:雜種、畜生,矛頭直指未成年孩子

      趣味萌寵的日常
      2026-02-28 00:21:40
      痛心!江西跑友劉濤去世,僅51歲,生前堅持晨跑,是3家公司老板

      痛心!江西跑友劉濤去世,僅51歲,生前堅持晨跑,是3家公司老板

      離離言幾許
      2026-02-25 10:43:45
      聯(lián)合國爆發(fā)爭端,凌晨中美大吵一架,美國犯下大錯,局勢已惡化

      聯(lián)合國爆發(fā)爭端,凌晨中美大吵一架,美國犯下大錯,局勢已惡化

      滄海旅行家
      2026-02-28 00:36:17
      《成何體統(tǒng)》王楚然172,關(guān)曉彤172同框秒殺白鹿、趙露思

      《成何體統(tǒng)》王楚然172,關(guān)曉彤172同框秒殺白鹿、趙露思

      湘西二當(dāng)家
      2026-02-25 18:22:09
      免去58歲市公安局副局長職務(wù),同時任命一名新副局長(兼)

      免去58歲市公安局副局長職務(wù),同時任命一名新副局長(兼)

      警界君
      2026-02-27 17:58:10
      恩里克:再戰(zhàn)切爾西?沒復(fù)仇情緒;如果比賽有需要我也可以上

      恩里克:再戰(zhàn)切爾西?沒復(fù)仇情緒;如果比賽有需要我也可以上

      懂球帝
      2026-02-28 02:21:08
      應(yīng)急管理部點名“江蘇響水橋梁垮塌事故”:項目實際由“草臺班子”施工,質(zhì)量難以保證

      應(yīng)急管理部點名“江蘇響水橋梁垮塌事故”:項目實際由“草臺班子”施工,質(zhì)量難以保證

      極目新聞
      2026-02-27 17:14:40
      伊朗總統(tǒng)說伊朗無意發(fā)展核武器!美國總統(tǒng)特朗普多次稱,美國不允許伊朗擁有核武器

      伊朗總統(tǒng)說伊朗無意發(fā)展核武器!美國總統(tǒng)特朗普多次稱,美國不允許伊朗擁有核武器

      每日經(jīng)濟(jì)新聞
      2026-02-27 19:55:21
      奇怪的現(xiàn)象:凡是家里打掃的很干凈的人,都有共同的特點

      奇怪的現(xiàn)象:凡是家里打掃的很干凈的人,都有共同的特點

      木言觀
      2026-02-19 22:58:09
      格拉斯納:去年我們在老特拉福德2-0勝曼聯(lián),留下美好的回憶

      格拉斯納:去年我們在老特拉福德2-0勝曼聯(lián),留下美好的回憶

      懂球帝
      2026-02-28 00:15:12
      林詩棟1-3輸歐洲名將,錯失奪冠良機(jī),何時才能打破男單冠軍荒?

      林詩棟1-3輸歐洲名將,錯失奪冠良機(jī),何時才能打破男單冠軍荒?

      湘楚風(fēng)云
      2026-01-23 17:29:40
      28日大滿貫:國乒7場外戰(zhàn),女單有望包攬4強(qiáng),林詩棟雙線沖冠

      28日大滿貫:國乒7場外戰(zhàn),女單有望包攬4強(qiáng),林詩棟雙線沖冠

      老糿尾聲體育解說
      2026-02-28 00:52:42
      我資助的貧困生考上名校后立馬拉黑我,畢業(yè)時她才發(fā)現(xiàn)自己有多傻

      我資助的貧困生考上名校后立馬拉黑我,畢業(yè)時她才發(fā)現(xiàn)自己有多傻

      黃小乖的日記
      2026-02-27 20:04:25
      一路走好!2026年春晚才過10天,已有4位名人接連去世,令人唏噓

      一路走好!2026年春晚才過10天,已有4位名人接連去世,令人唏噓

      阿訊說天下
      2026-02-26 11:23:19
      特斯拉中國:大量全新 Model 3/Y 現(xiàn)車上架

      特斯拉中國:大量全新 Model 3/Y 現(xiàn)車上架

      新浪財經(jīng)
      2026-02-27 22:31:13
      6月1日起全國執(zhí)行!二次供水不歸物業(yè)管,幾十年扯皮終于畫上句號

      6月1日起全國執(zhí)行!二次供水不歸物業(yè)管,幾十年扯皮終于畫上句號

      老特有話說
      2026-02-26 13:32:14
      杜蘭特37歲了,他還能超科比33643的得分紀(jì)錄嗎?答案不難猜

      杜蘭特37歲了,他還能超科比33643的得分紀(jì)錄嗎?答案不難猜

      大西體育
      2026-02-27 22:30:23
      2026-02-28 02:43:00
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號
      4699文章數(shù) 9180關(guān)注度
      往期回顧 全部

      科技要聞

      狂攬1100億美元!OpenAI再創(chuàng)融資神話

      頭條要聞

      特朗普警告伊朗:“有時候不得不打”

      頭條要聞

      特朗普警告伊朗:“有時候不得不打”

      體育要聞

      一場必須要贏的比賽,男籃何止擊敗了裁判

      娛樂要聞

      郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛

      財經(jīng)要聞

      沈明高提共富建議 百姓持科技股國家兜底

      汽車要聞

      嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

      態(tài)度原創(chuàng)

      藝術(shù)
      本地
      游戲
      教育
      公開課

      藝術(shù)要聞

      紫氣東來,好運一整年!

      本地新聞

      津南好·四時總相宜

      Oi朋友!你聽說過大只切的故事嗎?

      教育要聞

      不好意思,我玩電腦AI已經(jīng)超高段位了!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版