<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      2025年黑馬:擴(kuò)散語(yǔ)言模型(DLM)?跟傳統(tǒng)大語(yǔ)言模型相比有什么優(yōu)勢(shì)?

      0
      分享至

      本文參考LLaDA:Large Language Diffusion Models

      這個(gè)圖可以很輕松的讓沒(méi)有任何基礎(chǔ)的人看懂DLM的工作原理,它會(huì)根據(jù)問(wèn)題直接生成一個(gè)回答草稿,然后一次次的修改和潤(rùn)色草稿,最終輸出回答。

      Prompt:Explain what artificial intelligence is.


      來(lái)源:https://ml-gsai.github.io/LLaDA-demo/

      而傳統(tǒng)的大模型是一個(gè)字一個(gè)字的吐,比如我問(wèn)DeepSeek,跟上面同樣的問(wèn)題,它的回答模式就是線性的,下一個(gè)字的輸出取決于前面的內(nèi)容,跟后面的內(nèi)容沒(méi)有關(guān)系。

      這個(gè)就是現(xiàn)在最為主流的大模型生成原理,autoregressive modeling (ARM),它的核心公式就是下面,就是根據(jù)前面的所有內(nèi)容預(yù)測(cè)下個(gè)字。


      我在介紹ChatGPT原理的時(shí)候提到過(guò)(從deepseek書里面找)。

      而DLM(Diffusion Large language model)走的是非常不一樣,但是又比較符合人類直覺的路子。

      就比如說(shuō)高考作文題要求寫一篇不少于800字的議論文,“AI的出現(xiàn)給人類帶來(lái)了什么改變?”

      傳統(tǒng)的LLM會(huì)一個(gè)字一個(gè)字的往外蹦,也就是線性生成過(guò)程。

      就比如這個(gè)生成了一句話。


      下一時(shí)刻它生成的就只有一個(gè)字,不多不少,就只多一個(gè)字。


      你可以觀察任何一個(gè)傳統(tǒng)的大模型,DeepSeek,ChatGPT,Qwen,Gemini等等,都是這樣的,跳不出這個(gè)邏輯,因?yàn)樗牡讓釉O(shè)計(jì)就是一個(gè)字一個(gè)字的往外吐。


      而DLM則是完全不同的邏輯,它是直接生成一篇800字的“文章”,為什么要加引號(hào),是因?yàn)檫@個(gè)最初生成的“文章”很有可能狗屁不通,壓根不能算做文章。

      但是它快呀,你別管它能不能讀,反正快是肯定的。

      并且它有獨(dú)特的更新機(jī)制,就像下面的這張圖,它會(huì)一輪輪的迭代更新自己的內(nèi)容,你看當(dāng)前時(shí)刻可能只確定了一部分的詞匯(紅色),但是在下一時(shí)刻,可能就有更多的內(nèi)容被確定了出來(lái)(綠色)。


      多輪迭代之后,就可以實(shí)驗(yàn)整體性的優(yōu)化,最后實(shí)現(xiàn)跟傳統(tǒng)大模型類似的結(jié)果,你像這個(gè)領(lǐng)域的經(jīng)典工作,LLaDA,在同等模型大小的前提下,在大多數(shù)的任務(wù)上表現(xiàn)并不比其他的模型差多少。


      從結(jié)果為導(dǎo)向來(lái)看,這也是DLM為什么會(huì)吸引關(guān)注的主要原因,因?yàn)樗娴目欤瑐鹘y(tǒng)大模型生成速度再快,也得一個(gè)字一個(gè)字來(lái)。

      有些工作雖然在做next two tokens(預(yù)測(cè)下兩個(gè)字符),甚至更多的字符,但是進(jìn)展非常緩慢,并且從直覺來(lái)看,DLM明顯要比傳統(tǒng)大模型更具備可擴(kuò)展性。

      就跟我們寫作文的時(shí)候,很少時(shí)候是一個(gè)字一個(gè)字的往出蹦想法,而是總體上有個(gè)考量,然后甚至?xí)趲讉€(gè)部分想幾個(gè)金句出來(lái),只不過(guò)在最后執(zhí)行的時(shí)候是一個(gè)字一個(gè)字的寫。

      油畫的創(chuàng)作過(guò)程就比較類似,先來(lái)一個(gè)非常粗略的草稿,然后一層層的上顏色,一次次的涂個(gè)幾層幾十層都不是什么稀罕事。

      其實(shí)這個(gè)正好暗合了DLM中D這個(gè)字母所代表的技術(shù),也就是Diffusion,這個(gè)技術(shù)原本是應(yīng)用在圖像生成(Image generation)上面的,可以說(shuō)現(xiàn)在絕大多數(shù)的圖像以及視頻生成都是基于這個(gè)技術(shù),比如OpenAI的Sora,阿里的Wan通義萬(wàn)相等。

      簡(jiǎn)單來(lái)說(shuō),就是生成一堆亂七八糟的噪音,然后讓AI學(xué)習(xí)怎么從噪音轉(zhuǎn)換到想要的圖片或者視頻。


      DLM只不過(guò)是把脫胎于圖像生成的技術(shù)應(yīng)用到了文字生成,所以這也是很多技術(shù)到了最后都會(huì)兼容的主要原因,單一技術(shù)總會(huì)存在這樣那樣的限制,而取眾家之長(zhǎng)則是必然要走的路。

      DLM的核心技術(shù)技術(shù)其實(shí)原理上很直觀,不同于LLM的next token prediction,它做的是mask predictor。


      Next token prediction我們之前講過(guò)了,那就是根據(jù)現(xiàn)有的句子,預(yù)測(cè)下一個(gè)詞,

      Mask predictor類似,就是隨機(jī)的把一段話的部分內(nèi)容“掩蓋”住,這就是Mask的來(lái)源,被蓋住的內(nèi)容就叫掩碼(masked token)。

      比如說(shuō)在最開始訓(xùn)練的時(shí)候,我們提供了一個(gè)數(shù)據(jù),下面這個(gè)基本上大家都知道。


      如果是LLM學(xué)習(xí)的話,它在知道“世上無(wú)”這三個(gè)字之后,基本上可以穩(wěn)定輸出后面的所有內(nèi)容,它是線性的。

      而DLM不太一樣,它會(huì)隨機(jī)“掩蓋”幾個(gè)字,就比如說(shuō)這樣的,然后讓大模型去學(xué)習(xí)怎么去填空。


      它可能會(huì)這么填,也可能有其他的填法。


      但是在一輪輪的訓(xùn)練,迭代,它也能學(xué)會(huì)這種填空的方法。

      正好契合了LLaDA的流程,總體上就是隨機(jī)掩蓋一部分字符,然后去預(yù)測(cè)這些內(nèi)容。


      最后達(dá)到極致,就是直接輸出要求的所有內(nèi)容,只不過(guò)是以隨機(jī)的字符輸出,然后在一輪輪的迭代下,生成最終需要的文章。

      這篇文章的這個(gè)例子很直觀,用戶了提問(wèn)了一個(gè)簡(jiǎn)單的數(shù)學(xué)題:

      Lily can run 12 kilometers per hour for 4 hours. After that, she runs 6 kilometers per hour. How many kilometers can she run in 8 hours?

      LLaDA在生成回答的時(shí)候,顏色深的部分是后面確定的,顏色淺的部分時(shí)早些時(shí)候確定的。

      可以看到非關(guān)鍵信息比如人名Lily,量詞hours,很早就確定了下來(lái)。而比較關(guān)鍵的數(shù)字,特別是4這個(gè)數(shù)字,以及涉及到運(yùn)算和邏輯的部分,都是在后面確定的。


      也可以從這個(gè)案例中看到,DLM在生成內(nèi)容的時(shí)候,在遵循一定的主次關(guān)系。

      還有更多的案例,可以在論文的附錄appendix里找到。


      總的來(lái)說(shuō),這是一項(xiàng)非常有前景的技術(shù),只不過(guò)相比起只預(yù)測(cè)下一個(gè)字符來(lái)說(shuō),技術(shù)難度要更高一些;但從長(zhǎng)遠(yuǎn)來(lái)說(shuō),潛力不小,特別是Google也在下場(chǎng)做這件事。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      人口告別世界第一?二孩催生無(wú)效后,國(guó)家終于向住房出手了

      人口告別世界第一?二孩催生無(wú)效后,國(guó)家終于向住房出手了

      春秋論娛
      2025-12-25 07:11:24
      F-16擊落全部34枚導(dǎo)彈,“匕首”沒(méi)擊中目標(biāo)!確認(rèn)犧牲英雄身份

      F-16擊落全部34枚導(dǎo)彈,“匕首”沒(méi)擊中目標(biāo)!確認(rèn)犧牲英雄身份

      鷹眼Defence
      2025-12-24 16:17:27
      彈劾賴清德拉長(zhǎng)戰(zhàn)線,若能在縣市長(zhǎng)選舉中重創(chuàng)民進(jìn)黨也是大成功

      彈劾賴清德拉長(zhǎng)戰(zhàn)線,若能在縣市長(zhǎng)選舉中重創(chuàng)民進(jìn)黨也是大成功

      海峽導(dǎo)報(bào)社
      2025-12-27 08:08:08
      中國(guó)是如何擁有殲20的?美國(guó)五角大樓:中國(guó)瞞了全世界!

      中國(guó)是如何擁有殲20的?美國(guó)五角大樓:中國(guó)瞞了全世界!

      老澽爆笑大聰明
      2025-12-27 17:08:01
      10年跟蹤100多個(gè)孩子, 杜克教授發(fā)現(xiàn):照這個(gè)趨勢(shì), 滑落的中產(chǎn)只會(huì)越來(lái)越多

      10年跟蹤100多個(gè)孩子, 杜克教授發(fā)現(xiàn):照這個(gè)趨勢(shì), 滑落的中產(chǎn)只會(huì)越來(lái)越多

      二胎媽媽圈
      2025-12-25 22:14:35
      聯(lián)盟倒數(shù)第一3人20+爆冷大勝猛龍 鶯歌29+6奎克利25分

      聯(lián)盟倒數(shù)第一3人20+爆冷大勝猛龍 鶯歌29+6奎克利25分

      醉臥浮生
      2025-12-27 10:28:09
      演員保劍鋒回應(yīng)出軌傳聞

      演員保劍鋒回應(yīng)出軌傳聞

      大風(fēng)新聞
      2025-12-27 10:50:06
      享受假期,泰山球員黃政宇的妻子曬出兩人在韓國(guó)休假游玩照

      享受假期,泰山球員黃政宇的妻子曬出兩人在韓國(guó)休假游玩照

      懂球帝
      2025-12-27 07:58:15
      暴漲17℃!馬上抵達(dá)浙江,大反轉(zhuǎn)......

      暴漲17℃!馬上抵達(dá)浙江,大反轉(zhuǎn)......

      浙江之聲
      2025-12-27 08:32:30
      中方制裁準(zhǔn)時(shí)開始,30道通牒發(fā)往美國(guó),直接叫停合作,財(cái)產(chǎn)全凍結(jié)

      中方制裁準(zhǔn)時(shí)開始,30道通牒發(fā)往美國(guó),直接叫停合作,財(cái)產(chǎn)全凍結(jié)

      閱識(shí)
      2025-12-27 17:20:01
      嘲諷張柏芝三胎全是賠錢貨,向太忍無(wú)可忍,揭露寧?kù)o嫁老外內(nèi)幕

      嘲諷張柏芝三胎全是賠錢貨,向太忍無(wú)可忍,揭露寧?kù)o嫁老外內(nèi)幕

      悠悠說(shuō)世界
      2025-12-26 12:03:43
      高價(jià)羽絨服賣不動(dòng),胖東來(lái)山姆500元以下羽絨服被瘋搶,打誰(shuí)的臉

      高價(jià)羽絨服賣不動(dòng),胖東來(lái)山姆500元以下羽絨服被瘋搶,打誰(shuí)的臉

      王新喜
      2025-12-27 11:45:16
      這是發(fā)廣告還是發(fā)福利?阿隆·戈登為內(nèi)衣品牌拍攝寫真

      這是發(fā)廣告還是發(fā)福利?阿隆·戈登為內(nèi)衣品牌拍攝寫真

      章眽八卦
      2025-12-25 11:48:11
      吃相太難看!知名羽絨服品牌舊款換名漲價(jià)900,欺瞞消費(fèi)者割韭菜

      吃相太難看!知名羽絨服品牌舊款換名漲價(jià)900,欺瞞消費(fèi)者割韭菜

      阿傖說(shuō)事
      2025-12-27 14:34:18
      “生娃送房”,最高75㎡!湖北一地出手

      “生娃送房”,最高75㎡!湖北一地出手

      中國(guó)基金報(bào)
      2025-12-27 13:34:56
      周渝民演唱會(huì)爆料:朱孝天缺席真相大揭曉,16年兄弟情竟是演戲!

      周渝民演唱會(huì)爆料:朱孝天缺席真相大揭曉,16年兄弟情竟是演戲!

      情感大頭說(shuō)說(shuō)
      2025-12-26 10:55:42
      林心如親手做豬腳面 和2千元紅酒為霍建華慶生 每年禮物太用心

      林心如親手做豬腳面 和2千元紅酒為霍建華慶生 每年禮物太用心

      葉敘說(shuō)
      2025-12-27 13:03:48
      呂良偉70大壽:楊受成彎腰舉杯、章小惠胖出水桶腰、王晶鍋蓋頭

      呂良偉70大壽:楊受成彎腰舉杯、章小惠胖出水桶腰、王晶鍋蓋頭

      無(wú)處不風(fēng)景l(fā)ove
      2025-12-26 17:11:43
      整容臉又來(lái)禍害央視劇?青蛙眼,饅頭臉,香腸唇,別辣觀眾眼睛了

      整容臉又來(lái)禍害央視劇?青蛙眼,饅頭臉,香腸唇,別辣觀眾眼睛了

      冷紫葉
      2025-12-27 15:24:04
      上海市內(nèi)免稅店搬新址!創(chuàng)新模式“市內(nèi)選購(gòu),口岸提貨”

      上海市內(nèi)免稅店搬新址!創(chuàng)新模式“市內(nèi)選購(gòu),口岸提貨”

      文匯報(bào)
      2025-12-27 18:22:11
      2025-12-27 19:55:00
      平凡AI incentive-icons
      平凡AI
      高校AI從業(yè)者
      54文章數(shù) 23關(guān)注度
      往期回顧 全部

      科技要聞

      小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

      頭條要聞

      男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗(yàn)?zāi)?回家后工作沒(méi)了

      頭條要聞

      男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗(yàn)?zāi)?回家后工作沒(méi)了

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂(lè)要聞

      張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

      財(cái)經(jīng)要聞

      注意,開始拉物價(jià)了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態(tài)度原創(chuàng)

      數(shù)碼
      藝術(shù)
      親子
      游戲
      房產(chǎn)

      數(shù)碼要聞

      銘凡DEG2顯卡塢發(fā)布,開放式設(shè)計(jì)且多接口配置

      藝術(shù)要聞

      充滿生命力的花卉靜物 | Jean Lightman

      親子要聞

      1歲多的小朋友上托管班,吃飯時(shí)自己拿起勺子就“開炫”,網(wǎng)友:這小孩是來(lái)報(bào)恩的吧

      索尼發(fā)福利!PS5玩家速速領(lǐng)取 價(jià)值33美元港服也能用

      房產(chǎn)要聞

      年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 一一本无道中文字幕| 日韩成人无码影院| 国产成人无码综合亚洲日韩| 大桥久未无码吹潮在线观看 | 日本深夜福利在线观看| 亚洲AV无码一区东京热久久| 伽师县| 女人与牲口性恔配视频免费| 99精品无码一区二区| 国产亚洲人成网站在线观看| 内射在线播放| 五峰| 日本熟妇大乳| 国产精品扒开腿做爽爽爽a片唱戏 日产精品久久久久久久蜜臀 | 国产精品99久久久久久成人| 无码人妻久久一区二区三区| 国产精品久久久久久av| 最爽free性欧美人妖| 新视频SSS欧美整片| 人妻人人操| 亚洲精品国产suv一区88| 国产真实乱人偷精品视频| 亚洲中文字幕伊人久久无码| 伊人免费| 又大又紧又粉嫩18p少妇| 亚洲浮力影院久久久久久| 国产最新AV在线播放不卡| 国产XX00| 99热在线观看| 午夜成人理论无码电影在线播放| 狠狠综合久久av一区二| 欧美整片sss| 亚洲一本大道无码av天堂| 国产亚洲欧美日韩俺去了| 日韩一级视频| 德阳市| 精品人妻人人做人人爽| 无尺码精品产品视频| 欧美怡春院一区二区三区| 青河县| 日本三级香港三级三级人!妇久|