<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="itli3"><p id="itli3"><li id="itli3"></li></p></sub><cite id="itli3"></cite><s id="itli3"></s><sub id="itli3"></sub>

<style id="itli3"></style>

<sub id="itli3"><p id="itli3"></p></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

字節Seed用化學思想搞AI，把DeepSeek-R1的腦回路拆成了分子結構

2026-02-24 15:21:52　來源: 量子位

北京舉報

0

分享至

聞樂發自凹非寺
量子位 | 公眾號 QbitAI

字節Seed都開始用化學思想搞大模型了——

深度推理是共價鍵、自我反思是氫鍵、自我探索是范德華力？！

傳統的大模型長思維鏈推理基本把AI的思考過程等同于線性結構。

但很多情況下，后續的一個關鍵結論，可能需要回過頭去驗證早早提出的假設。

CoT把這種非線性的依賴關系忽略了。

字節Seed在論文《The Molecular Structure of Thought》中首次給大模型的長鏈思維定義了分子式結構。

在這種分子拓撲中，三種鍵是怎么相互配合的？

好的推理像分子結構

團隊把DeepSeek-R1、gpt-OSS等強推理模型的長鏈思維拆成一步一步的，然后給每一步之間的“跳躍”打上標簽。

打完標簽發現，所有有效的長鏈思維里，其實就三種基礎動作來回組合。

第一種叫深度推理，像共價鍵一樣結實。

通俗來說就是類似“因為A所以B，因為B所以C”的硬邏輯推進。

團隊在語義空間里做了一個很形象的量化分析，把模型的每一步思考都當成一個點，看這些點最后會散成多大一個圈。

圈子越小，說明模型越沒跑題，思考越聚焦。

結果發現，加上深度推理之后，這個散點圈直接縮水22%。

深度推理確實起到了收束雜念、鎖定核心邏輯的關鍵作用。

第二種叫自我反思，像氫鍵一樣有彈性但穩定。

類似于“等等，我剛才那步是不是想錯了”“讓我重新檢查一下前面的假設”，能把后面的思考拐回來跟前面的節點呼應上，形成一種折疊感。

團隊測了模型自我反思時的思維軌跡，把每一步思考都看成語義空間里的一個點，然后計算反思時會跳回多遠、落在哪里。

發現81.72%的反思步驟，都會精準落回之前已經形成的靠譜思路區域里。

還對比了反思前后的思維范圍，反思前，語義空間體積是35.2，反思后，直接壓縮到31.2。

再看聚類結果就更清楚了，反思之后，同一類正確思路的點會緊緊抱團，而那些零散、跑偏的分支會被自動推開。

也就是說，自我反思氫鍵能把靠譜邏輯揉得更緊實、把跑偏想法篩出去、穩住整個推理大局，讓長鏈思考不再松散混亂。

第三種叫自我探索，像范德華力一樣弱，但覆蓋面廣。

這個就類似于“要不咱們試試這個角度”“有沒有另一種可能性”，在語義空間里找新的解題路徑。

量化分析顯示，加上探索行為之后，模型在語義空間里的思維覆蓋范圍能從23.95擴大到29.22。

雖然思路一打開穩定性就會下降，容易跑偏想歪，但能讓模型跳出死胡同，不卡在局部最優解里，真正找到全新的解題路線。

研究發現，所有強推理模型的三種思維行為比例和轉換規律都高度一致，相關性超過0.9，說明有效長鏈推理存在通用的穩定拓撲結構。

你可能覺得“共價鍵”“氫鍵”只是個比喻，但論文發現，這個比喻背后藏著嚴格的數學對應。

在Transformer里，注意力權重的計算方式長這樣：

眼熟嗎？這和統計力學里的玻爾茲曼分布一模一樣：

如果把負注意力分數看作能量，那么注意力權重就是模型在語義空間里按“能量”高低選擇路徑的概率就是能量越低，被選中的概率越高

論文進一步分析了三種行為對應的“注意力能量”。

深度推理通常發生在相鄰步驟之間，能量最低;
自我反思會跳回較遠的步驟，能量中等;
自我探索跳得更遠，能量最高.

這就解釋了為什么強推理模型的三種鍵比例如此穩定。

因為模型的注意力機制本身就在追求最低能量的推理路徑，而深度推理、反思、探索正好對應了不同距離下的能量層級。

語義同分異構體和智能熵減

接著團隊還拋出了語義同分異構體的概念。

這詞兒是借的化學，同樣的分子式，原子連接方式不同，就能搞出性質完全不同的物質。

放到推理里就是，同樣的題目，同樣的概念點，用不同的”化學鍵“組合去解，出來的推理鏈條可以完全不一樣，但都能解對。

但不是所有異構體都適合拿來教模型。

這里就要引入一個關鍵概念熵減

在熱力學里，孤立系統總是自發走向混亂（熵增），而一個有效的長鏈推理過程，本質上就是在語義空間里不斷降低不確定性——

從一堆可能的方向中，逐步收斂到唯一正確的答案。這個過程就是“熵減”。

而“注意力能量”機制，正是模型實現熵減的工具。

模型的注意力天然偏好能量更低的路徑。

當深度推理（低能量）被反復選中，反思（中等能量）把前后邏輯折疊起來，探索（高能量）偶爾探路但不喧賓奪主，整個系統的“推理熵”就會快速下降，邏輯火速收斂。

這如論文里說的，只有那些能推動熵快速降低的“化學鍵”組合，才是模型真正能學會、能持續進化的穩定態。

這在實驗中有個很典型的現象，從R1和OSS兩個不同強推理模型中蒸餾出的推理軌跡，語義層面的內容相似度高達95%，但混在一起訓練，模型反而崩潰了。

這說明，長鏈推理的關鍵是思路結構必須穩定、統一，模型才能學得會。

MoLE-Syn：從零合成穩定推理結構

發現問題就要解決問題。

基于這一整套發現，團隊搞了個叫MoLE-Syn的方法，來從零合成穩定的推理結構。

具體操作就兩步。

第一步，從強推理模型（比如R1、QwQ、gpt-OSS）的推理鏈里，抽出一張行為轉移概率圖。

這張圖里每個節點是一種推理行為（化學鍵），每條邊是從一個行為跳到另一個行為的概率。

第二步，拿著這張圖，讓普通的指令模型照著圖上畫的概率去生成推理鏈。

用這個方法從零合成的訓練數據，喂給Llama或者Qwen，效果逼近直接蒸餾R1的水平。

而且這么做有一個大好處就是成本低。只要拿到那張行為轉移圖，普通模型就能自己生產合格的長鏈推理數據。

團隊把用MoLE-Syn初始化過的模型拿去做強化學習，發現跑起來還特別穩。

相比直接用蒸餾數據初始化的模型，MoLE-Syn版的在RL過程中收益持續增長，震蕩也小得多。

這說明一開始植入的思維結構夠穩，后面的強化學習就不會出現邏輯偏移。

這項研究的負責人為字節Seed算法專家黃文灝，曾在微軟亞洲研究院擔任研究員。

第一作者是哈爾濱工業大學博士、字節Seed實習研究員陳麒光

合作單位還包括北京大學、2077AI Foundation、南京大學、M-A-P、中南大學。

不得不說，這波操作有點當年薛定諤拿物理學公式推生物學那味兒了。

給大模型推理這個卷得飛起的領域，開了個挺清爽的新腦洞。

論文地址：https://arxiv.org/abs/2601.06002

— 完 —

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

CVPR 2026 | 20步也能穩住畫質，這個擴散加速方法不一樣

機器之心Pro 2026-04-10 18:40:17
0 跟貼 0
對話自變量CTO王昊：在具身智能的“無人區” 探索端到端大模型的終極形態|連線創始人

財聯社 2026-04-10 20:46:16
0 跟貼 0

頂尖大模型“能力突變”，算力需求“系統性超越供給”--大摩：“市場樂觀的程度可能還不夠”

華爾街見聞官方 2026-04-11 20:16:47
1 跟貼 1

Vibe Coding的風，還是吹到了小紅書

經濟觀察報 2026-04-11 22:32:08
0 跟貼 0
多模態幻覺的病因「高熵節點」找到了！全基準幻覺率下降

新智元 2026-04-10 09:46:18
0 跟貼 0

人類首例“被恐龍咬傷事件”！男子把頭伸進恐龍模型里被卡住，當事人：沒想到它會不松口大家別跟我學 #

開屏新聞客戶端 2026-04-11 18:04:45
0 跟貼 0

DeepSeek 突然更新，付費會員要來了？

愛范兒 2026-04-09 18:20:47
20 跟貼 20
傳說中的避火罩！為什么火焰不會出來？什么原理？

轉了個球 2026-04-08 16:14:53
1 跟貼 1

以色列襲擊黎巴嫩被譴責，內塔尼亞胡：“以軍是世界上最有道德的軍隊”；此前以色列對黎巴嫩發動襲擊，造成包括兒童在內數百名平民死傷

揚子晚報 2026-04-11 11:33:21
59258 跟貼 59258
人類連氫彈都能造，為什么卻造不出一粒米？

半解智士 2026-04-10 17:40:34
19 跟貼 19
靈遁者書籍電子版PDF完整版，靈遁者科普7部曲，人生必讀

靈遁者起名閣 2026-04-11 09:05:47
0 跟貼 0
小升初奧數思維培優專題找規律的復雜計算，先觀察在分組進行

唐老師小課堂 2026-04-09 13:02:13
1 跟貼 1
僅憑一個細節就能破案，這推理能力太絕了，真相背后大有文章

尚悅電影 2026-04-09 11:00:40
1 跟貼 1
警惕！日本某些勢力“定制”AI反華視頻，用算法“加持”仇恨（來源：鈞正平）

學申論的談妹 2026-04-11 03:22:48
0 跟貼 0
張老師炒股DeepSeek連虧，張雪峰：你炒股天才？網友熱議！

前悅樂 2026-04-09 06:36:33
17 跟貼 17
李永樂：量子物理導論課程 | 新課上線

集智俱樂部 2026-04-09 16:53:14
0 跟貼 0
古墓的暗器，讓人摸不清規律

娥娥影視 2026-04-08 09:02:57
1 跟貼 1
阿里不止一匹“快樂馬”

鈦媒體APP 2026-04-11 10:20:11
3 跟貼 3
深度長文：虛幻與現實的碰撞，宇宙漂浮著無數“玻爾茲曼大腦”？

宇宙時空 2026-04-09 17:07:40
0 跟貼 0
美國大姐怒罵政客，美版算法稀爛，都想換回中國算法

搞笑小哈皮 2026-04-10 00:00:00
0 跟貼 0
護士都得懂點推理，聽完患者的話護士秒懂，原來是饞蟲作祟！

歡樂生產地 2026-04-11 14:59:47
1 跟貼 1
仍有地方弄虛作假！督察組進駐后，發現了不少問題

政知新媒體 2026-04-11 06:19:51
357 跟貼 357
為什么只有露露卡不做思考動作？網友：因為一會要吃什么早想好了

國創漫話 2026-04-07 15:02:17
0 跟貼 0
上海大鯊魚差點被弱旅翻盤，接下來的魔鬼賽程怎么辦？

上觀新聞 2026-04-11 14:13:04
61 跟貼 61
組裝川崎忍者模型套件

制造科技 2026-04-09 19:07:20
25 跟貼 25
城市更新顛覆購房邏輯，財富縮水風險

紀超講樓市 2026-04-08 06:16:42
0 跟貼 0
續航100公里僅跑30公里充電31秒電量猛漲10% 東莞網約車司機：深藍SL03虛到不敢接單

信網 2026-04-11 17:05:04
1889 跟貼 1889
中超|要相信自己！勝利如約而至，泰山1：0河南，止住連敗

齊魯壹點 2026-04-11 23:41:36
10 跟貼 10
顛覆認知的量子永生，堪稱科學最奇異概念

東洋雪蓮 2026-04-10 03:53:35
0 跟貼 0
暴漲超2600%！存儲巨頭，再迎利好！

證券時報 2026-04-11 19:24:05
299 跟貼 299
60141人創上海體育場上座紀錄，申花一戰雙贏：拿下上海德比，積分轉正

文匯報 2026-04-12 04:05:12
1 跟貼 1
記憶力差就必須早睡？規律作息比早睡更重要

羅夕夕博士 2026-04-08 09:05:14
0 跟貼 0
充電按功率收服務費，充電算法引業主質疑

民生大參考 2026-04-11 02:16:05
0 跟貼 0
通往佛山莫氏雞煲店的道路即將完工，預計下周可通行，老莫：我想縮小店面

極目新聞 2026-04-11 15:20:15
153 跟貼 153
解鎖單賽季2000分最高齡紀錄！杜蘭特：詹姆斯不在榜單上嗎？

北青網-北京青年報 2026-04-11 15:44:18
67 跟貼 67
微信開啟“方言采集”返紅包活動有人累計“薅”到幾百元

極目新聞 2026-04-11 18:39:53
55 跟貼 55
離子共存問題解析

宗老師化學知識學習 2026-04-11 21:09:19
0 跟貼 0
126找規律填數字，看看前四個數有什么規律

我服子佩 2026-04-11 21:32:17
1 跟貼 1
山東一公司年會總獎金超千萬元，36名員工現場數錢，8名高管獲贈166平方米房產，公司員工：數錢最多的人拿了1萬多元

極目新聞 2026-04-11 13:01:17
350 跟貼 350
函數空間作為向量空間 | 泛函分析第二講

集智俱樂部 2026-04-11 14:34:33
0 跟貼 0

回臺后就被抓？鄭麗文和大陸談完，臨走前達成共識，賴清德急了

回臺后就被抓？鄭麗文和大陸談完，臨走前達成共識，賴清德急了

生活魔術專家

2026-04-11 20:11:44

3-0，“吊州”變“棍州” 蘇超揭幕戰常州爆冷擊敗南通！

3-0，“吊州”變“棍州” 蘇超揭幕戰常州爆冷擊敗南通！

揚子晚報

2026-04-11 21:59:05

她是唯一給文章送花籃的演員，嫁普通人生倆女兒，今43歲被寵成寶

她是唯一給文章送花籃的演員，嫁普通人生倆女兒，今43歲被寵成寶

白面書誏

2026-04-11 16:58:00

現場打成一團！委內瑞拉爆發大示威，民眾怒吼：我們已經忍了四年

現場打成一團！委內瑞拉爆發大示威，民眾怒吼：我們已經忍了四年

丁丁鯉史紀

2026-04-11 23:33:13

千元童鞋把腳穿腫？泰蘭尼斯遭家長“圍攻”，醫生警惕影響發育，90%專利竟是外觀設計

千元童鞋把腳穿腫？泰蘭尼斯遭家長“圍攻”，醫生警惕影響發育，90%專利竟是外觀設計

新浪財經

2026-04-10 17:33:59

震驚！做普工都要驗資了，網傳深圳一工廠招工，身價最低300元起

震驚！做普工都要驗資了，網傳深圳一工廠招工，身價最低300元起

火山詩話

2026-04-11 14:54:51

不知不覺都老了，這兩位演員已經不在了，你還記得他們嗎？

不知不覺都老了，這兩位演員已經不在了，你還記得他們嗎？

阿廢冷眼觀察所

2026-04-11 17:02:28

U20女足亞洲杯-中國2比1烏茲晉級四強重返世界杯

U20女足亞洲杯-中國2比1烏茲晉級四強重返世界杯

體壇周報

2026-04-11 23:10:11

人不是慢慢變老的！研究發現：2個“斷崖式”衰老節點，很多人沒躲過

人不是慢慢變老的！研究發現：2個“斷崖式”衰老節點，很多人沒躲過

人民日報健康客戶端

2026-04-11 15:08:59

以軍突然發動襲擊！美軍“王牌”空降師、布什號航母等將抵達中東，特朗普強硬發聲！伊朗：若美方“以色列優先”，談判將無果而終

以軍突然發動襲擊！美軍“王牌”空降師、布什號航母等將抵達中東，特朗普強硬發聲！伊朗：若美方“以色列優先”，談判將無果而終

每日經濟新聞

2026-04-11 19:55:10

伊朗最高領袖發話了，10大條件直接砍到了3條，悄然做出重大讓步

伊朗最高領袖發話了，10大條件直接砍到了3條，悄然做出重大讓步

興史興談

2026-04-11 04:13:10

光纖光纜炸了！13股預增翻倍，最高暴增31倍，名單出爐

光纖光纜炸了！13股預增翻倍，最高暴增31倍，名單出爐

慧眼看世界哈哈

2026-04-11 19:35:18

美伊談判還沒開始，美國85名議員統一戰線，公開呼吁彈劾特朗普

美伊談判還沒開始，美國85名議員統一戰線，公開呼吁彈劾特朗普

浪子阿邴聊體育

2026-04-11 03:12:53

以色列政壇大地震！反對派61席鎖死勝局！貝內特正瘋狂背刺內氏

以色列政壇大地震！反對派61席鎖死勝局！貝內特正瘋狂背刺內氏

書紀文譚

2026-04-11 19:05:01

看到伴娘的第一眼就愛上了，這伴娘也太漂亮了吧

看到伴娘的第一眼就愛上了，這伴娘也太漂亮了吧

阿廢冷眼觀察所

2026-04-11 17:32:43

回到臺灣就被抓？鄭麗文和大陸談完，臨走前達成共識，賴清德急了

回到臺灣就被抓？鄭麗文和大陸談完，臨走前達成共識，賴清德急了

春序娛樂

2026-04-12 01:44:48

柬埔寨的洪瑪奈出面，德崇扶南運河二期開工，以后不用經過越南

柬埔寨的洪瑪奈出面，德崇扶南運河二期開工，以后不用經過越南

阿纂看事

2026-04-11 22:14:42

伊美第三輪會談在伊斯蘭堡舉行

新華社

2026-04-12 04:15:03

油價，暴跌！

環球網資訊

2026-04-11 13:32:09

鄭麗文大陸第4天：北京頂格接待，中南海保鏢護送，更多細節曝光

鄭麗文大陸第4天：北京頂格接待，中南海保鏢護送，更多細節曝光

影像溫度

2026-04-11 09:20:22

追蹤人工智能動態

12457文章數 176449關注度

往期回顧全部

科技要聞

半夜被燃燒瓶砸醒，OpenAI CEO發文反思

頭條要聞

美國提過分要求美伊談判雙方嚴重分歧披露

頭條要聞

美國提過分要求美伊談判雙方嚴重分歧披露

體育要聞

換帥之后，他們從降級區沖到升級區

娛樂要聞

鄭鈞回應兒子走路：會監督他挺直腰板

財經要聞

從日本翻身看：這次誰能扛住高油價？

汽車要聞

煥新極氪007/007GT上市限時19.39萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

教育

手機

公開課

軍事航空

藝術要聞

一輩子都沒見過的藝術，太絕了！

教育要聞

高考前真的別亂說話！

手機要聞

全球首款闊折疊賣爆！華為Pura X一年出貨量超150萬臺

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="vxdkl"><p id="vxdkl"></p></sub><p id="vxdkl"><rp id="vxdkl"><pre id="vxdkl"></pre></rp></p>

<em id="vxdkl"></em>

<em id="vxdkl"><big id="vxdkl"></big></em>