<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude強到不敢發的Mythos,被質疑用了字節Seed技術

      0
      分享至

      夢晨 發自 凹非寺
      量子位 | 公眾號 QbitAI


      Claude最強“神話”模型,可能用到來自字節的技術?

      這條猜測直接沖上熱搜榜。



      這款“強到不敢公開發布”的Mythos模型,確實刺激了人們對下一代LLM架構的想象。

      社區正在熱烈討論它是否采用了循環語言模型(Looped Language Model)架構。

      這個概念來自字節Seed團隊與多個高校合作的一篇論文,Yoshua Bengio也參與其中。



      關鍵線索在于Anthropic公布的一組測試數據。

      字節論文指出,圖搜索是循環算法相比標準RLVR具有巨大理論優勢的領域之一。

      再看Mythos,正是在廣度搜索優先的圖搜索測試GraphWalks BFS中,超越對手GPT5.4最多。



      80%對21.4%,接近4倍的差距。

      在其他類型的任務上,并沒有出現如此異常的分差。

      說明這種進步很可能不是來自通用的Scaling Law,而是架構創新

      循環語言模型:同一層”多轉幾圈”,小模型碾壓大模型

      GraphWalks BFS測試,就是給模型一個復雜的圖結構,讓它做廣度優先搜索,從起點出發,一層一層地訪問所有相鄰節點。

      標準Transformer處理這類問題只能一次前向傳播,從頭走到尾,輸出結果,沒有“迭代”這個概念。

      Mythos在圖遍歷上拿到了80%的分數,表明它內部很可能在“”反復計算”,對同一組信息來回處理了好幾遍。

      那么什么樣的架構能實現“反復計算”?

      字節Seed團隊在論文中提出LoopLM循環語言模型。



      簡單總結LoopLM有三個特點。

      1、不寫長文思考,在模型內部潛空間迭代,不額外輸出更多token。

      2、簡單題少想幾步,難題多想幾步,自動調節。

      3、預訓練時就學 “怎么在潛空間思考”,而不是只學 “怎么預測下一個token”。

      在實驗中,團隊訓練了Ouro系列循環語言模型,內置了循環思考。



      測試結果,1.4B的Ouro模型性能對標約4B的傳統模型。2.8B的Ouro模型相當于8B–12B的傳統模型。



      至于循環模型的能力提升來自何處,論文詳細分析了知識存儲vs知識操作的區別。

      知識存儲(Knowledge Storage)的容量是有限的,大約每個參數2bits,不管用什么架構,這個數字基本不變。

      循環也不會讓你“記住”更多東西。

      但知識操作(Knowledge Manipulation)不一樣,把已知事實組合起來做多跳推理、執行程序、搜索圖結構,這類能力隨循環步數和訓練tokens指數級增長。

      換句話說,循環模型沒有給AI一個更大的知識庫,但它讓AI在知識庫庫里的搜索和組合能力提升了一個量級。

      那么Mythos究竟是不是循環模型架構,有人總結出除了GraphWalks之外的更多線索。



      三條線索指向循環模型架構

      第一條線索,也就是廣度優先圖搜索測試結果。

      Mythos除了分數是GPT5.4的4倍,比上一代Opus提升幅度也異常大。



      第二條線索,Anthropic報告Mythos每個任務使用的token數量是Opus4.6的1/5,但速度更慢

      (價格也貴5倍!)

      這在標準Transformer框架下很難說得通,token少,生成步驟就少,應該更快才對。

      但循環模型剛好解釋了這個矛盾:推理不發生在token層面,而是發生在潛空間,計算量花在了看不見的地方。

      線索三,Mythos在網絡安全方面非常突出。

      Mythos在CyberGym測試上拿到83.1%,Opus4.6是66.6%,領先近17個百分點。

      以及找到上千個零日漏洞,主流操作系統和瀏覽器全都沒逃過。

      漏洞發現的本質就是對控制流圖做遍歷。找到一條從輸入到危險函數的路徑,也就是圖的可達性問題。

      又是圖遍歷。又是循環架構的天生強項。

      說了這么多,終歸只是大家的猜測,Anthropic沒有公開任何關于Mythos架構的信息,很可能以后也不會公開。

      但有一句話值得思考:

      Scaling Law改善一切,相對均勻,架構創新在匹配其歸納偏置的任務上創造異常尖峰值。



      循環Transformer的歸納偏置就是迭代圖算法。Mythos的異常尖峰,恰好出現在圖遍歷任務上。

      Anthropic不說,但測試數據已經替它說了。

      字節論文:
      https://arxiv.org/abs/2510.25741

      參考鏈接:
      [1]
      https://x.com/ChrisHayduk/status/2042711699413926262
      [2]
      https://aiia.ro/blog/claude-mythos-looped-language-model-theory

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      程瀟不愧是“奶瀟”

      程瀟不愧是“奶瀟”

      情感大頭說說
      2026-03-16 00:19:50
      中國的鐵桿兄弟,在特朗普的淫威下屈服,打算對中國倒戈相向?

      中國的鐵桿兄弟,在特朗普的淫威下屈服,打算對中國倒戈相向?

      娛樂的宅急便
      2026-04-13 19:24:30
      湖北省荊州市委原書記吳錦被“雙開”

      湖北省荊州市委原書記吳錦被“雙開”

      界面新聞
      2026-04-13 16:43:04
      還沒畢業就當爹!上海大學生攜妻兒歸家,現實比想象更扎心

      還沒畢業就當爹!上海大學生攜妻兒歸家,現實比想象更扎心

      行者聊官
      2026-04-13 06:55:02
      突發!劉強東拿下深藍汽車

      突發!劉強東拿下深藍汽車

      李東陽朋友圈
      2026-04-13 12:04:12
      都靈后衛3年前拒成國米冠軍拼圖,重傷失業后攤牌:本可以踢歐冠決賽

      都靈后衛3年前拒成國米冠軍拼圖,重傷失業后攤牌:本可以踢歐冠決賽

      競技風云錄
      2026-04-13 17:43:55
      美軍的小寶貝丟在了伊朗,中國若得到,可以少奮斗幾年?

      美軍的小寶貝丟在了伊朗,中國若得到,可以少奮斗幾年?

      夢醉為紅顏一笑
      2026-04-12 16:33:18
      保監局前局長與險企現任負責人夫妻檔雙雙“落馬”

      保監局前局長與險企現任負責人夫妻檔雙雙“落馬”

      新浪財經
      2026-04-12 21:41:08
      張鈞甯與導演男友西班牙度假,兩人氣質好搭,交往2年多見過父母

      張鈞甯與導演男友西班牙度假,兩人氣質好搭,交往2年多見過父母

      陳意小可愛
      2026-04-13 19:29:00
      武漢經濟技術開發區管委會副主任、漢南區政府副區長韓方亮擬任有關區委常委

      武漢經濟技術開發區管委會副主任、漢南區政府副區長韓方亮擬任有關區委常委

      阿天愛旅行
      2026-04-13 19:23:28
      性生活時,女性私處總發出“噗噗”的放屁聲?多和這4個原因有關

      性生活時,女性私處總發出“噗噗”的放屁聲?多和這4個原因有關

      健康之光
      2026-04-13 14:10:10
      歐冠2006冠軍名單被提前泄露,12年后全中,歐足聯至今沒吭聲

      歐冠2006冠軍名單被提前泄露,12年后全中,歐足聯至今沒吭聲

      籃壇第一線
      2026-04-13 14:48:02
      超一億元!珠峰南坡發生騙保大案

      超一億元!珠峰南坡發生騙保大案

      中國新聞周刊
      2026-04-12 11:28:09
      福建泉州一校花太漂亮了,身高170五官精致,美得讓人移不開眼

      福建泉州一校花太漂亮了,身高170五官精致,美得讓人移不開眼

      阿廢冷眼觀察所
      2026-04-12 12:36:33
      以總理:與伊朗的停火可能很快結束

      以總理:與伊朗的停火可能很快結束

      財聯社
      2026-04-13 19:42:06
      日偶像女團辦活動「0人到場」! 5成員低頭畫面瘋傳

      日偶像女團辦活動「0人到場」! 5成員低頭畫面瘋傳

      ETtoday星光云
      2026-04-13 12:40:07
      又一筆重磅引援達成!NBA首輪秀加盟深圳男籃,G聯盟曾單場砍49分

      又一筆重磅引援達成!NBA首輪秀加盟深圳男籃,G聯盟曾單場砍49分

      老葉評球
      2026-04-13 19:30:29
      霍爾木茲海峽對峙升級,特朗普“卡脖子”會否再次點燃戰火?

      霍爾木茲海峽對峙升級,特朗普“卡脖子”會否再次點燃戰火?

      新民晚報
      2026-04-13 14:16:54
      經常喝咖啡,心情大不同!復旦大學最新:每天2杯咖啡,抑郁癥、焦慮癥風險或最低

      經常喝咖啡,心情大不同!復旦大學最新:每天2杯咖啡,抑郁癥、焦慮癥風險或最低

      醫諾維
      2026-04-13 17:00:20
      88年陪娘趕集,與賣肉姑娘爭價格,她放下刀說:合我脾氣,結婚吧

      88年陪娘趕集,與賣肉姑娘爭價格,她放下刀說:合我脾氣,結婚吧

      千秋文化
      2026-04-08 20:05:11
      2026-04-13 20:40:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12466文章數 176449關注度
      往期回顧 全部

      科技要聞

      "抄作業"近四年,馬斯克版微信周五上線

      頭條要聞

      媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

      頭條要聞

      媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

      體育要聞

      一支球隊不夠爛,也是一種悲哀

      娛樂要聞

      初代“跑男團”合體,鄧超、鹿晗缺席

      財經要聞

      今夜,出大事了,3種結果

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      藝術
      本地
      時尚
      手機
      公開課

      藝術要聞

      22位中國當代名家油畫作品

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      “小紅鞋”今年春夏又火了!這4雙怎么搭都好看

      手機要聞

      OPPO影像機皇來了!雙2億像素+10倍光變,外觀也被公布了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版