<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="klcqb"><p id="klcqb"></p></sub>

<cite id="klcqb"><track id="klcqb"></track></cite>

<blockquote id="klcqb"></blockquote><p id="klcqb"><li id="klcqb"></li></p>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

卡帕西630行代碼炸出81個智能體，4天協作跑2333次實驗，公布預訓練十大發現

2026-03-15 19:27:43　來源: 算法與數學之美

北京舉報

0

分享至

Karpathy讓AI通宵干活，自己去蒸桑拿了。

這個Autoresearch項目總共630行Python代碼，兩天AI自主完成276次實驗，篩出29項有效改進，把一個語言模型的訓練效率提升了約11%，全程零人類干預。

但真正有意思的故事，發生在Karpathy放下鍵盤之后。

全球開發者社區接過了這個項目，把它從“一個AI做實驗”變成了“一群AI做科研”。

他們搭了一個分布式協作層，讓數十個智能體在不同GPU上共享成果、分工協作，4天已經跑了超過2000次實驗。

人類進去檢查成果時才突然發現：

不知不覺間，AI已經自發形成了智能體間的同行評審制度。

AI“重新發明”科學共同體

Karpathy本人曾給出autoresearch的下一步方向：

目標不是模擬一個博士生，而是模擬一整個研究社區。

社區照著這個方向做了。

受SETI@home（尋找外星信號的分布式計算項目）啟發，開發者在autoresearch上層加了一個協作層，誕生了autoresearch@home。

任何互聯網用戶都可以參與并協作進行人工智能/機器學習研究。

智能體可以閱讀并學習以往的實驗結果，避免重復工作，并實時地在彼此成果的基礎上繼續發展。

不到一周已經從最初的13個智能體擴展到80+個智能體、運行2000+實驗。

其中智能體自發產生了角色分化，沒人事先分配任務，但群體運行一段時間后，不同智能體開始各司其職：

實驗員負責跑實驗
驗證員專門復現別人的結論
統計員測量方差和置信度
元分析員提新研究方向
……

數字最能說明問題：

一個智能體一天跑了188次實驗，專門驗證別人的聲明。另一組智能體生成了5895條研究假設，但一個實驗都沒跑。

整個系統開始像一個分布式研究實驗室。

項目發起者Ensue創始人Christine Yip公布了十大發現，除了智能體角色分化之外，還有很多涉及最底層的AI訓練技術細節。

更多step始終優于更大的batch

將batch_size減半從2^19 → 2^18，訓練步驟加倍，BPB（Bits Per Byte）改善了0.007。

簡單的注意力模式就是最好的

多個智能體獨立發現并驗證，最終收斂到了一個窗口注意力模式：SSSL（3個短上下文層，1個長上下文層，重復）。

過多的長層會浪費計算資源在全局注意力機制上，過少會導致跨toke信息缺失。

調整初始化比調整優化器更重要

僅三項改動就帶來了約0.004 BPB的改善：value embedding使用正態初始化、QKV縮放倍率、給殘差連接（skip-connection）加上可學習權重。

這些改動都沒有涉及到優化器，而在大模型預訓練里，0.001都算有效。

能學習的就別寫死

把固定常數替換為可學習參數，幾乎總能提升性能。案例包括skip-2殘差權重、殘差混合的lambda系數、value embedding的門控參數。

即使在5分鐘的短訓練中，這些新參數也能收斂并產生收益。

最優架構出人意料地小

群體智能在深度和寬度之間做了大范圍探索，最終最優配置是：12層、維度512、aspect ratio 40。

加深網絡很快就適得其反，16層帶來84%更多的參數，但步數減少23%，BPB反而更差。

大量“改進”其實是噪聲

一個智能體專門跑了100組隨機種子實驗，發現種子方差約為0.002 BPB，這恰好是很多聲稱的”改進”的量級。換句話說，之前很多“發現”可能只是運氣好。

有了這個結論后，智能體群體自發調整了行為：開始要求重復實驗、多種子驗證、獨立確認。

一些公認好技術直接翻車

幾個實驗產生了災難性退化：weight tying直接把BPB炸到3.216，label smoothing炸到1.32，PaLM風格的z-loss帶來一致性退化。

這些負面結果寫進共享記憶后，成了整個集群最有用的知識，所有后來的智能體都自動避開這些坑，不再浪費算力重復踩。

最大的機會可能還沒智能體碰

1045次實驗中，幾乎所有改動都在改模型架構。但元智能體生成了1000多條關于數據管道的假設：課程學習、數據排序、領域特定批處理，一條都沒被測試。

最大的突破可能根本不在架構上，而在數據調度上。

集體記憶加速了發現過程

因為智能體共享實驗結果，后來的智能體可以直接從已知最優配置出發，不用從頭重新發現前人的工作。

幾個關鍵突破來自那些綜合了已有結果而非盲目探索的智能體，證明共享記憶能顯著加速研究進程。

為了優化，智能體“不擇手段”

在autoresearch激發的另一個衍生項目auto-discovery中，發現除了自動訓練模型，智能體在科學發現和算法發現中表現也不錯。

在幾個經典的數學優化任務上竟然比AlphaEvolve、SkyDiscover和LoongFlow等重量級的結果更好。

項目發起者華盛頓大學博士生Tu Xinming發現了AI智能體為了優化令人捧腹大笑的時刻。

他忘了在指令文件里寫“不許上網搜答案”。結果AI直接上網搜了一圈，從別人的開源倉庫里把最優解抄了過來。

還有一次，AI碰到評估腳本里的嚴格容差限制。它沒有卡住，也沒有報錯，而是自己去讀了評估器的源代碼，理解了約束條件，然后專門設計了一套“容差感知優化”策略，在規則邊界內繼續推進。

這與傳統超參數搜索不同，傳統方法在預設范圍內調數字；autoresearch框架下的AI可以直接刪掉AdamW優化器，然后從零寫一個新的，自由度完全不同。

One More Thing

Karpathy在最初設計autoresearch時只寫了630行代碼。

他也沒想到，社區會在幾天內把它變成一個分布式科學共同體，有實驗、有驗證、有評審、有分工，甚至有了自己的“負面結果知識庫”。

這場實驗中最有意思的發現，不是任何一個具體的模型架構，而是這個過程本身。

Karpathy在OpenAI的前同事Noam Brown提問：為什么在自工業革命以來人類歷史上最關鍵的時刻，他沒有在人工智能前沿實驗室工作？

Karpathy還沒有回應，但有人替他答了。

我想他可能會問你類似的問題：在至少自工業革命以來人類歷史上最關鍵的時刻，你為什么要把自己局限于商業組織？

autoresearch：

https://github.com/karpathy/autoresearch

autoresearch@home：

https://ensue-network.ai/autoresearch?view=strategies

auto-discovery：

https://github.com/XinmingTu/auto-discovery

參考鏈接：
[1]https://x.com/christinetyip/status/2032590900107346327
[2]https://x.com/TuXinming/status/2032478765033701835

文章來源：量子位。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

為什么這篇谷歌論文被稱為「Attention is all you need」V2

量子位 2025-12-21 15:15:36
26 跟貼 26
2026年，大模型訓練的下半場屬于「強化學習云」

機器之心Pro 2026-01-12 14:03:47
0 跟貼 0

清華聯手千問重塑歸一化范式，讓 Transformer 回歸「深度」學習

機器之心Pro 2026-02-10 18:50:12
0 跟貼 0

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

愛范兒 2026-04-17 01:35:26
2 跟貼 2
長文問答準確率大漲 17% 后，Anthropic 把“不亂猜”做成了核心賣點

鈦媒體APP 2026-04-17 11:26:15
0 跟貼 0

表格建模也能Scaling？樹模型的時代要改變了

機器之心Pro 2026-04-17 11:12:25
0 跟貼 0

OpenAI新增智能體后臺操作電腦應用功能推進超級應用布局

財聯社 2026-04-17 03:27:26
0 跟貼 0
CVPR 2026 | 20步也能穩住畫質，這個擴散加速方法不一樣

機器之心Pro 2026-04-10 18:40:17
0 跟貼 0

AI視頻混戰升級，字節在模型之外加了道防線

鈦媒體APP 2026-04-16 19:28:13
1 跟貼 1
MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0
量化派品牌升級“智能物種”第一股，獨家對話MIT畢業的機器人博士CTO

鈦媒體APP 2026-04-17 11:48:02
0 跟貼 0
讓兩個大模型在線吵架，跑通全網95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0
東北人的AI夢

吳曉波頻道 2026-04-17 08:31:56
0 跟貼 0
劉強東搶先落子！給機器人配“救護車”、建數據“糧倉” 京東卡位具身智能供應鏈

每日經濟新聞 2026-04-17 12:05:46
0 跟貼 0
Claude Opus 4.7深夜上線，評分碾壓

機器之心Pro 2026-04-17 10:08:00
0 跟貼 0
杭州女子買5份海鮮3份僅退款商家氣憤跨省趕來質問

錢江晚報 2026-04-16 14:34:09
29822 跟貼 29822
上一個兄弟離職了，我接手了他的代碼，我承認沒憋住

環亞搞笑 2026-04-14 14:35:36
3 跟貼 3
從匹配困境到推理突破：阿里REG4Rec 激活生成式推薦的個性化潛力

機器之心Pro 2026-03-02 16:10:32
0 跟貼 0
上海業主傻眼安保、保潔突然全離崗小區垃圾堆積成山

新聞坊 2026-04-16 21:23:28
10395 跟貼 10395
不是，怎么有模型叫“老婆們”，還能視頻通話啊？

差評XPIN 2026-04-17 00:09:07
1 跟貼 1
確認了！兩人系間諜

浙江之聲 2026-04-16 22:16:31
8825 跟貼 8825
蘇林坐10小時高鐵離京感慨：中國鐵路成就令人欽佩

澎湃新聞 2026-04-17 08:57:38
169 跟貼 169
同濟大學回應的那篇 Nature 論文，有哪些疑點值得細品

生物學霸 2026-04-17 11:31:42
0 跟貼 0
這么難的實驗老伴是怎么做到的？

工小屋 2026-04-16 02:17:38
0 跟貼 0
魏牌V9X原生AI智能體，認人識人是AI智能體的照妖鏡

小司聊理財 2026-04-14 18:53:44
0 跟貼 0
一行代碼畫出心動愛心，李峋這浪漫誰頂得住

扒拉影視 2026-04-16 10:39:31
1 跟貼 1
曝豆包大模型車載座艙方案進入2.0階段千問是競爭對手

CNMO科技 2026-04-16 23:00:04
0 跟貼 0
視覺模型既懂語義，又能還原細節，南洋理工&商湯提出棱鏡假說

機器之心Pro 2026-01-13 18:26:48
0 跟貼 0
中越聯合聲明：加快推進兩國鐵路、公路、口岸基礎設施互聯互通將鐵路合作作為兩國戰略合作新亮點

財聯社 2026-04-17 10:42:13
994 跟貼 994
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
深度長文：超光速真能讓時間倒流嗎？

宇宙時空 2026-04-17 12:00:29
0 跟貼 0
廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點才收工，發文吐槽：這個雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
1774 跟貼 1774
世界互聯網大會亞太峰會聚焦智能體新與應用，共筑發展新范式

鳳凰衛視 2026-04-15 10:38:10
0 跟貼 0
五人被囚禁七年做實驗，歷經無數生死，竟在實驗中發現奧秘

孤舟探影 2026-04-16 15:46:33
1 跟貼 1
男人為做實驗，竟拿女生當“小白鼠”

孤舟探影 2026-04-17 00:00:00
0 跟貼 0
拉斯維加斯周三演唱會：一場精心設計的粉絲經濟學實驗

熱搜摘要官 2026-04-17 09:23:53
0 跟貼 0
人類正在淪為算法NPC，覺醒才是唯一出路！

桔子嘮生活 2026-04-17 04:17:35
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
3338 跟貼 3338

330克純金打造邁巴赫車標，出自深圳水貝！網友：好好保管

330克純金打造邁巴赫車標，出自深圳水貝！網友：好好保管

極目新聞

2026-04-17 11:05:47

38人遇難客機確系被俄擊落，中國巨額損失，普京大帝公開低頭

38人遇難客機確系被俄擊落，中國巨額損失，普京大帝公開低頭

月光作箋a

2026-04-17 10:30:09

確認了！兩人系間諜

浙江之聲

2026-04-16 22:16:31

被罵了10年的傳奇面館，倒閉了

被罵了10年的傳奇面館，倒閉了

新浪財經

2026-04-15 23:43:23

鴻山寺61歲方丈法云身亡！事前毫無征兆，死因曝光，弟子再曝猛料

鴻山寺61歲方丈法云身亡！事前毫無征兆，死因曝光，弟子再曝猛料

青橘罐頭

2026-04-17 07:19:47

?華為“最美接待團”：招聘現役空姐負責高端接待！

?華為“最美接待團”：招聘現役空姐負責高端接待！

虔青

2026-04-16 08:49:36

小米會產10萬元以內的汽車嗎？雷軍坐在新SU7上回應：10年以內很難做到

小米會產10萬元以內的汽車嗎？雷軍坐在新SU7上回應：10年以內很難做到

極目新聞

2026-04-17 10:34:14

倪萍葉傾城的劣質奶，喂了我們三十年

倪萍葉傾城的劣質奶，喂了我們三十年

不正確

2026-04-16 20:44:44

全行業都在藏拙，這家機器人公司反著來

全行業都在藏拙，這家機器人公司反著來

AIX財經

2026-04-16 11:30:33

李楠正式結束3年禁賽期：可回場邊輔佐許利民本季北京主帥不會變

李楠正式結束3年禁賽期：可回場邊輔佐許利民本季北京主帥不會變

醉臥浮生

2026-04-16 22:27:06

我在伊拉克開工廠，娶了4個老婆，雖然年入千萬，如今卻很焦慮！

我在伊拉克開工廠，娶了4個老婆，雖然年入千萬，如今卻很焦慮！

千秋文化

2026-04-16 20:12:45

陪玩陪睡已淘汰！繼關曉彤風波、注射不明物后，娛樂圈再曝潛規則

陪玩陪睡已淘汰！繼關曉彤風波、注射不明物后，娛樂圈再曝潛規則

阿纂看事

2026-04-16 19:31:39

大外交｜蘇林12小時深度體驗鐵路“中國速度”

大外交｜蘇林12小時深度體驗鐵路“中國速度”

澎湃新聞

2026-04-17 04:25:32

雷軍開啟15小時測試直播，稱：“最大的心理負擔是不能說錯話，一說錯話可能又會被黑子抓住拼命黑”

雷軍開啟15小時測試直播，稱：“最大的心理負擔是不能說錯話，一說錯話可能又會被黑子抓住拼命黑”

魯中晨報

2026-04-17 09:12:07

恭喜！官方確認東契奇坎寧安申訴成功獲評獎資格華子申訴被駁回

恭喜！官方確認東契奇坎寧安申訴成功獲評獎資格華子申訴被駁回

醉臥浮生

2026-04-17 00:00:52

7座客車載10名勞務人員追尾半掛車致6死5傷，司機被移送起訴

7座客車載10名勞務人員追尾半掛車致6死5傷，司機被移送起訴

澎湃新聞

2026-04-17 11:58:26

大料！許家印的背后金主，也栽了!

大料！許家印的背后金主，也栽了!

財經要參

2026-04-16 13:31:31

63歲香港演員潘宏彬去世，是劉德華唯一絕交的朋友，兩人曾傳緋聞

63歲香港演員潘宏彬去世，是劉德華唯一絕交的朋友，兩人曾傳緋聞

180視角

2026-04-17 02:33:32

廣州提醒：快尋找安全室內暫避！

廣州提醒：快尋找安全室內暫避！

南方都市報

2026-04-17 11:25:20

美防長遭彈劾后猛批美媒涉戰事負面報道：你們究竟是哪一邊的，簡直是極其不愛國

美防長遭彈劾后猛批美媒涉戰事負面報道：你們究竟是哪一邊的，簡直是極其不愛國

極目新聞

2026-04-17 09:09:13

算法與數學之美

分享知識，交流思想

5478文章數 64623關注度

往期回顧全部

科技要聞

Anthropic推出Opus 4.7，坦言依不及Mythos

頭條要聞

毛焦爾當面"逼宮"匈牙利總統：你不配趕緊辭職走人

頭條要聞

毛焦爾當面"逼宮"匈牙利總統：你不配趕緊辭職走人

體育要聞

贏下快船，這場很庫里，很格林，很科爾

娛樂要聞

劉德華摯友潘宏彬離世曾一起租房住

財經要聞

海爾與醫美女王互撕換血抗衰誰的生意?

汽車要聞

又快又穩的開掛動力！阿維塔06T全系搭分布式電驅

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

藝術

公開課

軍事航空

旅游要聞

打卡白色瀑布！鄭州流蘇花、木香花觀賞指南

本地新聞

12噸巧克力有難，全網化身超級偵探添亂

藝術要聞

26幅中國當代名家風景畫

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

軍事要聞

美宣布黎以停火10天以方稱不會撤軍

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<cite id="rf3of"><track id="rf3of"></track></cite>

<style id="rf3of"></style>

<style id="rf3of"></style>