<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<tr id="89ua6"></tr>

<thead id="89ua6"></thead>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Nature重磅：AI寫的論文，在頂會同行評審擊敗55%人類，單篇15美元

2026-03-28 14:07:45　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】剛剛，Nature蓋章AI獨立科研時代！全新Scaling Law顯現，人類死守的學術鐵王座，正發生不可逆的轉移。

一篇長達數十頁的學術論文，在人類設定研究主題和實驗邊界后，系統自動完成了從實驗到寫作的大部分流程。

從論文正文、實驗代碼、圖表和投稿稿件，主要由系統端到端自動生成。

它被投遞到頂尖機器學習會議ICLR 2025某workshop的同行評審流程中，三位匿名審稿人不知道具體哪幾篇是AI生成稿件，他們對著這篇稿件分別打出了6、7、6的高分。

這個成績，高于約55%的同場投稿。稿件在評審完成后按實驗協議撤回，未進入正式發表階段。

這并非科幻，這是剛剛被《Nature》報道的一項震撼研究。

該項研究是由Sakana AI聯合牛津大學、UBC共同推出的全自動AI科學家「The AI Scientist」。

Sakana AI聯合創始人兼 CEO David Ha在推文中表示，啟動該項目，正是想探索大模型是否能夠完成整個科研全流程：

我堅信，AI將永遠改變科學發現和科研進步的方式。

全自動「AI科學家」

究竟做了什么？

這一次，不是AI在「幫」人干活，而是AI第一次把科研流程從頭走到尾。

一直以來，AI在科研領域的定位都是「高級打工人」：比如幫化學家折疊蛋白質，或是幫程序員找bug。

定義問題和統籌全局的，始終是人類。

The AI Scientist的出現，則顛覆了這套「主仆敘事」，它完整覆蓋了科研的四大核心階段：Idea生成、實驗迭代、論文寫作、自動評審。

在全新升級的v2版本中，它甚至走向了「無模板」模式：徹底拋棄人類提供的初始代碼腳手架，引入了強大的「智能體樹搜索」（agentic tree search）機制。

這意味著它能在龐大的未知解空間里，同時開啟多條主線并行探索。科研不再是單線程試錯，而變成了一個可擴展的搜索過程。

它怎么保證自己不和別人撞車？

系統會調用Semantic Scholar API進行全網查重，確保每一個idea都具備足夠的新穎性。

在最棘手的數據可視化環節，它甚至內置了一個視覺語言模型（VLM）作為反饋審閱者。

如果坐標軸反了、圖例丟了、展示有歧義，VLM會像嚴苛的導師一樣立刻打回重做，直到生成完美的學術圖表。

過去圖表只是論文包裝，現在圖表也成了AI科研的反饋信號。

而完成這堪比博士生幾個月工作量的閉環，它的賬單是：單篇論文15美元。

如此驚人的性價比意味著，科研自動化第一次從「局部輔助」跨進了「全鏈路主導」。

AI不再只是科學家的輔助工具，而是向更具自主性的科研代理系統演進。

AI Scientist工作流程的概念概述，包括提出研究想法、實施實驗、執行實驗、撰寫論文以及審閱論文。

通過人類同行評審測試

AI寫的論文，人類學術金字塔尖的學者到底認不認？

于是，Sakana AI決定玩一把大的：直接向頂會投稿。

在獲得ICLR大會領導層、ICBINB workshop組織者以及IRB倫理委員會的特批后，團隊進行了一場極其大膽的「潛伏行動」：將3篇純AI生成的論文混入了人類投稿池。

審稿人只被告知「可能有AI生成論文」，但根本不知道具體是哪幾篇。

結果其中一篇探索神經網絡組合正則化（Compositional Regularization）負面結果的論文，斬獲了平均6.33分（弱接收、接收、弱接收）的高分。

這個分數不僅穩穩越過了該workshop的平均錄用線，更是超過了55%的真實人類學者。

連科學研究中最難寫出彩的負向論證，AI也能寫得有模有樣、邏輯自洽。

據Sakana AI團隊所稱，這是全AI生成論文首次在真實學術評審環境中獲得通過接收線的成績。

這也標志著同行評審，真正迎來了「圖靈測試」時刻。

AI審稿人比人類更靠譜？

如果AI一天能花幾百美元寫出幾十篇論文，人類審稿系統瞬間就會崩潰。

想讓AI科研實現指數級爆發，就必須有能夠大規模評估質量的「自動化裁判」。

Sakana AI給出的答案是：直接讓AI來當Area Chair（領域主席）。

他們構建了一個高度還原NeurIPS官方審稿流程的自動化系統：

5個獨立的AI審稿人進行背靠背挑刺，最后由1個AI元審稿人進行共識匯總和最終裁決。

在與數千條真實OpenReview人類審稿決策的硬碰硬對比中，自動化審稿人交出了69%的平衡準確率。

令人震驚的是，在作者設定的評測框架下，自動審稿系統的部分指標優于所對照的人類一致性結果。

有人質疑：AI是不是偷偷背過題？

團隊特意用知識截止日期（2025年）之后的全新論文進行了數據污染測試。

結果依然堅挺：平衡準確率保持在66%，達到可與人類頂級學者比肩的實戰水準。

這表明，AI正在進入過去長期由人類主導的科研流程核心環節。

過去，人類同時壟斷了「寫論文的人」和「決定論文是否成立」這兩個關鍵角色。

現在，這兩個角色都在被AI切入。

一旦評審環節也被自動化，AI科研就不再是零星爆款，而具備了大規模、左右互搏式迭代的基礎設施。

該自動審稿系統在頂級會議（ICLR）發表的AI論文上，其審稿判斷與人類審稿人一致，包括在模型訓練完成之后（即超出其「知識截止日期」）發表的論文。這些結果表明，該自動審稿系統在為新撰寫的AI論文提供評審分數方面，可靠性與人類審稿人相當。

科研的Scaling Law

如果說「過審」證明了AI科研站得住，那真正決定未來天花板的是另一件事：

它是不是可持續變強？

Nature論文中最具顛覆性的一組數據，揭示了潛藏在AI科研背后的全新定律。

研究發現，底層大模型的能力與生成論文的質量之間，呈現出令人頭皮發麻的極度顯著正相關（P<0.00001）。

隨著模型發布日期推進，AI產出的論文質量持續陡峭上升。

同時，算力正在暴力改寫科研法則。

投入的測試時算力越多，智能體樹搜索的深度就越深，實驗質量就越扎實，最終的產出評級就越高。

當前最頂配的AI科學家，其平均產出已經逼近機器學習頂會workshop的邊緣錄用（borderline accept）水平。

這背后展示的是一條正在形成的「科研Scaling Law」。

過去的科技突破，依賴于虛無縹緲的靈光乍現，而未來的科學發現，將變成一條可精確計算的工業流水線。

隨著模型能力呈指數級增長、推理算力成本呈指數級下降，這套系統會自動升級，這才是這項工作真正展現出恐怖勢能。

根據自動評審員的評判，當使用更新、更智能的基礎模型時，AI Scientist生成的論文質量會提高。

AI全面接管科研

我們準備好了嗎？

當然，這篇Nature論文，同樣也指出了The AI Scientist的目前的局限性：

它偶爾會想出幼稚的idea，寫的代碼會有bug，論文里會出現引用的幻覺，甚至在附錄里重復粘貼同一張圖表。

值得警惕的是，論文顯示該系統具備自動調試、重試運行和在受限計算預算下持續迭代實驗的能力。

這意味著，未來更強的科研代理一旦出現規避約束的傾向，可能帶來新的安全治理問題。

如果這種系統被毫無節制地釋放，海量生成的低門檻論文會瞬間壓垮整個學術生態，學者的學術 credentials（資歷證明）將被徹底稀釋。

正因如此，Sakana AI采取了極其克制的立場：主動撤稿、通過IRB審批、呼吁添加生成水印，并急迫要求社區建立全自動AI科研規范。

這篇Nature論文不只是展示AI技術的里程碑，更是把AI所帶來的倫理爭議也擺上臺面。

真正的問題早已不是「AI能不能做科研」，而是「當AI開始獨立做科學，誰來定義什么算科學」。

正如團隊所設想的終極愿景：AI科學家不會讓人類科學家消失，但人類科學家的角色，必須被迫向著科研價值鏈的更上游遷徙：

去定義問題、設定邊界、決定哪些發現值得被相信。

參考資料：

https://sakana.ai/ai-scientist-nature/%20

https://www.nature.com/articles/s41586-026-10265-5%20

https://x.com/SakanaAILabs/status/2036840833690071450%20

https://x.com/hardmaru/status/2036841736702767135

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

邀請函｜ICLR 2026中稿先講，在這場預講會遇見你的學術同行

DeepTech深科技 2026-04-07 18:37:24
0 跟貼 0
具身Scaling Law押對了！獨角獸新品1小時學會新任務，成功率99%

量子位 2026-04-06 13:15:17
0 跟貼 0

AI智能體不是越多越強：信息冗余構成了LLM Agent Scaling的瓶頸

機器之心Pro 2026-02-27 14:45:03
1 跟貼 1

壞了，我成AI的乙方了！Anthropic論文爆火，誰還敢無腦Copy？

新智元 2026-04-07 20:12:55
0 跟貼 0
預測下一個像素還需要幾年？谷歌：五年夠了

機器之心Pro 2025-11-26 15:48:35
0 跟貼 0

機器人交稅養打工人！奧特曼AI新政曝光，上4休3要成真？

新智元 2026-04-07 20:12:55
0 跟貼 0

鵬城聚英才,深圳技術大學潤園青年學者論壇啟幕

南方都市報 2026-04-07 19:49:07
0 跟貼 0
賈淺淺論文抄襲：最打臉西北大學，最受傷是學生

胡言炫語 2026-04-07 02:36:09
9 跟貼 9

作者很可能照單全收審稿人推薦的文獻——一本消化病學期刊的例子

醫咖會 2025-10-27 19:53:01
0 跟貼 0
1103衛臨一句玉福晉新喪解了甄嬛困境，葉瀾依用安小鳥的科研遺產

幻舞電影 2026-04-06 20:01:18
1 跟貼 1
論文 Figure 這樣排版，審稿人一眼就能鎖定創新點（附贈 5 套模版）

生物學霸 2025-11-11 17:23:39
0 跟貼 0
學術界的「上帝視角」來了全人類科研版圖第一次被鋪開

新智元 2026-03-16 21:48:19
0 跟貼 0
畢業論文Ai率太高怎么辦？

河右生 2026-04-03 18:08:11
0 跟貼 0
易中天，獲獎勵20萬元

極目新聞 2026-04-06 21:04:19
26180 跟貼 26180
陳麗華47歲倒追遲重瑞財富傳承披露：1兒2女均在富華

極目新聞 2026-04-07 12:39:33
1721 跟貼 1721
賈淺淺上熱搜，“世襲罔替”的學術夢

難得君 2026-04-07 10:03:28
12 跟貼 12
無頭人讓他對科學有了質疑

小島影視菌 2026-04-04 15:48:53
1 跟貼 1
印度學者十年前神預言：到我孫子輩印度也趕不上中國

野模之家 2026-04-05 13:56:51
1 跟貼 1
2026美國高端學術資源機構測評與選擇建議

城市探報 2026-04-06 23:31:17
0 跟貼 0
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294
伊朗頂級核科學家拉明·哈桑被聯軍炸死在伊斯法罕地下鈾礦設施中

軍武大狼 2026-04-05 03:09:22
807 跟貼 807
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
1 跟貼 1
和尚到死都不信科學

快樂追劇吧 2026-04-06 08:21:02
1 跟貼 1
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2675 跟貼 2675
一論文涉嫌抄襲，作者卻稱自己沒投稿過，期刊悄悄把論文移除

醫咖會 2026-02-19 10:10:03
2 跟貼 2
作者多次要求論文更正未得到期刊回應，隨后竟自行發布撤稿聲明

醫咖會 2026-02-11 21:51:29
0 跟貼 0
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
124億！科學家預警人口峰值：地球已不堪重負，進入崩潰倒計時？

丞丞故事匯 2026-04-07 15:52:45
0 跟貼 0
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
177 跟貼 177
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
16 跟貼 16
國家繼續實施調控成品油價格適當調整

財聯社 2026-04-07 15:04:33
1125 跟貼 1125
7999. 印度學者：若中印發生戰爭，印度戰機將無機會起飛

財富基因007 2026-04-07 01:43:50
0 跟貼 0
鄭麗文率團抵達南京開始大陸參訪行程

央視新聞客戶端 2026-04-07 19:03:20
42 跟貼 42
科學已經無法解答這叫聲了

大海會剪輯 2026-04-07 09:41:52
1 跟貼 1
谷婭溦突然退出評審，《中年好聲音4》風向要變？

下次再見吧 2026-04-06 06:57:43
1 跟貼 1
賈淺淺背后的大佬，還在裝聾作啞

亮見 2026-04-07 14:45:45
2 跟貼 2
生活頻繁的女性，絕經時間會越晚嗎？聽聽科學家的真理！

桔子笑笑 2026-04-05 13:15:17
2 跟貼 2
河南中醫藥大學：一核雙驅·五維賦能打造教育數字化新范

大象新聞 2026-04-07 19:41:07
0 跟貼 0
陜西軍創集團攜手西安航空學院共建實習實訓基地

西北信息報 2026-04-07 20:18:05
0 跟貼 0
谷婭溦宣布暫別《中年好聲音4》并解釋內情，網民競猜接任評審

仙味少女心 2026-04-05 17:55:37
10 跟貼 10

劉思齊晚年曾說：毛岸英入朝之前，曾反復問過毛主席一個問題

劉思齊晚年曾說：毛岸英入朝之前，曾反復問過毛主席一個問題

老謝談史

2026-04-07 00:16:17

鄭麗文訪陸受高規格禮待，隨行的13人，各個身份不簡單

鄭麗文訪陸受高規格禮待，隨行的13人，各個身份不簡單

石江月

2026-04-07 17:09:01

當年的汗馬功臣，已成上不了臺面的炸雞，館長與鄭麗文的冷暖真相

當年的汗馬功臣，已成上不了臺面的炸雞，館長與鄭麗文的冷暖真相

拾這一抹殘妝月

2026-04-02 22:05:10

“余生好好走”，知名央視主持人王小丫，病床上的留言字字催淚

“余生好好走”，知名央視主持人王小丫，病床上的留言字字催淚

近史談

2026-03-31 18:57:49

1920年，一位俄羅斯醫生突發奇想，把猴子的睪丸，植入到老頭體內

1920年，一位俄羅斯醫生突發奇想，把猴子的睪丸，植入到老頭體內

歲月有情1314

2026-04-07 07:26:46

我接妻子下班，一男子突然拉住我，兄弟這我女友

我接妻子下班，一男子突然拉住我，兄弟這我女友

林林先生

2026-03-26 15:05:39

阿爾忒彌斯2號拍的地球和月球，和我們平時看到的不一樣

阿爾忒彌斯2號拍的地球和月球，和我們平時看到的不一樣

空天論道

2026-04-06 20:30:03

民進黨，極有可能在下一屆臺灣地區選舉后，成為長期一家獨大政黨

民進黨，極有可能在下一屆臺灣地區選舉后，成為長期一家獨大政黨

李橑在北漂

2026-04-02 10:22:26

現役球員進NBA名人堂的概率！4人100%，哈登99%，利拉德出乎意料

現役球員進NBA名人堂的概率！4人100%，哈登99%，利拉德出乎意料

麥子的籃球故事

2026-04-07 17:44:51

韓國人對中國的大小到底有什么誤解，網友：上午逛上海下午逛成都

韓國人對中國的大小到底有什么誤解，網友：上午逛上海下午逛成都

愛下廚的阿釃

2026-04-07 10:27:49

都長這么大了，愛看不看，別指指點點的

都長這么大了，愛看不看，別指指點點的

飛娛日記

2026-04-01 10:50:54

年人均分紅47萬元，四口之家躺賺近200萬，這個深圳小村確實豪橫

年人均分紅47萬元，四口之家躺賺近200萬，這個深圳小村確實豪橫

匹夫來搞笑

2026-04-07 17:03:49

國足又迎喜訊！24歲華裔悍將愿意歸化，但提了一個條件，不算過分

國足又迎喜訊！24歲華裔悍將愿意歸化，但提了一個條件，不算過分

零度眼看球

2026-04-07 06:48:41

某央企地產，大領導被抓了！

地產八卦

2026-04-07 07:54:52

陳麗華走了，“唐僧”怎么辦？

獎一罰十

2026-04-07 15:22:46

全紅嬋陳芋汐微信群事件：群規禁止攻擊其他運動員，全紅嬋除外

全紅嬋陳芋汐微信群事件：群規禁止攻擊其他運動員，全紅嬋除外

一盅情懷

2026-04-06 16:15:41

不演了？畸形兒傳聞真相大白僅2天，闞清子被曝猛料，孫怡贏麻了

不演了？畸形兒傳聞真相大白僅2天，闞清子被曝猛料，孫怡贏麻了

論事的老樞

2026-04-06 20:45:22

郭晶晶一家廣西爬山，霍啟剛累到臉色慘白，看路人懟娃拍明顯生氣

郭晶晶一家廣西爬山，霍啟剛累到臉色慘白，看路人懟娃拍明顯生氣

阿傖說事

2026-04-07 17:48:02

陳光標變現大勞捐千萬后續！曝嫣然已退款，原因炸裂，果然有貓膩

陳光標變現大勞捐千萬后續！曝嫣然已退款，原因炸裂，果然有貓膩

億通電子游戲

2026-04-07 17:54:26

小米汽車賣不動了

新浪財經

2026-04-05 18:47:28

AI產業主平臺領航智能+時代

14918文章數 66754關注度

往期回顧全部

科技要聞

滿嘴謊言！OpenAI奧特曼黑料大起底

頭條要聞

美軍拯救飛行員差一點失敗從40英里外用攝像頭對準他

頭條要聞

美軍拯救飛行員差一點失敗從40英里外用攝像頭對準他

體育要聞

官宣簽約“AI球員”，這支球隊被罵慘了...

娛樂要聞

女首富陳麗華離世被曝生前已分好遺產

財經要聞

10萬億財政轉移支付，被誰拿走了？

汽車要聞

不止是大極狐首款MPV問道V9靜態體驗

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

家居

手機

數碼

公開課

本地新聞

跟著歌聲游安徽，聽古村回響

家居要聞

雅致愜意感知生活之美

溫馨多元愛的具象化
歲月靜好典雅新章
經典配色晝色銀河

手機要聞

傳聞蘋果闊折疊命名iPhone Ultra，曝國內同品類新機也考慮跟進

數碼要聞

1999元就能買Mini LED電視海信Vidda小鋼炮S Mini開售

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<pre id="u2cln"><strike id="u2cln"></strike></pre>

<em id="u2cln"></em>