<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI科學家登上Nature,論文從構思到發表全自動化,一篇已通過評審

      0
      分享至

      幾小時前,Nature 宣布了真正意義上的 AI 科學家的首次實現。由“Transformer 八子”之一聯合創辦的日本 Sakana AI 與英國牛津大學、英屬哥倫比亞大學的研究團隊打造了一個從零開始搞科研的 AI,實現了從構思到論文發表的完整端到端自動化,并有 AI 論文通過國際頂會 ICLR 2025 同行評審,這是 AI 科研范式的突破,觸及了人類創造力的邊界。


      圖 | 被選中的 AI 論文節選(來源:https://www.nature.com/art)

      值得注意的是,來自英國牛津大學的 Chris Lu 和來自英屬哥倫比亞大學的 Cong Lu 是共同一作之一。


      圖 | 從左到右:Chris Lu 和 Cong Lu(來源:資料圖)

      研究中,他們造出了一個叫 AI 科學家( AI Scientist)的系統,從想點子、寫代碼、跑實驗、分析數據,到寫論文、自己審稿,全由AI自己完成。

      更讓人震驚的是,其中一篇完全由AI生成的論文,投到了 ICLR 2025 的一個研討會,拿到了 6 分、7 分、6 分的評審分數,超過了這個研討會平均的錄取線。這篇論文如果沒被主動撤稿,大概率會被接收。


      (來源:https://www.nature.com/articles/s41586-026-10265-5)

      據了解,AI 科學家的工作流程分成四塊。

      第一步是想點子。

      它被喂進一個研究領域后,會自己生成一批研究方向,每一條都帶著標題、研究理由、實驗方案,還給自己打分,有趣程度、新穎程度、可行性,1 到 10 分自己評。然后它連上 Semantic Scholar 的學術搜索引擎,把跟已有工作太像的點子扔掉。

      第二步是做實驗。

      這里分兩種模式。

      第一種是模板模式,研究人員先給它一段能跑通的代碼做起點,它在這個基礎上想新點子,然后叫一個叫 Aider 的代碼助手來改代碼、跑實驗,出錯了自己看日志、自己修,修好了繼續跑。

      另一種是無模板模式,它連起點代碼都沒有,得從零開始寫。這時候它會搞一個樹形搜索,一個點子長出好幾個分支,每個分支跑不同參數、不同設置,跑完一輪選最好的那個繼續往下走。這個過程會并行跑很多個節點,誰效果好誰被選中繼續深挖。

      第三步是寫論文。

      它把自己實驗里記的筆記、生成的圖表填進一個標準的 LaTeX 模板里,一節一節地寫,引言、方法、結果、結論,全齊。要寫相關工作部分的時候,它再去查 Semantic Scholar,把相關的論文找出來,然后讀摘要和寫引用。寫完還會自己編譯 LaTeX,報錯了自己改,最多可以改五次,直到出一份能看的 PDF。

      第四步是自己審稿。

      研究團隊還造了一個自動化審稿器,照著 NeurIPS 的審稿指南,對論文打分,給優點、缺點、倫理問題,最后給一個接受或拒絕的建議。五份獨立審稿結果匯總,再由它自己當領域主席做一個綜合判斷。

      這個自動化審稿器不是隨便做的,研究團隊拿它跟真實的人類審稿記錄做了對比。他們從 OpenReview 上拿了 ICLR 的論文數據,讓自動化審稿器打分,結果它的平衡準確率達到 了69%,跟人類審稿人的 66% 差不多。

      在 F1 分數上,它甚至比 NeurIPS 2021 那個著名的審稿一致性實驗里的人類審稿人之間的一致性還高。這意味著自動化審稿器打出來的分數,跟一個真實的人類審稿專家基本在一個水平線上。

      他們還專門測了數據污染的問題。模型訓練時用的數據可能包含 2017 到 2024 年的論文,所以他們又拿 2025 年出的新論文測了一遍,結果平衡準確率降到了 66%,仍然和人類審稿人持平。這說明自動化審稿器不是靠背答案,它其實是真的能夠自己判斷論文質量。


      (來源:https://www.nature.com/articles/s41586-026-10265-5)

      研究團隊還發現了一個規律,AI 科學家生成的論文質量,跟它底下用的基礎模型強相關。他們用不同時間發布的模型跑同一套流程,從較老的模型到最新的模型,生成的論文評分一直在漲。這說明隨著基礎模型越來越強,AI 科學家寫出來的論文也會越來越接近人類水平。

      同時,給 AI 科學家分配的計算資源越多,它寫出來的論文質量也越高。這有點像給一個研究生更多時間做實驗,最后成果也會更好。這兩個趨勢加在一起,意味著未來 AI 科學家的能力會隨著模型升級和算力增長持續提升。


      (來源:Nature)

      被研討會評審看上的那篇論文,研究的是深度學習里的一個負向結果,正好契合那個叫 ICBINB 的研討會主題。這篇論文由AI科學家在無模板模式下生成,從頭到尾沒有人類修改過。它從選題、設計實驗、跑代碼、出圖表、寫 LaTeX,全部是自己完成的。

      研究團隊一共投了三篇,只有這一篇過了線,另外兩篇沒達標。這說明 AI 科學家目前還不是每次都能寫出高質量論文,但這明確證明 AI 寫出來的東西已經能騙過人類審稿人,讓它以為自己是在審一個人類研究生的作業。

      當然,AI 科學家現在還遠不夠完美。它偶爾會想出很幼稚的點子,方法論不夠嚴謹,寫代碼時會出各種 bug,還會產生幻覺,比如引文明明是錯的它硬說對,或者附錄里把同一張圖放兩遍。

      不過,研究團隊發現在機器學習這個領域,很多技術剛出現時都不完美,甚至漏洞百出,但只要它能讓做出來這件事本身成立,后續通過擴大規模、更好的模型、更優的技術,這項能力就會迅速提升,進而很快超越人類水平。

      總的來說,這項工作的意義遠遠不止讓 AI 寫幾篇論文,它把整個科研流程從頭到尾連起來了,從想點子到做實驗到寫論文到審稿,全在計算機里跑通。

      未來可以用 AI 來加速科研,比如在藥物發現、材料設計、氣候建模這些領域,讓 AI 科學家 7×24 小時地跑實驗、試方向,而人類科學家只需要在關鍵節點做判斷和選擇。

      同時,研究團隊在論文最后也提到了風險,比如AI論文洪流可能會壓垮現有的審稿系統,或者有人拿 AI 灌水、批量發假論文。所以他們主動把投出去的論文撤回來了,也在所有生成的論文里加了水印,方便識別。他們還建議學術界盡快建立規范,告訴人們 AI 寫的論文應該怎么標注和怎么對待。

      參考資料:

      相關論文https://www.nature.com/articles/s41586-026-10265-5

      https://www.linkedin.com/in/chris-lu-37471b119/

      https://chrislu.page/

      https://www.linkedin.com/in/cong-lu-530b74104/

      https://www.conglu.co.uk/

      https://sakana.ai/ai-scientist-nature/

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      消息人士:預計美伊雙方很快傳來“好消息”

      消息人士:預計美伊雙方很快傳來“好消息”

      財聯社
      2026-04-08 05:20:38
      85歲富商陳麗華去世,和老公互稱董事長遲先生,百億遺產早有安排

      85歲富商陳麗華去世,和老公互稱董事長遲先生,百億遺產早有安排

      新金牌娛樂觀察家
      2026-04-07 11:30:32
      歐冠1-2,姆巴佩破門難救主,皇馬主場不敵德甲霸主,瀕臨出局

      歐冠1-2,姆巴佩破門難救主,皇馬主場不敵德甲霸主,瀕臨出局

      側身凌空斬
      2026-04-08 04:53:05
      一場1-0,上演神劇情:補時絕殺,英超領頭羊險勝,歐冠征服客場

      一場1-0,上演神劇情:補時絕殺,英超領頭羊險勝,歐冠征服客場

      足球狗說
      2026-04-08 05:04:18
      “還真把自己當盤菜了”,北京職高女被全網嘲笑,含金量0人買單

      “還真把自己當盤菜了”,北京職高女被全網嘲笑,含金量0人買單

      妍妍教育日記
      2026-04-06 09:15:12
      陳光標豪車變現捐千萬后續!曝嫣然已退款,原因炸裂,果然有貓膩

      陳光標豪車變現捐千萬后續!曝嫣然已退款,原因炸裂,果然有貓膩

      阿纂看事
      2026-04-07 17:45:02
      即期布倫特原油價格漲至144.42美元/桶 創歷史新高

      即期布倫特原油價格漲至144.42美元/桶 創歷史新高

      財聯社
      2026-04-08 03:05:05
      又一艘護衛艦被擊沉,俄羅斯這次真急了

      又一艘護衛艦被擊沉,俄羅斯這次真急了

      史政先鋒
      2026-04-07 10:22:32
      開車致女友截癱后失聯男子首發聲,女子起訴男方并回應傳聞

      開車致女友截癱后失聯男子首發聲,女子起訴男方并回應傳聞

      大象新聞
      2026-04-07 15:37:04
      豪門悲喜夜:皇馬主場1-2失先機,阿森納做客1-0絕殺占先機

      豪門悲喜夜:皇馬主場1-2失先機,阿森納做客1-0絕殺占先機

      凌空倒鉤
      2026-04-08 05:28:31
      經伊朗這一戰,中美之間至少50年內不會爆發戰爭,理由主要有三點

      經伊朗這一戰,中美之間至少50年內不會爆發戰爭,理由主要有三點

      南權先生
      2026-04-07 15:31:40
      離譜!皇馬1.5億巨星浪費超級單刀放生拜仁 失誤致丟球仍攤手抱怨

      離譜!皇馬1.5億巨星浪費超級單刀放生拜仁 失誤致丟球仍攤手抱怨

      我愛英超
      2026-04-08 05:38:05
      因中國工人待遇問題,巴西將比亞迪列入“恥辱名單”

      因中國工人待遇問題,巴西將比亞迪列入“恥辱名單”

      互聯網大觀
      2026-04-07 15:43:15
      重慶一業主40萬賣房,買家重裝后69.8萬售出,第二買家以天花板有排污管道泄漏起訴,一審判業主擔責近80萬

      重慶一業主40萬賣房,買家重裝后69.8萬售出,第二買家以天花板有排污管道泄漏起訴,一審判業主擔責近80萬

      瀟湘晨報
      2026-04-07 08:41:11
      為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

      為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

      共工之錨
      2026-04-08 00:37:29
      陳麗華去世僅2天,小11歲老公遲重瑞過往被扒,他和翁帆處境一樣

      陳麗華去世僅2天,小11歲老公遲重瑞過往被扒,他和翁帆處境一樣

      一娛三分地
      2026-04-07 18:37:11
      命中了!伊朗真干了

      命中了!伊朗真干了

      互聯網大觀
      2026-04-07 22:31:40
      張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

      張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

      魯中晨報
      2026-04-07 17:13:05
      零緩沖!全國一刀切!6月1日起,車主自己去車管所“橫著走”!

      零緩沖!全國一刀切!6月1日起,車主自己去車管所“橫著走”!

      混沌錄
      2026-04-07 22:00:19
      陳麗華因病去世,病情曝光!

      陳麗華因病去世,病情曝光!

      陳意小可愛
      2026-04-07 13:33:25
      2026-04-08 06:27:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16549文章數 514855關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      特朗普:伊朗人愿為自由承受轟炸

      頭條要聞

      特朗普:伊朗人愿為自由承受轟炸

      體育要聞

      阿韋洛亞:諾伊爾是本場最佳;我們會帶著必勝的信念前往德國

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產

      財經要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態體驗

      態度原創

      家居
      健康
      教育
      親子
      公開課

      家居要聞

      雅致愜意 感知生活之美

      干細胞抗衰4大誤區,90%的人都中招

      教育要聞

      別再問“哪個專業最好”先問這3個問題!選錯專業=毀四年#新學期超給力

      親子要聞

      6歲女孩確診性早熟!醫生:小心這些“營養品”和“餐具”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版