<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      科學能否預測一項研究何時站不住腳?某學科越來越不關心科學的事,被邊緣化是求仁得仁

      0
      分享至


      Brian Nosek 是開放科學中心的執行主任。在 2010 年代,Nosek 博士及其同事重復了 100 篇心理學論文,但只有 39% 的時間結果與原始結果相符。

      卡爾·齊默

      自 2011 年以來,卡爾·齊默一直在報道科學領域的可重復性問題。

      2026年4月1日

      開展研究很難,驗證研究結果也很難。一項新的重要研究發現,人工智能目前還無法提供幫助。

      科學家每年發表超過一千萬篇研究論文和其他出版物。其中一些發現將豐富人類的知識寶庫,但有些則是錯誤的。

      為了評估一項研究,科學家可以重復該研究,以檢驗是否能得到相同的結果。但七年前,一個由數百名科學家組成的團隊著手尋找一種更快捷的方法來評判新的科學文獻。他們構建了人工智能系統,用于預測研究是否經得起推敲。

      該項目由美國國防高級研究計劃局(DARPA)資助,名為“系統化開放研究和證據的信心”(簡稱SCORE)。其構想源于當時DARPA的項目經理亞當·羅素。他設想為科學建立一種類似信用評分的體系。

      “人們可能會說,‘嘿,這很可能是可靠的,我們可以以此為基礎制定政策,’”目前在南加州大學任教的拉塞爾博士說?!啊沁@個呢?嗯,這或許能寫成一本在機場里賣的書。’”

      SCORE團隊審查了數百項研究,并對其中許多研究進行了重復測試,以更好地了解哪些因素能夠使研究結果經得起時間的考驗。現在,他們正在發表一系列關于這些研究成果的論文。

      研究人員表示,目前科學的信用評分仍然只是一個夢想。人工智能還無法做出可靠的預測。

      “我們還沒達到目標,”開放科學中心執行主任兼該項目負責人布萊恩·諾塞克說?!八_實接收到了一些信號,但要獨立使用,精度還需要大幅提高?!?/p>

      但外部專家表示,在此過程中,SCORE 團隊對科學過程進行了非常深入的研究,發現了有助于改進該過程的線索。

      “我認為以前從未有過如此大規模的嘗試,”牛津大學心理學家多蘿西·畢曉普說道,她并未參與這項研究。

      自己看看吧

      重復性研究一直是科學發展的重要支柱。1953年,加州理工學院的地球化學家克萊爾·帕特森利用一種新技術測定出地球的年齡為45億年,比之前的估計值大了12億年,這一結果令科學家們震驚不已。

      “我遇到了一些世界上最優秀、最有能力的評論家,他們竭盡全力想推翻我的數據,”帕特森博士后來回憶道。“他們絞盡腦汁,試圖證明我錯了。”然而,無論他們如何努力,他的數據始終沒有改變。

      但有時重復實驗的結果并不一致。1976年,考古學家在智利蒙特維德發現了一處古代狩獵營地,并確定其距今約14500年,比此前在美洲發現的人類活動證據要古老得多。

      時隔近50年,一個獨立的科學家團隊重復了這項研究。上個月,他們得出了截然不同的結論:蒙特維德地區在4200至8200年前就有人居住。

      原研究的作者對這一新發現提出異議;可能需要更多研究來解決這一沖突。科學就是這樣自我修正的。

      至少,理論上應該是這樣。但重復先前的研究需要耗費時間和金錢,而研究人員可能更愿意將這些資源投入到自己的研究中。而且,期刊編輯通常對重復研究不感興趣。

      新墨西哥州圣塔菲研究所的人工智能研究員梅蘭妮·米切爾最近復現了一篇人工智能論文,但未能得到與原論文相同的結果。一家期刊以缺乏創新性為由拒絕了她的論文。

      “我真的很討厭這種文化,”米切爾博士上個月在耶魯大學的一次講座上對聽眾說。

      解決一個“棘手問題”



      上圖為克萊爾·帕特森,她在 20 世紀 50 年代計算出地球的年齡比之前估計的要大 12 億年;下圖為梅蘭妮·米切爾,她是新墨西哥州圣塔菲研究所的人工智能研究員,攝于 2023 年。

      信用...

      加州理工學院;《紐約時報》的艾莉婭·馬爾科姆

      15 年來,一些科學家一直試圖改變這種文化。他們首先記錄了問題的嚴重程度。2010 年代初期,諾塞克博士及其同事重復了 100 篇心理學論文,結果只有 39%與原始結果相符。

      在另一個項目中,諾塞克博士與癌癥生物學家合作,在動物和人類細胞上重復了50項實驗。但只有不到一半的結果經受住了他們的審查。

      美國國防高級研究計劃局(DARPA)的羅素博士想知道,科學家能否利用人工智能來預測一項研究的可信度。但首先,科學家們需要收集更多關于可重復性的數據?!拔抑肋@是一個棘手的問題,”他說。

      SCORE 項目始于2019 年,并發展壯大到包括 865 名研究人員。他們分析了 2009 年至 2018 年間發表的 3900 篇論文,這些論文涵蓋了犯罪學、經濟學、心理學和社會學等社會科學領域。

      在一項研究中,SCORE團隊重復了164項研究。團隊成員重新進行了部分實驗,并招募志愿者再次參加原始測試。對于基于政府統計數據的研究,SCORE團隊成員獲取了相關數據并進行了分析。

      只有大約一半的重復研究得出了與原始研究相同的結果。

      惠特曼學院的生物學家蒂姆·帕克(Tim Parker)并未參與這項研究,他表示,這一低比率與之前規模較小的研究結果一致。

      “我認為這些結果非常有說服力,”他說?!拔蚁M切┲皩嵶C研究結果不以為然的人,能夠被這些結果說服?!?/p>

      帕克博士和其他研究人員對科學家們使用不同方法研究同一數據的做法表示擔憂。他們認為,即使這些方法都合理,也可能導致相互矛盾的結果。

      SCORE團隊評估了科學家使用不同方法時研究結果的可靠性。團隊成員挑選了100篇論文,并為每篇論文分配了至少五個專家團隊。每個團隊都運用各自的方法分析原始數據。

      諾塞克博士說:“很多時候,這些選擇會產生重大影響?!痹赟CORE試驗中,只有約57%的情況下,所有五個團隊都得到了與原始研究大致相同的結果。他們只有三分之一的時間得到了完全相同的結果。

      SCORE 團隊還考慮了數據問題以及用于分析的計算機程序中的問題如何導致復制失敗。

      研究人員使用與原作者相同的代碼分析了143篇論文中的數據。約9%的SCORE結果與原始結果完全不同;另有14%的結果僅大致相同。

      圖像


      Andrew Tyner, a principal research scientist at the Center for Open Science. “It’s still not that impressive,” he said of A.I. efforts to replicate results. “But there might be some there there.”

      信用...

      Cornell Watson for The New York Times

      渥太華大學的經濟學家阿貝爾·布羅德爾表示,他在自己的科學測試項目——復制研究所——中也遇到過類似的問題。這些故障可能是由于科學家在格式化數據或編寫程序時出錯造成的?!坝袝r候,代碼錯誤簡直匪夷所思,”他說。

      實際情況可能比SCORE研究表明的還要糟糕,因為科學家們常常不愿分享數據和代碼。當SCORE團隊不得不自行編寫代碼來分析數據時,他們成功復現相同結果的次數不到一半。

      羅素博士曾希望人工智能系統能夠利用 SCORES 項目的研究結果進行訓練,從而學習判斷一篇論文能否成功復現的關鍵特征。但 SCORE 團隊發現,復現的奧秘似乎仍然深不可測;人工智能的預測并非完全隨機,但也遠非完美。

      “這仍然不算令人印象深刻,”開放科學中心首席研究科學家、這項新研究的作者之一安德魯·泰納說?!暗蛟S其中蘊含著一些有價值的信息?!?/p>

      但這并不意味著專家可以完全相信自己的直覺。SCORE項目招募了數百名專家來預測論文是否能夠成功重復。在審查了132項重復實驗后,SCORE團隊發現專家們的預測大約有四分之三的概率是正確的。

      對于諾塞克博士來說,SCORE 的主要價值在于展示了科學過程的復雜性,并突出了改進科學過程的方法。

      例如,科學家可以提前公布實驗計劃,這可以防止他們為了適應最終獲得的數據而調整假設。

      布羅德爾博士表示,期刊可以通過要求作者分享原始數據和代碼來提供幫助。“人們已經清理了他們留下的爛攤子,”他說。

      美國國立衛生研究院院長杰伊·巴塔查里亞博士在一次采訪中表示,該機構正在研究如何改進可復制性。

      他說:“科學是通過重復實驗來確定真理的。我覺得現在這種方法不太奏效?!?/p>

      從今年開始,該機構計劃推出新的數據和代碼共享工具。它還將遴選不同領域的關鍵理念,并頒發資助金以支持這些理念的復制。此外,該機構正在籌建一份期刊,巴塔查里亞博士將其描述為“一個可以發表你的復制研究成果并獲得認可的平臺”。

      匹茲堡大學醫學院的生物化學家、美國國家普通醫學科學研究所前所長杰里米·伯格(Jeremy Berg)是巴塔查里亞博士的批評者,他將巴塔查里亞博士的計劃描述為“極其天真”。

      伯格博士警告說,像集中式數據平臺和關鍵理念復制這樣的項目,只有政府做出昂貴的長期投入才能奏效。僅僅提供更多發表復制研究的機會,本身并不能使大學在決定招聘和終身教職時重視這些研究。

      “我認為還沒有人破解了這個密碼,”他說。

      諾塞克博士告誡說,無論研究人員在工作中投入多少精力,他們有時仍然會犯錯。

      “探索知識前沿總是充滿挑戰,無論你研究的是什么問題都一樣,”諾塞克博士說?!澳銜洑v很多次失敗,也會遇到很多不合邏輯的事情。”


      Can Science Predict When a Study Won’t Hold Up?

      Conducting research is hard; confirming the results is, too. And artificial intelligence isn’t yet ready to help, a major new study finds.

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      今日三月初一,牢記1不洗,2不出,3不起,4要吃,安康吉祥日子旺

      今日三月初一,牢記1不洗,2不出,3不起,4要吃,安康吉祥日子旺

      小茉莉美食記
      2026-04-17 00:35:03
      身體這處毛發變白,暗示活得不長?看看你白了沒有

      身體這處毛發變白,暗示活得不長?看看你白了沒有

      白話電影院
      2026-04-05 22:42:04
      正式通知!5月1日起嚴查嚴處,別踩法律紅線

      正式通知!5月1日起嚴查嚴處,別踩法律紅線

      金哥說新能源車
      2026-04-15 19:16:44
      交警提醒:新交規落地,高速143km/h不扣分,龜速行車直接扣3分!

      交警提醒:新交規落地,高速143km/h不扣分,龜速行車直接扣3分!

      復轉這些年
      2026-04-14 12:14:50
      “這次穿得算保守了”,女老師短裙配蕾絲襪,學生上課頭都不敢抬

      “這次穿得算保守了”,女老師短裙配蕾絲襪,學生上課頭都不敢抬

      妍妍教育日記
      2026-03-21 10:05:03
      毛焦爾新官上任,第一把火先燒到中國,對華稱呼改變,目的太明顯

      毛焦爾新官上任,第一把火先燒到中國,對華稱呼改變,目的太明顯

      娛樂圈的筆娛君
      2026-04-16 16:25:43
      北京電影節開幕式紅毯:高圓圓舒淇好美,高葉造型亮眼,尹正瘦了

      北京電影節開幕式紅毯:高圓圓舒淇好美,高葉造型亮眼,尹正瘦了

      八卦先生
      2026-04-16 23:19:54
      丁俊暉近年世錦賽成績盤點:去年結束連續4年一輪游,今年有望再戰趙心童

      丁俊暉近年世錦賽成績盤點:去年結束連續4年一輪游,今年有望再戰趙心童

      林子說事
      2026-04-16 19:28:26
      章子怡結束八年婚姻后落淚坦言:若百億富豪當年沒掏出那張紙,絕不嫁三婚的汪峰!

      章子怡結束八年婚姻后落淚坦言:若百億富豪當年沒掏出那張紙,絕不嫁三婚的汪峰!

      史海孤雁
      2026-04-14 20:59:20
      網壇名將正式退役!最高排名世界第1位,曾7奪大滿貫冠軍

      網壇名將正式退役!最高排名世界第1位,曾7奪大滿貫冠軍

      全景體育V
      2026-04-16 07:56:45
      臺灣突然宣布重磅決定,島內數萬人聯名反對,鄭麗文成眾望所歸

      臺灣突然宣布重磅決定,島內數萬人聯名反對,鄭麗文成眾望所歸

      共工之錨
      2026-04-16 13:35:35
      女主播直播吃“蛇肉”猝死,吐出紅黑物質,醫生表示:吃的不是蛇

      女主播直播吃“蛇肉”猝死,吐出紅黑物質,醫生表示:吃的不是蛇

      草莓解說體育
      2026-04-16 13:24:49
      產能排到2028!光模塊海外加速擴產  8大唯一性設備龍頭量價齊升

      產能排到2028!光模塊海外加速擴產 8大唯一性設備龍頭量價齊升

      元芳說投資
      2026-04-16 06:30:16
      心梗是喝茶喝出來的?醫生:即使是鐵打的心臟,這幾種茶也要少喝

      心梗是喝茶喝出來的?醫生:即使是鐵打的心臟,這幾種茶也要少喝

      醫學原創故事會
      2026-04-16 23:44:09
      印度套中國技術落空,幾億買的設備吃灰,美媒:印度雄心被重創

      印度套中國技術落空,幾億買的設備吃灰,美媒:印度雄心被重創

      王新喜
      2026-04-16 17:15:12
      決然赴死!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機

      決然赴死!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機

      愛吃醋的貓咪
      2026-04-14 22:01:04
      縣委書記被雙規后,45歲副縣長約書記19歲女兒爬山,說有要事相談

      縣委書記被雙規后,45歲副縣長約書記19歲女兒爬山,說有要事相談

      秋風專欄
      2025-04-15 17:16:42
      韓媒:180°反轉,樊振東“最后時刻”回歸幫助中國男乒衛冕?

      韓媒:180°反轉,樊振東“最后時刻”回歸幫助中國男乒衛冕?

      順靜自然
      2026-04-16 18:51:41
      歐洲媒體緊張:加45%關稅也擋不住,中國電動車橫掃歐洲

      歐洲媒體緊張:加45%關稅也擋不住,中國電動車橫掃歐洲

      趣味萌寵的日常
      2026-04-16 00:54:50
      這是迄今為止,我見過身材最美的女人之一,不接受反駁

      這是迄今為止,我見過身材最美的女人之一,不接受反駁

      小椰的奶奶
      2026-04-11 12:33:07
      2026-04-17 03:35:00
      科學的歷程 incentive-icons
      科學的歷程
      吳國盛、田松主編
      3183文章數 15015關注度
      往期回顧 全部

      科技要聞

      趙明:智駕之戰,看誰在大模型上更高效

      頭條要聞

      特朗普宣布黎以將?;鸷?以軍大規模空襲黎巴嫩

      頭條要聞

      特朗普宣布黎以將?;鸷?以軍大規??找u黎巴嫩

      體育要聞

      皇馬拜仁踢出名局,但最搶鏡的還是他

      娛樂要聞

      絲芭傳媒創始人王子杰去世,享年63歲

      財經要聞

      海爾與醫美女王互撕 換血抗衰誰的生意?

      汽車要聞

      空間大五個乘客都滿意?體驗嵐圖泰山X8

      態度原創

      親子
      游戲
      本地
      公開課
      軍事航空

      親子要聞

      孩子被傷害,不要去責備媽媽!

      《荒野大鏢客3》最全新情報!前傳還是新故事?

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      封鎖霍爾木茲海峽后 美釋放雙重信號

      無障礙瀏覽 進入關懷版