<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Nature認(rèn)定的論文綜述神器來了

      0
      分享至

      聞樂 發(fā)自 凹非寺
      量子位 | 公眾號(hào) QbitAI

      AI寫論文這事兒確實(shí)不新鮮了,但天下苦假引用久矣。

      以往咱用大模型寫個(gè)綜述,看著像模像樣的,結(jié)果一查參考文獻(xiàn)——

      好家伙,論文不存在、期刊不存在、作者也不存在(扶額)。

      現(xiàn)在不用愁了,Nature新發(fā)表了一篇研究,艾倫人工智能研究所(Ai2)和華盛頓大學(xué)開源了一個(gè)叫OpenScholar的AI系統(tǒng),寫文獻(xiàn)綜述絕不瞎編。



      背靠整整4500萬篇科學(xué)論文庫(kù),直接把GPT-4o那種78%-90%的虛假引用率給干翻了。

      那么問題來了,大家都在編,OpenScholar為啥不編?

      自我反饋推理

      其實(shí)主要還是因?yàn)長(zhǎng)LM的底層邏輯就是預(yù)測(cè)下一個(gè)詞出現(xiàn)的概率。

      當(dāng)你問它一個(gè)非常生僻的學(xué)術(shù)問題時(shí),它為了維持語言的連貫性以及“我無所不知”的人設(shè)——

      會(huì)強(qiáng)行根據(jù)語料庫(kù)里的作者名、期刊名、標(biāo)題關(guān)鍵詞,拼湊出一個(gè)看起來最像真論文的…幻覺產(chǎn)物。

      還有,通用AI缺乏事實(shí)錨點(diǎn),讀過萬卷書結(jié)果全記串了。

      張教授寫過超導(dǎo),李教授寫過材料,當(dāng)你問它超導(dǎo)材料時(shí),它能面不改色地給你編出一篇《張教授與李教授關(guān)于超導(dǎo)材料的巔峰對(duì)話》……

      這種由于訓(xùn)練數(shù)據(jù)截?cái)嘁约?strong>缺乏真實(shí)文獻(xiàn)驗(yàn)證機(jī)制導(dǎo)致的假引用,真的太太太離譜了!



      OpenScholar就不一樣了,不再拍腦門預(yù)測(cè)下一個(gè)詞,直接接入了一個(gè)名為ScholarStore的龐大數(shù)據(jù)庫(kù)。

      這是目前公開的最大科學(xué)領(lǐng)域段落索引,全開源可下載,任何人都能本地部署或者擴(kuò)展。

      里面實(shí)打?qū)嵉卮媪?500萬篇論文的全文和摘要,再通過RAG技術(shù),讓每個(gè)知識(shí)點(diǎn)都背靠一篇真實(shí)存在的論文。

      當(dāng)你拋出一個(gè)科研難題,它會(huì)先在那個(gè)擁有2.37億個(gè)向量嵌入的超大數(shù)據(jù)庫(kù)里瘋狂檢索,把相關(guān)的論文片段全翻出來。

      給出初稿之后,帶著生成的“這里缺少討論”“這里引文不準(zhǔn)”“需要補(bǔ)搜最新進(jìn)展”等反饋再檢索、再改稿,通過搜索、生成、自我審查、再搜索、再修正這套閉環(huán),反復(fù)確認(rèn)輸出的內(nèi)容是不是真有論文支撐。

      這樣一來顯著降低了幻覺,提高了輸出內(nèi)容的覆蓋度和引文精度,整個(gè)管道還會(huì)被用來生成高質(zhì)量合成數(shù)據(jù),反哺訓(xùn)練。



      有多強(qiáng)?

      但是!如果只是搜得準(zhǔn),那它充其量是個(gè)高級(jí)搜索引擎,OpenScholar不止如此。

      它在知識(shí)合成的深度上,已經(jīng)開始正面硬剛?cè)祟悓<伊恕?/p>

      研發(fā)團(tuán)隊(duì)整了個(gè)叫Scholar QABench的測(cè)試集,涵蓋了計(jì)算機(jī)科學(xué)、物理、生物醫(yī)藥等最吃邏輯的領(lǐng)域,由3000個(gè)問題和250個(gè)長(zhǎng)篇專家答案構(gòu)成。

      在自動(dòng)測(cè)評(píng)上,OpenScholar-8B這個(gè)體量不算大的模型,在正確性上GPT-4o高出5%,比專業(yè)的PaperQA2也高出7%,引文準(zhǔn)確度和人類專家持平。



      團(tuán)隊(duì)還搞了個(gè)“人機(jī)大戰(zhàn)”雙盲實(shí)驗(yàn),把AI寫的答案和實(shí)打?qū)嵉牟┦俊⒀芯繂T寫的答案放一起,然后讓另一群頂級(jí)科學(xué)家來盲評(píng)打分。

      16位專家兩兩對(duì)比了108份學(xué)術(shù)答案。結(jié)果顯示,OpenScholar-8B的回答有51%比人類研究者親手寫的更好,升級(jí)組合版的OpenScholar-GPT4o勝率更是沖到70%,而普通GPT-4o只有32%。

      評(píng)審專家們普遍反饋,OpenScholar的優(yōu)勢(shì)集中在信息覆蓋更全面、結(jié)構(gòu)更清晰、邏輯連貫性更強(qiáng),實(shí)用價(jià)值也更高。

      作者團(tuán)隊(duì)

      這篇研究的一作Akari Asai是艾倫人工智能研究所研究科學(xué)家,2026年秋起將任卡內(nèi)基梅隆大學(xué)助理教授。

      在此之前她獲得了東京大學(xué)電氣工程與計(jì)算機(jī)科學(xué)專業(yè)的學(xué)士學(xué)位,后在華盛頓大學(xué)完成博士學(xué)業(yè),研究聚焦于自然語言處理和機(jī)器學(xué)習(xí),尤其側(cè)重于大型語言模型。



      Jacqueline He目前在華盛頓大學(xué)讀自然語言處理專業(yè)博士,本科畢業(yè)于普林斯頓大學(xué),曾是普林斯頓自然語言處理小組成員,主要導(dǎo)師是陳丹琦。

      讀研之前,她還擔(dān)任過Meta的軟件工程師。

      Rulin Shao本科畢業(yè)于西安交通大學(xué),取得了數(shù)學(xué)的學(xué)士學(xué)位,后在卡內(nèi)基梅隆大學(xué)完成了機(jī)器學(xué)習(xí)碩士學(xué)位,現(xiàn)為華盛頓大學(xué)博士生,同時(shí)也是Meta的訪問研究員。



      團(tuán)隊(duì)的其他作者均來自伊利諾伊大學(xué)厄巴納 - 香檳分校、卡內(nèi)基梅隆大學(xué)、Meta、北卡羅來納大學(xué)教堂山分校、斯坦福大學(xué)等高校和機(jī)構(gòu)。

      論文地址:https://arxiv.org/abs/2411.14199

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      軍用罐頭,為何寧愿讓戰(zhàn)士刀劈斧砍,也不要拉環(huán)?

      軍用罐頭,為何寧愿讓戰(zhàn)士刀劈斧砍,也不要拉環(huán)?

      觀銳器
      2025-12-29 19:18:48
      紀(jì)實(shí):26前上海奶奶撿到黑人棄嬰,將其養(yǎng)大送他房產(chǎn),現(xiàn)狀很意外

      紀(jì)實(shí):26前上海奶奶撿到黑人棄嬰,將其養(yǎng)大送他房產(chǎn),現(xiàn)狀很意外

      談史論天地
      2026-02-21 10:20:04
      霍去病打下4座城,取了4個(gè)霸氣名字,從未改名并沿用至今

      霍去病打下4座城,取了4個(gè)霸氣名字,從未改名并沿用至今

      長(zhǎng)風(fēng)文史
      2026-01-13 15:21:07
      新加坡大滿貫賽:韓國(guó)女單名將1:3被淘汰!國(guó)乒女單7人扎堆上半?yún)^(qū)

      新加坡大滿貫賽:韓國(guó)女單名將1:3被淘汰!國(guó)乒女單7人扎堆上半?yún)^(qū)

      國(guó)乒二三事
      2026-02-21 09:32:25
      目前有多少華裔加入了日本自衛(wèi)隊(duì)?數(shù)量之多,讓國(guó)人倍感心寒

      目前有多少華裔加入了日本自衛(wèi)隊(duì)?數(shù)量之多,讓國(guó)人倍感心寒

      我心縱橫天地間
      2026-01-19 16:48:07
      春晚女主持人長(zhǎng)相有多重要?看董卿和龍洋5年前同框主持就知道了

      春晚女主持人長(zhǎng)相有多重要?看董卿和龍洋5年前同框主持就知道了

      真的八卦小學(xué)弟
      2026-02-13 17:00:08
      大批武器被運(yùn)進(jìn)地下,導(dǎo)彈部署指向中方,日本終于露出“獠牙”

      大批武器被運(yùn)進(jìn)地下,導(dǎo)彈部署指向中方,日本終于露出“獠牙”

      愛吃醋的貓咪
      2026-02-21 16:11:33
      王濛為林孝埈怒懟管理層:頂尖選手怎被練廢?

      王濛為林孝埈怒懟管理層:頂尖選手怎被練廢?

      阿嚼影視評(píng)論
      2026-02-21 14:47:46
      釋永信倒臺(tái)后,老鄉(xiāng)才敢說實(shí)話:當(dāng)年他想兩三萬一戶買下整個(gè)村

      釋永信倒臺(tái)后,老鄉(xiāng)才敢說實(shí)話:當(dāng)年他想兩三萬一戶買下整個(gè)村

      每一次點(diǎn)擊
      2026-02-13 14:46:14
      央媒就扶起老人反被訛發(fā)聲!如果要自證清白,公安機(jī)關(guān)要主動(dòng)介入

      央媒就扶起老人反被訛發(fā)聲!如果要自證清白,公安機(jī)關(guān)要主動(dòng)介入

      小熊侃史
      2026-01-19 07:35:08
      中國(guó)攔截成功!外媒:顛覆美軍事霸權(quán),導(dǎo)彈還沒飛近,中國(guó)已攔截

      中國(guó)攔截成功!外媒:顛覆美軍事霸權(quán),導(dǎo)彈還沒飛近,中國(guó)已攔截

      趣生活
      2026-02-19 21:45:45
      “中美戰(zhàn)機(jī)一度在黃海上空對(duì)峙”

      “中美戰(zhàn)機(jī)一度在黃海上空對(duì)峙”

      揚(yáng)子晚報(bào)
      2026-02-20 16:32:26
      72萬充電樁撐起40億營(yíng)收,常州夫婦瘋狂盈利,如今急著上市變現(xiàn)

      72萬充電樁撐起40億營(yíng)收,常州夫婦瘋狂盈利,如今急著上市變現(xiàn)

      趣味萌寵的日常
      2026-02-21 00:17:39
      特朗普回?fù)糇罡叻ㄔ号袥Q 將對(duì)全球征10%關(guān)稅并發(fā)起更多貿(mào)易調(diào)查

      特朗普回?fù)糇罡叻ㄔ号袥Q 將對(duì)全球征10%關(guān)稅并發(fā)起更多貿(mào)易調(diào)查

      新浪財(cái)經(jīng)
      2026-02-21 04:25:49
      開年就封殺!從網(wǎng)紅頂流到人人驅(qū)趕,房車為啥成了城市“公敵”

      開年就封殺!從網(wǎng)紅頂流到人人驅(qū)趕,房車為啥成了城市“公敵”

      番外行
      2026-02-13 08:58:27
      荷蘭明要搶,英國(guó)要明搶,澳大利亞要明搶,巴拿馬也要明搶……

      荷蘭明要搶,英國(guó)要明搶,澳大利亞要明搶,巴拿馬也要明搶……

      百態(tài)人間
      2026-02-04 15:52:55
      特朗普白忙活一場(chǎng),下一任總統(tǒng)熱門候選人出爐,對(duì)中國(guó)態(tài)度不一般

      特朗普白忙活一場(chǎng),下一任總統(tǒng)熱門候選人出爐,對(duì)中國(guó)態(tài)度不一般

      東極妙嚴(yán)
      2026-02-20 10:52:25
      三峽大壩收支出爐:運(yùn)行20余年,總投資近2500億,如今回本了嗎?

      三峽大壩收支出爐:運(yùn)行20余年,總投資近2500億,如今回本了嗎?

      青梅侃史啊
      2026-02-21 09:46:58
      暴雪、寒潮……中央氣象臺(tái)四預(yù)警齊發(fā),部分地區(qū)降溫達(dá)16℃

      暴雪、寒潮……中央氣象臺(tái)四預(yù)警齊發(fā),部分地區(qū)降溫達(dá)16℃

      上游新聞
      2026-02-21 08:05:04
      養(yǎng)個(gè)奧迪A6L真的有那么恐怖嗎?網(wǎng)友:確實(shí)不少

      養(yǎng)個(gè)奧迪A6L真的有那么恐怖嗎?網(wǎng)友:確實(shí)不少

      另子維愛讀史
      2026-01-16 21:15:48
      2026-02-21 17:07:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12186文章數(shù) 176389關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      在貝加爾湖遇難的3名中國(guó)游客身份已確認(rèn):系一家人

      頭條要聞

      在貝加爾湖遇難的3名中國(guó)游客身份已確認(rèn):系一家人

      體育要聞

      冬奧第一"海王"?一人和13國(guó)選手都有關(guān)系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財(cái)經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔(dān)當(dāng)”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      親子
      游戲
      數(shù)碼
      健康
      房產(chǎn)

      親子要聞

      放寒假別老催著孩子寫作業(yè)了,跳繩機(jī)會(huì)來了!

      萬幸中的不幸!男子情人節(jié)收到游戲 但沒有光盤!

      數(shù)碼要聞

      NVIDIA新卡皇RTX 5090 Ti再曝光:功耗直飆超700W!性能提升10%

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      房產(chǎn)要聞

      窗前即地標(biāo)!獨(dú)占三亞灣C位 自貿(mào)港總裁行宮亮相

      無障礙瀏覽 進(jìn)入關(guān)懷版