![]()
吳恩達(dá)老師手搓了一個(gè)新工具:Agentic Reviewer(代理審稿人),感覺很有用,也很有趣,分享給大家
![]()
這是他針對(duì)科研論文開發(fā)的一個(gè)新項(xiàng)目
為什么要開發(fā)這個(gè)工具?
靈感來(lái)自吳恩達(dá)老師的一位學(xué)生
這位學(xué)生的論文在 3 年內(nèi)慘遭 6 次拒絕。每一次,學(xué)生都要苦苦等待大約 6 個(gè)月的反饋周期
這種反饋循環(huán)實(shí)在是太慢了
吳恩達(dá)團(tuán)隊(duì)希望探索代理工作流(Agentic Workflow)能否幫助研究人員加快迭代速度
效果如何?
該系統(tǒng)在 ICLR 2025 的評(píng)審數(shù)據(jù)上進(jìn)行了訓(xùn)練,并測(cè)試了斯皮爾曼相關(guān)系數(shù)(Spearman correlation,數(shù)值越高越好):
兩位人類審稿人之間的相關(guān)性:0.41
AI 與一位人類審稿人之間的相關(guān)性:0.42
這一數(shù)據(jù)表明,代理審稿的表現(xiàn)正在接近人類水平。
工作原理
該 Agent 通過搜索 arXiv 來(lái)為反饋提供依據(jù)
因此,它最適用于像 AI 這樣會(huì)在 arXiv 上公開發(fā)表研究成果的領(lǐng)域。
吳恩達(dá)表示,這是一個(gè)實(shí)驗(yàn)性工具,希望能對(duì)大家的科研工作有所幫助
具體使用只需三步:
上傳與提交:上傳論文 PDF 并輸入電子郵件地址
獲取通知:當(dāng) AI 評(píng)審?fù)瓿蓵r(shí),會(huì)收到郵件通知
查看評(píng)審:返回查看 AI 對(duì)工作的評(píng)審意見和建議
傳送門:
http://paperreview.ai
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.