<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      實錘了:GPU越多,論文接收率越高、引用越多

      0
      分享至



      機器之心報道

      機器之心編輯部

      在過去三年里,AI 領域取得了顯著進步,這一飛躍主要得益于基礎模型的發展。這些模型在大規模多模態數據上進行訓練,并在公開發布后取得了巨大成功。

      然而,基礎模型的研究需要大量的數據、算力和人力資源。這一問題引發了廣泛關注與討論,更大的資源獲取是否會直接帶來更有影響力的研究成果,例如更多的論文發表或更高的引用量。

      這一問題的答案對于資源分配策略、研究方向的優先級設定,以及如何保障基礎模型研究的公平與可持續參與,都具有重要意義。

      然而,由于缺乏統一的資源披露標準,研究成本往往難以量化。在缺乏全面公開的情況下,研究經費最直觀的衡量方式,通常是購買或租用硬件(如計算集群或芯片)的具體成本。當然,研究還包括軟件、云存儲服務以及專業平臺等其他開支。

      在這些資源中,GPU 是一個尤其關鍵的指標,因為它是一種供應量有限、受嚴格控制的資源。

      在本文中,來自 MIT、劍橋等機構的研究者研究了硬件資源與 AI/ML 領域頂級會議論文發表之間的關系。他們重點考察了兩種計算能力指標:GPU 數量和 TFLOPs(每秒浮點運算次數),并將這些數據與 2022 至 2024 年間共 34,828 篇錄用論文進行關聯分析。

      本文共識別出 5,889 篇基礎模型相關論文,并發現 GPU 獲取能力越強,其在八個頂級會議中的論文接收率和引用量也越高。

      此外,本文還對 312 篇論文的 229 位作者進行了問卷調查后發現:

      • 大多數基礎模型論文由學術界研究者撰寫(共 4,851 篇),而產業界研究者的論文數量相對較少(1,425 篇);
      • 大多數論文使用的是開源模型(如 LLaMA),其次是閉源模型(如 GPT);
      • GPU 使用信息在論文中很少被披露,這表明當前亟需制定統一的計算資源報告規范,以提升研究的透明度與可復現性。



      • 論文標題:THE ROLE OF COMPUTING RESOURCES IN PUBLISHING FOUNDATION MODEL RESEARCH
      • 論文地址:https://arxiv.org/pdf/2510.13621

      計算資源識別方法

      研究者收集了2022 年至 2024 年間、八個頂級機器學習會議上被接收的論文(2025 年 3 月之前已可獲取),包括 NeurIPS、ICLR、ICML、COLM、EMNLP、ACL、NAACL、EACL。

      采用的方法是:在論文標題或摘要中搜索關鍵詞來識別與基礎模型(FM)相關的論文。最終在總計 34828 篇論文中,挑選出了5889 篇與 FM 相關的已接收論文。此外收集了同期被拒稿或撤稿的 ICLR 與 FM 相關的論文,共計 613 篇,用于對比分析。

      在完成論文標題和摘要的整理后,研究者使用 GPT-4o mini 將每篇論文分為三個類別,即領域(Domain)、階段(Phase)和方法(Method)。這些類別的定義見下表 1。



      更進一步地,研究者通過系統 API 從全部 5889 篇已接收論文中收集結構化信息,包括文章 ID、標題、作者信息(姓名、人數及所屬機構)、發表信息(年份、會議、接收或拒稿狀態、論文鏈接、評審意見和摘要)。對于系統 API 中缺失的信息,研究者使用 GPT-4o mini 處理論文 PDF,以提取資深作者的所屬機構、GPU 使用情況、數據集描述以及資助信息。

      在調研中,118 所機構的研究者參與了本次調查,包括了 267 名學術界一作和 36 名產業界一作,最終共有 229 位 FM 論文的一作(包括 312 篇論文)提供有效反饋。當論文中未記錄計算資源使用情況時,參與者需在調查中自行報告相關信息

      圖 1 (B) 展示了不同年份和會議中有效 GPU 類型的比例,以及各會議作者和審稿人檢查清單中是否包含報告計算資源使用情況的相關指南。圖 1 (C) 展示了由 GPT-4o 自動抓取的數據與論文作者自報數據在 GPU 使用量與 FP 16 計算性能(TFLOPS 16)上的差異。



      為確保提取的 GPU 信息準確性,兩位 FM 研究者在盲評條件下獨立檢查了 312 篇論文,并與 GPT-4o mini 的提取結果進行對比。研究者交叉比對了 GPT-4o mini 提取的信息、人工標注結果以及論文一作自報的 GPU 數據。

      結果顯示:在被調查的 312 篇論文中,288 篇自報了 GPU 數量,292 篇自報了 GPU 類型,281 篇自報了 GPU 使用時長;另有 24 篇使用了非 GPU 計算資源(如 TPU、NPU 或 CPU)。

      不過,兩位 FM 研究者發現僅有 172 篇論文中包含 GPU 數量信息,141 篇包含 GPU 類型信息,249 篇包含 GPU 時長信息。GPT-4o mini 僅從 116 篇論文中成功提取到 GPU 數量,與作者報告相比存在 59.7% 的缺失率。GPU 類型與 GPU 時長的缺失率也較高,分別為 48.3% 和 88.6%。

      結果

      基礎模型研究呈爆炸式增長

      從 2022 年到 2024 年,基礎模型的研究在廣度和深度上都經歷了顯著增長。

      一個直觀的體現是,在八個頂級 AI 會議中,基礎模型相關論文的占比迅速攀升

      • 2022 年: 2.07%
      • 2023 年: 10.29%
      • 2024 年:飆升至 34.64%(圖 A)



      尤其在NLP 領域,這一趨勢更為明顯。在 COLM、EMNLP 和 ACL 等專業會議上,基礎模型論文的比例甚至超過了 ICLR、ICML 和 NeurIPS 等綜合性機器學習會議。

      從研究方向來看,與推理相關的論文增長最快。從研究類型來看,算法和實證研究的增長速度超過了數據集、基準測試和工具包等類別(圖 B)。



      有趣的是,盡管論文數量激增,但單個項目使用的 GPU 數量保持相對穩定。無論是已發表的論文還是待發表的研究,大多數項目使用的 GPU 數量集中在 1 到 8 個,其中 1 到 4 個 GPU 的配置最為常見,占據了約一半的比例(圖 C)。不過,考慮到目前 GPU 的采購周期越來越長,這一趨勢未來是否會變化,值得我們持續關注。



      工業界與學術界共同引領研究浪潮

      基礎模型的研究延續了計算機科學領域產學研緊密結合的傳統。

      數據顯示,學術界貢獻了更多的論文總量,但頂尖的工業界實驗室在單一機構產出上表現突出。具體來看:

      • 學術界: 611 個機構共發表了 4851 篇論文。
      • 工業界: 163 個機構共發表了 1425 篇論文。

      其中,谷歌和微軟是論文產出最多的兩個單一實體,緊隨其后的是清華大學、Meta 和斯坦福大學。



      值得注意的是,兩大陣營的研究效率相當。工業界研究者人均發表 8.72 篇論文,學術界人均發表 7.93 篇。這表明,基礎模型的研究高度集中在少數能提供強大算力支持的頂級學術和工業機構中。如果獲取大規模算力的門檻持續提高,這種集中化趨勢可能會進一步加劇。

      從國家層面看,美國和中國在基礎模型研究產出方面處于領先地位(圖 B),這可能與兩國在高等教育和人工智能領域的長期投入有關。



      開源模型成為研究的主流選擇

      在眾多模型中,以LLaMA 系列為代表的開源權重模型是研究中使用最頻繁的(圖 C)。



      這一現象至關重要。雖然像 GPT 系列這樣的專有閉源模型因其卓越的性能和便捷的 API 接口,在研究中仍占有一席之地,但開源模型憑借其高度的靈活性和可訪問性贏得了研究社區的青睞。研究人員可以基于開源模型進行微調、領域適配和深入的基準測試,而這些操作在閉源模型上通常難以實現。

      GPU 使用情況:NVIDIA A100 成為核心算力

      在具體的 GPU 類型上,NVIDIA A100 是基礎模型研究中使用最廣泛的核心,并且排名前十的 GPU 均來自 NVIDIA 家族(圖 3D)。

      進一步分析發現,算力資源的使用并非均勻分布:

      • 研究階段: 專注于預訓練的研究,其 GPU 使用數量顯著高于側重于后訓練或推理的研究(p<0.001)。
      • 其他維度: 在不同機構、應用領域或研究方法之間,GPU 的使用量沒有表現出統計學上的顯著差異。例如,安全相關研究的 GPU 使用量中位數較低,而工具包開發研究的使用量較高,但這些差異并不顯著(圖 D)。



      從論文的研究重點來看:

      • 47.4% 關注算法開發。
      • 86.4% 集中在 NLP 領域,僅有 5.7% 涉及 CV。
      • 48.7% 的論文研究推理過程,遠超預訓練(13.3%)。

      政府是基礎模型研究的最大資助方

      通過分析論文中披露的資金信息,發現政府是基礎模型研究最主要的資助來源(圖 4)。在提供了資助信息的論文中:

      • 85.5%(848 篇)獲得了政府資助。
      • 29.3%(291 篇)獲得了企業資助。
      • 10.3%(102 篇)獲得了基金會資助(圖 4A)。

      有趣的是,一個國家的人均 GDP 與其資助的論文數量之間沒有必然聯系(圖 4B)。這表明,機構的支持力度和相關政策,比單純的國家經濟實力更能影響基礎模型的研究產出。(注:僅有 15.3% 的論文披露了詳細的資助信息。)



      研究產出與影響力:算力比 GPU 數量更關鍵

      一個典型的基礎模型研究項目是怎樣的?數據顯示,一篇被接收的論文,通常有 5 名作者,使用 4 個 GPU,項目平均持續約 5 個月。

      進一步探究了計算資源與研究成果(論文數量和引用量)之間的關系,發現了更深層的規律:

      對于產出(論文數量): 單純的 GPU 數量與論文產出不成正比。然而,以 TFLOPs(每秒萬億次浮點運算)衡量的總計算能力,與論文產出呈現出更強的正相關性,尤其是在工業界(圖 4C)。這說明,決定研究產出效率的,是高質量的計算基礎設施,而不僅僅是 GPU 的堆砌。

      對于影響力(引用次數): 同樣,TFLOPs 比 GPU 數量更能預測一篇論文的引用潛力(圖 4D)。擁有更強算力支持的機構,其研究成果往往能獲得更多引用

      盡管如此,算力并非決定性因素。許多高引用論文同樣來自計算資源相對有限的機構,證明了研究影響力是由多種因素共同決定的。

      論文接收與否:資源多少并非決定性因素

      更多的 GPU 或更強的算力,能提高論文被接收的概率嗎?

      研究者對 ICLR 會議 2022-2024 年的數據進行了分析。結果發現,平均而言,被拒稿的論文確實比被接收的論文使用了略少的 GPU、略低的 TFLOPs和規模略小的作者團隊。

      但是,兩者在資源使用上的分布情況非常相似,差距微乎其微。這與頂級會議的審稿指南相符,即審稿人更應關注研究的新穎性、清晰度和貢獻,而非其使用的資源多寡。(注:由于只有 ICLR 公開了被拒稿論文的數據,這個結論的普適性還有待更多數據驗證。)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      繼新加坡之后,馬來西亞華人發聲!

      繼新加坡之后,馬來西亞華人發聲!

      達文西看世界
      2025-12-17 10:42:35
      正式退出?18歲王洪澤攤牌發聲,官宣決定,廣東意外,杜鋒支持

      正式退出?18歲王洪澤攤牌發聲,官宣決定,廣東意外,杜鋒支持

      體育有點水
      2025-12-18 11:01:10
      Angelababy與上海網紅聚會,美的好突出

      Angelababy與上海網紅聚會,美的好突出

      可樂談情感
      2025-12-18 12:05:08
      梅西飛印度辦活動,首富300斤的小兒子熱情接待,拉迪卡胯是真的大

      梅西飛印度辦活動,首富300斤的小兒子熱情接待,拉迪卡胯是真的大

      小魚愛魚樂
      2025-12-17 17:26:10
      世界臺聯官宣!丁俊暉作出重要決定:已放棄參賽,成唯一缺席種子

      世界臺聯官宣!丁俊暉作出重要決定:已放棄參賽,成唯一缺席種子

      郝小小看體育
      2025-12-18 08:16:23
      鐵原阻擊戰,63軍以近萬之眾出征,歸來僅800人,卻憑此戰封神!

      鐵原阻擊戰,63軍以近萬之眾出征,歸來僅800人,卻憑此戰封神!

      一切都可能
      2024-12-03 15:56:21
      澳大利亞連工業都沒有,為什么還可以那么富裕?

      澳大利亞連工業都沒有,為什么還可以那么富裕?

      羅sir財話
      2025-12-17 16:48:36
      天津一醫院護士站更衣室被安裝攝像頭偷拍?警方:正調查,后續情況會公布

      天津一醫院護士站更衣室被安裝攝像頭偷拍?警方:正調查,后續情況會公布

      大風新聞
      2025-12-18 10:26:05
      著名播音員鐘瑞在加拿大病逝!丈夫宋世雄的三件禮物溫暖她一生

      著名播音員鐘瑞在加拿大病逝!丈夫宋世雄的三件禮物溫暖她一生

      銀河史記
      2025-12-16 16:18:24
      同事造謠我與女領導有染,妻子鬧離婚,女領導:明早帶你看好戲

      同事造謠我與女領導有染,妻子鬧離婚,女領導:明早帶你看好戲

      清茶淺談
      2025-12-11 18:38:47
      豬肚再次成為討論對象!研究發現:常吃豬肚,可能會獲取3大益處

      豬肚再次成為討論對象!研究發現:常吃豬肚,可能會獲取3大益處

      九哥聊軍事
      2025-12-15 21:18:17
      醫生發現:天冷堅持戴口罩的人,用不了多久,身體或會有5大變化

      醫生發現:天冷堅持戴口罩的人,用不了多久,身體或會有5大變化

      霹靂炮
      2025-12-04 22:54:47
      美國妹子的短劇氣炸無數社畜:她年會搶了老板想要的禮物!老板之后的騷操作讓她驚呆...

      美國妹子的短劇氣炸無數社畜:她年會搶了老板想要的禮物!老板之后的騷操作讓她驚呆...

      英國那些事兒
      2025-12-17 23:27:12
      水均益到泉州女婿家做客,和前妻同框還抱外孫女,對女婿稱呼疏離

      水均益到泉州女婿家做客,和前妻同框還抱外孫女,對女婿稱呼疏離

      李佳康
      2025-12-18 01:35:59
      俄外長:美已向俄承諾烏將放棄部分領土

      俄外長:美已向俄承諾烏將放棄部分領土

      參考消息
      2025-12-17 18:32:07
      廣東一地新發現120多名艾滋感染者

      廣東一地新發現120多名艾滋感染者

      東莞潮事兒
      2025-12-18 11:45:53
      囂張!士可忍孰不可忍!2大網球球星公開辱華,網友:必須封殺

      囂張!士可忍孰不可忍!2大網球球星公開辱華,網友:必須封殺

      余憁搞笑段子
      2025-12-17 21:51:09
      中央定調!2026年房貸 1% 貼息落地,月供能降多少?精準測算來了

      中央定調!2026年房貸 1% 貼息落地,月供能降多少?精準測算來了

      新浪財經
      2025-12-17 12:48:31
      國內唯一、亞洲最大!山東萊州發現巨型海底金礦

      國內唯一、亞洲最大!山東萊州發現巨型海底金礦

      界面新聞
      2025-12-18 13:57:15
      芬蘭小姐拉成瞇瞇眼歧視中國人,日本網友氣炸了要求跟芬蘭斷交……

      芬蘭小姐拉成瞇瞇眼歧視中國人,日本網友氣炸了要求跟芬蘭斷交……

      日本物語
      2025-12-17 21:08:26
      2025-12-18 14:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11944文章數 142512關注度
      往期回顧 全部

      科技要聞

      新一代AI創業大賽頒獎典禮暨AI投資論壇

      頭條要聞

      絲芭傳媒再發文:將舉報鞠婧祎涉嫌嚴重經濟犯罪行為

      頭條要聞

      絲芭傳媒再發文:將舉報鞠婧祎涉嫌嚴重經濟犯罪行為

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      內娛解約大戰:鞠婧祎和絲芭,誰是狼人

      財經要聞

      重大改革,身關14億人的政策徹底變了!

      汽車要聞

      開箱日產大沙發 精致辦公or躺平追劇 哪個更適配?

      態度原創

      手機
      游戲
      親子
      旅游
      公開課

      手機要聞

      日版App Store大改 引入第三方應用商店與支付選項

      冬日狂歡開啟!《逃離鴨科夫》冰雪主題挑戰地圖今日正式上線!

      親子要聞

      誰打我女兒我就打他女兒!

      旅游要聞

      聚力文商旅體展深度融合,北京將拓展內容做優“演藝+”消費

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 97人妻白浆| 婺源县| 男女啪啪做爰高潮免费网站| 日韩少妇内射免费播放18禁裸乳 | 黑丝足交在线| 久久婷婷大香萑太香蕉AV人| 四川少妇被弄到高潮| 国产精品久久久久久久专区| 激烈的性高湖波多野结衣| 中文字幕在线无遮挡| www亚洲精品少妇裸乳一区二区| 99精品中文| 日本99视频| 久久草网站| 涟源市| 方山县| 久久精品国产99精品亚洲| 国产成人无码性教育视频 | 国产精品自在自线视频| 国产av永久无码天堂影院| 国产亚洲精品久久久久久牛牛| 国产精品视频第一区二区三区| 91乱子伦国产乱子伦海的味道| 国产精品久久久久孕妇| 国产精品午夜福利在线观看 | 三级片久久| 91九色TS另类国产人妖| 亚洲av二区| 托克托县| 丁香花在线观看免费观看图片| av永久天堂一区二区三区| 亚洲色图偷拍| www.欧美精品| 成人网站18禁| 国产精品国色综合久久| 国产亚洲欧美日韩俺去了| 日本久久久www成人免费毛片丨| 国产粉嫩美女一区二区三| 久久精品丝袜高跟鞋| 黄大仙区| 95色综合|