網易首頁 > 網易號 > 正文申請入駐

OpenAI發布《AI作為科學合作者》報告

2026-02-03 08:33:50　來源: 國際與比較教育研究所

北京舉報

分享至

人工智能正從一個被動的工具，演變為能主動參與推理、激發靈感的“研究伙伴”。2026年1月26日，美國OpenAI公司發布《AI作為科學合作者》（AI as a Scientific Collaborator）報告。報告基于隨機抽樣的ChatGPT用戶的完整匿名對話數據，就AI工具在日常研究工作中如何使用、AI在促進科學研究新突破上的潛力、不同科學家使用AI工具的差異進行了分析，并就如何利用AI促進科學與數學研究提出了政策建議。

1. 科研協作新常態：ChatGPT已成科學家高頻伙伴

報告指出，在ChatGPT平臺上，一個專注而活躍的科研用戶群體正在迅速壯大。他們包括博士生、博士后、在職研究人員及STEM領域教職員工，使用AI進行技術推導、高等數學、工程仿真等高階任務。

通過對ChatGPT用戶2025年1月-12月的隨機抽樣對話數據分析，發現關于高級科學和數學主題的消息量每周平均增長了約47%，從570萬條消息增加到近840萬條消息。截至2026年1月，每周有近130萬用戶討論高級科學和數學主題。

這些跡象共同表明，ChatGPT正在加速推進前沿研究：每月有數千萬條高級硬科學和數學提示的產生，源于一個不斷壯大的用戶群體，他們正使用該系統進行嚴肅的科學和工程工作，以造福社會并支持經濟增長。

2.從工具到伙伴：AI深度介入研究全流程

報告指出，科學家、數學家和工程師將ChatGPT視為一個高度可用的技術協作伙伴：他們可以使用這個工具進行迭代計算、將想法轉化為代碼、驗證假設，并將復雜的材料提煉成可操作的思維模型。在OpenAI的分析中，“高級”硬科學提示被定義為那些面向研究、需要研究生或研究水平專業知識才能給出合格答案的提示。在這一群體中，用戶行為模式與普通用戶存在差異，這些差異直接映射出現代科研工作流程的特征。

研究任務主要集中在以下領域：編程（編寫、修改和調試代碼）、數據分析（清理和合并數據集、運行統計分析、解釋結果）、數學推理（推導、證明策略、代數驗證、復雜計算、不同形式體系之間的轉換）以及文獻綜述和綜合（查找參考文獻、理解最新研究成果）。

與ChatGPT的普通用戶相比，高級科學和數學用戶的表現如下：發送的信息量大約是普通用戶的3.5倍；涉及編程類內容的提問頻率高出近12倍；每周平均提交9次知識概覽型指令，而普通用戶僅1.5次。

3.能力突破：AI在科學前沿已能解決“專家級”問題

報告顯示，在過去兩年中，大型語言模型已經從早期在基礎算術上的表現不穩定，發展到能夠處理多步數學推理，足以應用于實際數學工作。這種進步主要得益于促進逐步推理的方法，以及與計算器、代碼執行等工具的緊密集成，以確保精確計算。

2025年至2026年初，AI在數學領域的最大突破來自于“慢思考”（test-time compute scaling）技術的應用。模型不再急于選定單一推理路徑，而是通過更多計算量來探索替代方案并進行自我檢查。同時，通過訓練過程中獎勵可驗證結果（如生成正確答案或可執行代碼），AI在數學與編程方面的表現更加可靠，足以在人類指導下發揮實際作用。

2025年7月，OpenAI的模型在國際數學奧林匹克競賽（IMO）中達到金牌水平，與DeepMind并列，標志著AI在數學推理能力上的重要突破。在旨在測試多步驟問題解決能力的美國數學邀請賽（AIME）中，GPT-5.2在沒有外部工具的情況下更是取得了滿分。

目前，GPT-5.2系列在數學能力上持續進步，已能解決諸如谷歌FrontierMath問題集的專家級問題，即即使是數學專業的優秀博士生，也無法在幾個小時內解決它們。在該基準測試的1-3級中，GPT-5.2思考模式解決了40.3%的問題。

在物理學、化學和生物學等學科領域，ChatGPT類大型語言模型正日益支持技術推理和工具輔助的研究工作流程，以及科學寫作。例如，在專業級科學問答基準GPQA測試中，GPT-5.2 Pro和GPT-5.2 Thinking的準確率分別達到93.2%和92.4%，表明其在多學科研究生級科學問題解答上得到了很高水平。

AI正在將科學家從繁瑣的文獻檢索、書目整理和常規行政報告中解放出來，成為科學研究中可靠的工作流程協調者。例如，在物理領域，AI正被應用于美國國家實驗室等大型設施中，協助實時數據分析、實驗控制與決策優化。在化學與生物學中，AI通過結合專業模型（如圖神經網絡、蛋白質結構預測模型）與通用語言模型，實現從分子設計到實驗規劃的全流程輔助，顯著提升了研究效率與成功率。

4.案例見證：AI作為“合作者”已在多個領域產出實質成果

報告特別指出，AI已在多個具體研究場景中展現出“合作者”的潛力。例如，在數學領域，GPT-5.2輔助解決了數個長期未解的“埃爾德什問題”；在生物學中，OpenAI與RetroBioSciences合作，通過蛋白質工程模型在數月內設計出具有潛在抗衰老功能的細胞重組因子，將傳統需要數年試錯的研發周期大幅壓縮。

這些進展表明，AI正在從“輔助工具”逐步轉變為“研究伙伴”，在數學推導、實驗設計、數據分析甚至理論構建中發揮實質性作用。盡管目前AI仍無法獨立完成如牛頓創立微積分那樣的范式級突破，但它已在連接不同學科、整合既有知識、加速發現進程方面展現出明確價值。

未來幾年，隨著模型能力持續提升、與科學工具的深度融合，AI有望進一步推動多個學科進入“加速發展期”，成為全球科研體系中不可或缺的協作力量。

5.政策呼吁：構建美國國家AI科研新生態

報告就如何利用人工智能加強美國的科學創新以確保2026年是人工智能和科學年提出了包含四大支柱的政策建議：

一是擴大AI技能培養，為美國勞動力和未來科學家做好準備。

建議啟動一項國家人工智能勞動力計劃，支持從K-12階段的人工智能課程，到社區學院和大學的AI學位與證書項目，并為在職人員提供短期培訓。國會和相關部門可授權撥款，用于各州學校的AI與數據科學課程開發與教師培訓，同時設立“AI技能團”或專項基金，通過圖書館、就業中心和學校為社區提供免費的AI講習班和培訓。

二是開放數據并拓展開放研究合作，加速科學發現。

AI輔助的科學研究能將數十年的發現過程壓縮至數年，尤其是在研究人員能廣泛接觸前沿AI工具和新開放數據的情況下。OpenAI支持建立國家AI研究資源，作為一個共享平臺，為學術和非營利研究者提供大規模計算資源與高質量數據集，并呼吁盡快通過并落實相關立法，確保充足的資金與健全的治理機制。各機構應識別高價值數據集，并以機器可讀形式提供，用于AI研發，同時維護數據隱私與安全，對敏感數據進行脫敏處理，并對真實研究用途默認開放訪問。

三是將AI基礎設施（包括能源、計算與芯片）作為國家戰略資產進行現代化。

計算能力是AI驅動發現的關鍵工具。確保美國境內擁有充足的計算資源，取決于現代化基礎設施以及對美國電網的充分擴容，以避免科學進步受能源短缺制約。聯邦政策應利用《芯片與科學法案》賦予的權限，設立AI基礎設施樞紐，劃定AI創新區并優先支持高容量數據中心及相關能源投資，同時簡化審批流程。通過公私合作，可為聯邦資助的研究人員獲取尖端AI系統能力提供支持，并加強在美國本土布局、建設和制造AI芯片所需的半導體供應鏈。

四是提供廣泛、規模化接觸前沿AI系統的途徑，并強化創新生態系統。

聯邦政府應建立國家前沿AI訪問配額制度，讓大學、國家實驗室和非營利機構的研究人員能夠以足以支持持續實驗、方法開發和驗證的規模，使用先進AI系統。訪問機制應基于廣泛、輕量化的申請流程，既支持開放探索，也服務于具體研究項目，將AI使用視為類似望遠鏡觀測時間或超算機時的國家共享科研資源。為促進AI技術向更廣泛經濟領域擴散，聯邦政策應擴大“小企業創新研究計劃”（SBIR）以覆蓋AI技術應用，并建立區域創新孵化器，將AI技術人員與地方產業需求對接。

這些建議旨在系統性構建美國在AI時代的科研優勢，通過人才、數據、硬件與訪問機制的全方位提升，推動人工智能真正成為國家科技競爭力的核心引擎。

資料來源：

OpenAI. AI as a Scientific Collaborator From biology to black holes, ChatGPT is accelerating research. https://cdn.openai.com/pdf/f4b4a5da-b2de-418d-9fcd-6b293e9dc157/oai_ai-as-a-scientific-collaborator_jan-2026.pdf

[本文為教育部國別和區域研究基地中國教育科學研究院國際教育研究中心成果]

本文由中國教育科學研究院比較教育研究所“教育國際前沿”課題組負責人張永軍整理，編輯劉強。點擊左下角閱讀原文可下載該文獻。

本文為原創，歡迎轉載。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.