![]()
來源:科技日報
記者:張佳欣
在人工智能(AI)競逐日益白熱化的今天,OpenAI再次拋出了一個震撼業界的宏大藍圖。近日,OpenAI首席科學家雅各布·帕喬基在接受《麻省理工科技評論》獨家專訪時透露,他們正瞄準一個前所未有的科研目標:在2028年前,打造一個能夠自主解決復雜問題的“AI研究員”。
這是一套全自動的多智能體研究系統,能夠獨立完成從數學、物理到生物、化學,乃至政策分析的各類科研任務。OpenAI表示,實現“AI研究員”計劃是該公司未來幾年的方向。今年9月,第一階段目標將率先落地,屆時,OpenAI將先行推出“自主AI研究實習生”。
這一計劃標志著OpenAI在推動AI技術應用方面的新嘗試,同時也是其在面對Anthropic、“深度思維”等競爭對手時的重要戰略部署。
“我們正接近這樣一個階段:我們的模型能夠像人一樣,以連貫的方式無限期地工作。”帕喬基表示,“當然,仍然需要有人負責并設定目標。但我認為,我們將最終達到這樣的境界:在數據中心里擁有一個完整的研究實驗室。”
從Codex開始“進化”
OpenAI并非在空中樓閣上構筑夢想。今年1月,OpenAI發布了Codex,這是一款能即時生成代碼、執行復雜計算任務的智能體應用。它能分析文檔、生成圖表、整理郵件和社交媒體摘要等。時至今日,Codex已經成為其內部員工的標配,輔助開發代碼并解決問題。帕喬基表示,可以把Codex看作是“AI研究員”的雛形。未來,Codex將實現顛覆性革新。
作為OpenAI首席科學家和公司長期研究目標的制定者,帕喬基已經觀察到,在技術演進上,模型的“長程工作能力”正隨著參數規模和邏輯深度的增加而呈線性提升。
從GPT-3到GPT-4,模型在無干預情況下處理復雜問題的時長實現了質的飛躍。而2024年推出的“推理模型”技術,通過引入“思維鏈”訓練,讓AI學會了像人類一樣步步為營、遇錯回溯。目前,OpenAI正在利用數學和編程競賽的難題對模型進行“魔鬼訓練”,旨在提升其處理超長文本和拆解多重子任務的能力,最終能夠解決現實世界的科研難題。
帕喬基認為,自動化科研的關鍵在于系統能夠長期運行,減少人工干預。帕喬基解釋說:“我們的目標是開發一個研究實習生系統,可以把本來需要幾天的人力任務交給它完成。”通過訓練模型逐步解決問題、回溯錯誤,推理模型能夠在較長時間內保持連貫工作。
艾倫人工智能研究所的研究科學家道格·唐尼表示,自動化科研是令人興奮的探索。“想象一下,明天早上我們回到實驗室,智能體已經完成了一系列科研工作,并產生可供分析的新結果,這將極大加速科研進程。”
AI科研能力進入驗證階段
OpenAI目前更專注于與現實世界相關的研究。據介紹,研究人員已經利用驅動Codex的GPT-5模型,發現了多個未解數學問題的解決方案,并在生物、化學和物理學的若干難題中取得了進展。
這種生產力的飛躍,甚至改變了那些最“硬核”程序員的職業習慣。帕喬基坦言,由于對代碼精準度有著近乎苛刻的追求,他一年前甚至拒絕使用最基礎的自動補全功能,更傾向于在Vim編輯器(一款深受資深程序員喜愛的文本編輯器)中手動輸入每一個字符。但隨著模型能力的迭代,他的看法發生了根本性改變。他發現,盡管復雜的架構設計仍需由人主導,但在實驗驗證階段,AI可以在一個周末內完成他以前需要一周才能編寫完的代碼。
針對OpenAI樂觀的預期,學術界仍有不同聲音。艾倫人工智能研究所的研究員指出,在去年的測試中,當任務需要多個復雜的邏輯步驟耦合時,現有模型極易因為每一個微小錯誤的累積,導致最終結果崩潰。對此,OpenAI正在不斷迭代模型,例如近期發布的GPT-5.4版本,旨在進一步增強邏輯穩定性和任務處理的連貫性。OpenAI希望通過這種不斷地迭代,證明“AI研究員”在真正深度介入現實世界的科研之前,是具備科學意義上的可靠性的。
需共同應對“集中化力量”的挑戰
然而,當科研的“方向盤”逐漸移交給算法,安全與倫理的圍欄必須同步加固。帕喬基指出,一個能運行整個研究計劃的強大AI,可能會伴隨一些尚未解決的重大問題,例如系統失控、遭受黑客攻擊,或者可能僅僅是誤解了自身的指令。為了應對這些挑戰,OpenAI正在推廣“思維鏈監控”技術,即訓練模型在“草稿本”中記錄工作筆記,以便研究人員實時審計其行為是否符合預期。
帕喬基認為,在能夠完全信任這些系統之前,必須設置嚴格的限制,例如將極強大的模型部署在與外界隔絕的“沙箱”中。他還提醒道,“想象一下,一個數據中心能完成過去需要大型組織才能完成的科研工作,而現在可能只需幾個人”。這種能力集中、影響力巨大的系統將對社會和政策帶來新挑戰。
面對這種力量的崛起,帕喬基預測,即使到2028年,AI系統仍不會在所有方面都像人類一樣聰明,但這并不妨礙它產生巨大的變革作用。這需要社會、政策制定者和科研機構共同參與監管,而非僅靠OpenAI一家公司。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.