網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

OpenAI推理第一人離職，7年打造了o3/o1/GPT-4/Codex

2026-01-06 13:05:19　來源: 量子位

北京舉報(bào)

分享至

衡宇發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

剛開年，OpenAI再出人事動(dòng)蕩：推理模型第一人離職了！

Jerry Tworek——構(gòu)建o3、o1、GPT-4、ChatGPT以及 OpenAI首個(gè)AI編程模型Codex的關(guān)鍵人物，OpenAI研究副總裁——宣布了他的艱難決定：

離開OpenAI，去嘗試探索一些在OpenAl難以開展的研究領(lǐng)域。

好奇，他所說的“在OpenAI難以開展的研究”包括哪些部分？

他表示，在OpenAI快七年的時(shí)間里，經(jīng)歷了許多美好和瘋狂的時(shí)刻，但更多的是美好的時(shí)光。

（大佬也和OpenAI有七年之癢？）

不少OpenAI在職人員都在這篇推文上回顧了和Jerry共事的愉快經(jīng)歷。

也祝他擁有美好的未來。

網(wǎng)友看客們嘛，留言中的關(guān)鍵詞主要是“感謝”和“贊嘆”。

依舊有因OpenAI流失重要人才感到沮喪的朋友。

但這條朋友的評(píng)論區(qū)更好笑。

很多人可能從Jerry斷斷續(xù)續(xù)的采訪、演講中認(rèn)識(shí)他，了解得并不那么全面。

現(xiàn)在，讓我們正經(jīng)全方位認(rèn)識(shí)一下這位推理模型大佬，以此送別，并祝愿他開啟一個(gè)新的航程。

OpenAI推理模型第一人

Jerry Tworek，出生、成長(zhǎng)于波蘭，在華沙大學(xué)數(shù)學(xué)專業(yè)取得碩士學(xué)位，屬于強(qiáng)理論與數(shù)理功底出身。

他并不是一出校門就進(jìn)入AI界打拼的。

離開學(xué)校后的頭五年，他先在阿姆斯特丹從事量化研究，主要研究期貨市場(chǎng)的量化交易策略。

這期間，Jerry使用優(yōu)化理論和從噪聲數(shù)據(jù)集中提取信號(hào)的技術(shù)來研究和開發(fā)期貨市場(chǎng)的量化交易策略，這最終引導(dǎo)他開始研究強(qiáng)化學(xué)習(xí)。

2019年，Jerry加入OpenAI，擔(dān)任研究科學(xué)家，主要方向是神經(jīng)程序合成、強(qiáng)化學(xué)習(xí)等。

當(dāng)時(shí)GPT?2剛發(fā)布不久，OpenAI還以非營(yíng)利研究實(shí)驗(yàn)室為主，規(guī)模小，名氣不算大。

早期，他參與了機(jī)器人項(xiàng)目“用機(jī)器人手解決魔方”，并就這一項(xiàng)目在NeurIPS 2019深度強(qiáng)化學(xué)習(xí)研討會(huì)作了展示。

Jerry也是最早一批參與“大規(guī)模預(yù)訓(xùn)練+算力擴(kuò)展”路線的研究者之一，并且在前ChatGPT時(shí)期，他就已經(jīng)展現(xiàn)出對(duì)模型推理的極大興趣，

2020年GPT-3發(fā)布后，他開始著手研究評(píng)估和訓(xùn)練GPT-3以解決推理和邏輯問題。

截至今日，Jerry在各種公開演講和訪談中，多次強(qiáng)調(diào)對(duì)“推理”而不僅僅是“模式匹配式生成”的重視，傾向把大模型看作可以通過訓(xùn)練“學(xué)會(huì)思考過程”的系統(tǒng)，而不僅是一個(gè)黑盒文本預(yù)測(cè)器。

2019–2022年間，他在OpenAI做神經(jīng)程序綜合與大模型推理研究，涉及Codex、Copilot這類代碼大模型，同時(shí)利用強(qiáng)化學(xué)習(xí)提升復(fù)雜任務(wù)上的推理與決策能力。

2022年起，Jerry開始擔(dān)任OpenAI的Research Lead，負(fù)責(zé)帶團(tuán)隊(duì)研究“如何讓大語言模型使用工具、解決STEM領(lǐng)域的困難問題”，包括插件和Code Interpreter等等。

ChatGPT出現(xiàn)之后，他逐漸被更多人認(rèn)識(shí)——以ChatGPT和GPT系列模型主要貢獻(xiàn)者之一的名義。

Jerry是GPT-4的首席研究員，領(lǐng)導(dǎo)了第一個(gè)推理模型o1的研究開發(fā)，對(duì)外被介紹為GPT-5推理機(jī)制和長(zhǎng)思考能力的核心負(fù)責(zé)人。

還在各種各樣的訪談、播客節(jié)目中系統(tǒng)講解GPT-5的思考方式和推理模型的路線演化。

2025年，Jerry升任OpenAI研究副總裁。

2026年1月6日，Jerry宣布從OpenAI離職，并未公布具體去向。

下面附上Jerry離職小作文的翻譯原文。

Jerry離職小作文寫了什么？

大家好，我做出了一個(gè)艱難的決定——離開OpenAl。

我在這里工作了將近七年，經(jīng)歷了許多美好和瘋狂的時(shí)刻，但更多的是美好的時(shí)光。

我非常享受在這里工作的日子。我曾在機(jī)器人上進(jìn)行強(qiáng)化學(xué)習(xí)的早期開發(fā)工作，還訓(xùn)練了世界上第一個(gè)編程模型，這些模型開啟了大語言模型編程革命。

在DeepMind發(fā)布模型Chinchilla之前，我就發(fā)現(xiàn)了后來大家稱為“Chinchilla Scaling Law”的現(xiàn)象。

我參與了GPT-4和ChatGPT的開發(fā)工作，最近還組建了一個(gè)團(tuán)隊(duì)，建立了一個(gè)新的縮放訓(xùn)練和推理計(jì)算范式——現(xiàn)在，它通常被稱之為推理模型。

我結(jié)交了許多朋友，在辦公室度過了許多個(gè)夜晚，參與并見證了數(shù)量可觀的技術(shù)突破，還與許多被我視為親密伙伴的人一同歡笑和擔(dān)憂。

我有幸組建并壯大了我認(rèn)為世界上最強(qiáng)的機(jī)器學(xué)習(xí)團(tuán)隊(duì)。

這是一段非常愉快的經(jīng)歷。盡管我要離開OpenAl去嘗試探索一些在OpenAl難以開展的研究領(lǐng)域，但這是一家特殊的公司，也是世界上一個(gè)特殊的存在，它已然在人類歷史的長(zhǎng)河中占據(jù)了永恒的位置。

非常感激多年來OpenAI和你們對(duì)我的信任。這類時(shí)刻總讓人感覺不太自然，但從積極樂觀的角度看待，它們卻可能成為促成偉大事物的催化劑。

我們一起讓機(jī)器智能變得更加有用和可靠，我是忠實(shí)的ChatGPT推理模型用戶。

再次感謝，感謝千千萬萬次。

保重身體，親愛的草莓們。

Jerry

One More Thing

本來吧，附上Jerry的小作文，這篇推文就該結(jié)束了。

但被我翻到了一個(gè)粗看好笑，細(xì)想想又有點(diǎn)道理的留言：

仔細(xì)想想，OpenAI的朋友們離職時(shí)確實(shí)都有小作文，這是啥不成文規(guī)定嗎？還是企業(yè)文化？

好奇.jpg

參考鏈接：
[1]https://x.com/MillionInt/status/2008237251751534622?s=20
[2]https://www.linkedin.com/in/jerry-tworek-b5b9aa56/
[3]https://warsaw.ai/speaker/jerry-tworek/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.