衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
剛開年,OpenAI再出人事動(dòng)蕩:推理模型第一人離職了!
Jerry Tworek——構(gòu)建o3、o1、GPT-4、ChatGPT以及 OpenAI首個(gè)AI編程模型Codex的關(guān)鍵人物,OpenAI研究副總裁——宣布了他的艱難決定:
- 離開OpenAI,去嘗試探索一些在OpenAl難以開展的研究領(lǐng)域。
好奇,他所說的“在OpenAI難以開展的研究”包括哪些部分?
![]()
他表示,在OpenAI快七年的時(shí)間里,經(jīng)歷了許多美好和瘋狂的時(shí)刻,但更多的是美好的時(shí)光。
(大佬也和OpenAI有七年之癢?)
不少OpenAI在職人員都在這篇推文上回顧了和Jerry共事的愉快經(jīng)歷。
也祝他擁有美好的未來。
![]()
網(wǎng)友看客們嘛,留言中的關(guān)鍵詞主要是“感謝”和“贊嘆”。
![]()
依舊有因OpenAI流失重要人才感到沮喪的朋友。
![]()
但這條朋友的評(píng)論區(qū)更好笑。
![]()
很多人可能從Jerry斷斷續(xù)續(xù)的采訪、演講中認(rèn)識(shí)他,了解得并不那么全面。
現(xiàn)在,讓我們正經(jīng)全方位認(rèn)識(shí)一下這位推理模型大佬,以此送別,并祝愿他開啟一個(gè)新的航程。
OpenAI推理模型第一人
Jerry Tworek,出生、成長(zhǎng)于波蘭,在華沙大學(xué)數(shù)學(xué)專業(yè)取得碩士學(xué)位,屬于強(qiáng)理論與數(shù)理功底出身。
![]()
他并不是一出校門就進(jìn)入AI界打拼的。
離開學(xué)校后的頭五年,他先在阿姆斯特丹從事量化研究,主要研究期貨市場(chǎng)的量化交易策略。
這期間,Jerry使用優(yōu)化理論和從噪聲數(shù)據(jù)集中提取信號(hào)的技術(shù)來研究和開發(fā)期貨市場(chǎng)的量化交易策略,這最終引導(dǎo)他開始研究強(qiáng)化學(xué)習(xí)。
2019年,Jerry加入OpenAI,擔(dān)任研究科學(xué)家,主要方向是神經(jīng)程序合成、強(qiáng)化學(xué)習(xí)等。
當(dāng)時(shí)GPT?2剛發(fā)布不久,OpenAI還以非營(yíng)利研究實(shí)驗(yàn)室為主,規(guī)模小,名氣不算大。
早期,他參與了機(jī)器人項(xiàng)目“用機(jī)器人手解決魔方”,并就這一項(xiàng)目在NeurIPS 2019深度強(qiáng)化學(xué)習(xí)研討會(huì)作了展示。
Jerry也是最早一批參與“大規(guī)模預(yù)訓(xùn)練+算力擴(kuò)展”路線的研究者之一,并且在前ChatGPT時(shí)期,他就已經(jīng)展現(xiàn)出對(duì)模型推理的極大興趣,
2020年GPT-3發(fā)布后,他開始著手研究評(píng)估和訓(xùn)練GPT-3以解決推理和邏輯問題。
截至今日,Jerry在各種公開演講和訪談中,多次強(qiáng)調(diào)對(duì)“推理”而不僅僅是“模式匹配式生成”的重視,傾向把大模型看作可以通過訓(xùn)練“學(xué)會(huì)思考過程”的系統(tǒng),而不僅是一個(gè)黑盒文本預(yù)測(cè)器。
![]()
2019–2022年間,他在OpenAI做神經(jīng)程序綜合與大模型推理研究,涉及Codex、Copilot這類代碼大模型,同時(shí)利用強(qiáng)化學(xué)習(xí)提升復(fù)雜任務(wù)上的推理與決策能力。
2022年起,Jerry開始擔(dān)任OpenAI的Research Lead,負(fù)責(zé)帶團(tuán)隊(duì)研究“如何讓大語言模型使用工具、解決STEM領(lǐng)域的困難問題”,包括插件和Code Interpreter等等。
ChatGPT出現(xiàn)之后,他逐漸被更多人認(rèn)識(shí)——以ChatGPT和GPT系列模型主要貢獻(xiàn)者之一的名義。
Jerry是GPT-4的首席研究員,領(lǐng)導(dǎo)了第一個(gè)推理模型o1的研究開發(fā),對(duì)外被介紹為GPT-5推理機(jī)制和長(zhǎng)思考能力的核心負(fù)責(zé)人。
還在各種各樣的訪談、播客節(jié)目中系統(tǒng)講解GPT-5的思考方式和推理模型的路線演化。
2025年,Jerry升任OpenAI研究副總裁。
2026年1月6日,Jerry宣布從OpenAI離職,并未公布具體去向。
![]()
下面附上Jerry離職小作文的翻譯原文。
Jerry離職小作文寫了什么?
大家好,我做出了一個(gè)艱難的決定——離開OpenAl。
我在這里工作了將近七年,經(jīng)歷了許多美好和瘋狂的時(shí)刻,但更多的是美好的時(shí)光。
我非常享受在這里工作的日子。我曾在機(jī)器人上進(jìn)行強(qiáng)化學(xué)習(xí)的早期開發(fā)工作,還訓(xùn)練了世界上第一個(gè)編程模型,這些模型開啟了大語言模型編程革命。
在DeepMind發(fā)布模型Chinchilla之前,我就發(fā)現(xiàn)了后來大家稱為“Chinchilla Scaling Law”的現(xiàn)象。
我參與了GPT-4和ChatGPT的開發(fā)工作,最近還組建了一個(gè)團(tuán)隊(duì),建立了一個(gè)新的縮放訓(xùn)練和推理計(jì)算范式——現(xiàn)在,它通常被稱之為推理模型。
我結(jié)交了許多朋友,在辦公室度過了許多個(gè)夜晚,參與并見證了數(shù)量可觀的技術(shù)突破,還與許多被我視為親密伙伴的人一同歡笑和擔(dān)憂。
我有幸組建并壯大了我認(rèn)為世界上最強(qiáng)的機(jī)器學(xué)習(xí)團(tuán)隊(duì)。
這是一段非常愉快的經(jīng)歷。盡管我要離開OpenAl去嘗試探索一些在OpenAl難以開展的研究領(lǐng)域,但這是一家特殊的公司,也是世界上一個(gè)特殊的存在,它已然在人類歷史的長(zhǎng)河中占據(jù)了永恒的位置。
非常感激多年來OpenAI和你們對(duì)我的信任。這類時(shí)刻總讓人感覺不太自然,但從積極樂觀的角度看待,它們卻可能成為促成偉大事物的催化劑。
我們一起讓機(jī)器智能變得更加有用和可靠,我是忠實(shí)的ChatGPT推理模型用戶。
再次感謝,感謝千千萬萬次。
保重身體,親愛的草莓們。
Jerry
One More Thing
本來吧,附上Jerry的小作文,這篇推文就該結(jié)束了。
但被我翻到了一個(gè)粗看好笑,細(xì)想想又有點(diǎn)道理的留言:
![]()
仔細(xì)想想,OpenAI的朋友們離職時(shí)確實(shí)都有小作文,這是啥不成文規(guī)定嗎?還是企業(yè)文化?
好奇.jpg
參考鏈接:
[1]https://x.com/MillionInt/status/2008237251751534622?s=20
[2]https://www.linkedin.com/in/jerry-tworek-b5b9aa56/
[3]https://warsaw.ai/speaker/jerry-tworek/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.