![]()
出品|虎嗅科技組
作者|趙致格
編輯|苗正卿
頭圖|視覺中國
2026年1月27日,OpenAI首席執行官山姆·奧特曼舉行了一場面向AI從業者的直播對談。在這場長達一小時的座談中,奧特曼和其他OpenAI的員工一共回答了來自線上和線下的22個問題。
在此前一天,奧爾曼在X賬號上對這次活動進行了預告。他表示,希望“在構建新一代工具的過程中獲取反饋”,還稱這場研討會是“一次嘗試,也是對新形式的初步探索”,并鼓勵網友在評論區留下自己想問的問題。
![]()
過去一段時間里,OpenAI頻頻遭遇壞消息。去年12月Gemini3的發布讓ChatGPT不再有顯著領先的技術優勢,OpenAI內部發出“紅色警報”,Anthropic的Claude近期也火爆硅谷。而外界高度關注的另一件事是OpenAI的燒錢速度。人們通過微軟財報發現OpenAI每季度擴損達到令人震驚120億美元,但這些天量資金并沒有為大模型的性能帶來摩爾定律式的指數級進步。
這一次,OpenAI放棄了每個環節都經過精心設計,為產品的亮相層層鋪墊的發布會,而是選擇了主題寬泛,問答形式的研討會,很大程度上向外界展現了一種誠實、開放的低姿態。
在這場活動中,奧特曼僅在一次回答中提到了ChatGPT。當一位提問者說很多人認為GPT-5在寫作上表現不佳,甚至還不如Chat4.5時,奧特曼相當坦誠地表示,公司在這件事上“搞砸了”。
不過奧特曼也解釋到,在研發5.2版本,公司把大量精力放在“智能、推理、編程、工程這類事情”,讓這個版本的ChatGPT出現“偏科”問題。不過奧特曼承諾會在回歸真正高質量的通用型模型賽道,讓下個大模型在所有維度上達到優秀水準。奧特曼還承諾,到2027年底,公司將能提供GPT-5.2水平的高級智力,成本至少降低100倍。
座談會上奧特曼提到另一個和OpenAI產品是Codex。就在幾天前的1月24日,奧特曼在X平臺發文,宣布在未來一個月時間里,OpenAI 將推出多個Codex相關產品,首款產品將于下周推出。
![]()
Codex是一套智能編程輔助生態系統,可以理解為集模型、工具和工作流于一體的AI 軟件工程師。在推文里,奧特曼重點提到介紹了AI編程安全問題,認為對世界最有利的做法是快速修復安全漏洞。而與此同時,OpenAI的官網也發布了一篇技術博文,介紹其跨平臺本地軟件智能體Codex CLI的核心邏輯“智能體循環”。
截止本周三,我們還沒看到OpenAI的Codex相關產品。不過在這次座談中,奧特曼進一步分享了自己對Codex的使用感悟,無疑也是在為接下來的產品發布做預熱。
奧特曼稱,當他第一次使用Codex時,他非常確信自己絕對不會給它“完全的、無人監督的電腦訪問權限”。然而這份自信只堅持了2小時,奧爾曼在2小時后開始感嘆,這個Agent做的一切事“似乎真的很合理”,于是他再也沒有把權限關掉過。
不過奧特曼也提醒了這份強大和便利背后的風險,稱Codex的故障率盡管很低,但一旦發生故障,后果可能就是“災難性的”。
在上述問題之外,奧特曼似乎很大程度上跳出了OpenAI CEO的身份,以行業大佬的視角分享AI的行業趨勢,以及帶給社會及個體的影響。
對于AI引發的失業問題和大廠裁員問題,奧特曼謹慎地表示“我們會更慢地招聘,但繼續招聘”。隨后又補充稱不希望像其他公司一樣“瘋狂招聘”但又不得不進行“某種不舒服的裁員對話”,未來OpenAI不會是一家“零員工公司”。
對于AI對軟件工程師的影響,奧特曼認為未來工程師的敲代碼、調試代碼上的時間將明顯減少,更多精力將用于“讓系統替他們把事辦成”。由于未來會出現越來越多為個人或極小部分群體定制的軟件,軟件工程崗位的需求將遠超當下。
有創業者問及在AI降低軟件開發門檻的年代里感到市場推廣很難。出身YC的奧特曼認為創業的底層規則在任何時代都是一致的,都需要建立差異化價值、打通產品分發渠道,因為人的注意力始終是稀缺資源。
對AI安全問題,奧特曼認為2026年AI的潛在風險集中在生物學領域。而人們面對AI安全的種種隱患應該由“封堵”轉為“韌性建設”,就像一座城市面對火災風險要進行多層級的防護設施建設。
面對AI時代應該學什么技能的問題,奧特曼認為現在已經沒有像“學編程”這樣簡單的答案。“高能動性、韌性、適應快速變化的世界”這些軟技能都是非常重要,而且是可學習的。
可以看出,奧特曼頗為認真地回答了所有問題。然而這次坦誠對話并沒有激起太多水花。在YouTube上,這次活動的播放量僅為8.3萬。評論區里,大多數評論并有討論奧特曼的觀點,而是在抱怨一個小時的視頻太長,奧特曼的話題涉及面過廣,沒有重點。
評論區收獲了最多點贊數的評論是一條諷刺:“Gemini,麻煩總結下這段視頻內容。目前有沒有什么新消息?”;也有網友用其他產品進行諷刺,“你好,claude, 這個視頻會浪費我的時間嗎?”
![]()
實際上, YouTube目前并沒上線任何AI總結助手,但聽奧特曼答疑聽得昏昏入睡的人們顯然等不及了。
評論區還有人抱怨稱自己已經給過奧特曼很多機會了:“我真的受夠了,看了無數個他的視頻,到最后都發現毫無新意。這個視頻也一樣,翻來覆去都是些老生常談的內容,完全沒有任何新穎的見解。”
在Reddit和X上,關于這次活動的討論同樣寥寥無幾。Reddit上唯一一個回復數超過200的帖子是奧特曼承認GPT5為了編程能力而犧牲寫作能力的視頻片段。然而對于奧特曼的解釋,極客們并不信服。
一位叫Advanced-Cat9927網友的認為:“他并非為追逐編程能力而舍棄創意寫作,他是為追逐企業價值,舍棄了對話的延續性”。另一位網友Kryomon則進行了一番辛辣的拉踩:“比不過 Gemini 的圖像能力,拼不過 Claude 的編程水平,寫的內容還躲不過 AI 檢測工具的識別。(ChatGPT)徹底完了。”
![]()
對于OpenAI,想要擺脫當下的困境,除了繼續融資外,最直接的方法無疑推出在榜單上遙遙領先的下一代大模型和其他驚艷產品。在這個人們注意力稀缺的時代,長達一小時的“坦誠交流”顯然無助于吸引關注,挽回形象。
訪談原文
Sam Altman:
非常感謝大家的到來。當我們開始構想為開發者打造的下一代工具,以及思考如何利用即將上線的那些極其強大的模型時,我們想聽聽大家的聲音,想知道你們想要什么,在想些什么,并回答大家的問題。我希望今天的交流能讓我們更清晰地知道該為你們構建什么,以及如何讓這些強大的模型真正發揮作用。
觀眾:
關于軟件工程領域的“杰文斯悖論”(Jevons paradox),你持什么觀點?如果 AI 讓代碼編寫速度大幅提升且成本顯著降低,這會減少對軟件工程師的需求嗎?還是說,更便宜的定制軟件會增加更多需求,從而讓工程師在未來幾十年里依然有飯碗?
Sam Altman:
我認為“工程師”這個職業的定義將會發生巨大的變化。
未來可能會有更多的人讓計算機去執行他們的意圖,或者去實現其他人的需求,并找到方法為他人創造有用的體驗。這些人將創造出遠超現在的價值,并從中獲得更多的回報。
但是,這份工作的狀態,以及你花在敲代碼、調試代碼或其他瑣碎事情上的時間,將會發生極大的改變。這在工程史上已經發生過很多次了。截至目前,每一次變革都讓更多的人能夠參與并變得高效,世界也因此獲得了更多的軟件。世界對軟件的需求似乎一點也沒有放緩的跡象。
我對未來的猜測是:我們現在很多人使用的軟件,原本是為一個人或極少數人編寫的,而我們正在不斷地定制屬于自己的軟件。所以我認為,將來會有更多的人能夠指揮計算機去做他們想做的事情,而且方式會與今天截然不同。
如果你把這種行為也算作“軟件工程”,那么我認為我們將看到這種需求大幅增加,而且我認為世界上更大比例的 GDP 將通過這種方式創造和消費。
現場有什么問題嗎?如果沒有的話,我這里還有一長串清單。請講。
觀眾:
首先感謝你給我們這個機會來到這里向你提問。我是 ChatGPT 的重度用戶。我經常在 Reddit上看到大家在搞開發,不管是使用Codex、Lovable還是Cursor。但現在看來,新的瓶頸變成了市場推廣。我可以把東西做出來,但我如何找到那些需要的我的產品,能從中有所收獲的人呢?我覺得這成了一個瓶頸。很好奇你怎么看這個問題。
Sam Altman:
在做OpenAI之前,我曾經管理過Y Combinator。以前經常聽到創業者們表示,我原以為最難的部分是開發產品,結果發現最難的是讓別人在乎或者去使用它,把產品與人連接起來。
所以我認為市場推廣從來都是極其困難的。只是現在開發變得太容易了,所以你對這種落差的感受更加強烈了。對此我沒有簡單的答案。我認為建立一家企業從來都不是易事,要找到創造差異化價值的方法,要讓市場推廣機制運轉起來,以前所有的規則在這里依然適用。
AI可以讓軟件開發變得極其容易,但這并不意味著其他環節也會變得容易。
不過,就像AI改變了軟件工程一樣,你現在也開始看到人們利用AI來自動化銷售、自動化市場營銷,并且取得了一些成功。但我認為這始終會是個難題,因為即便在一個物質極大豐富的世界里,人類的注意力依然是一種非常有限的資源。
所以你總是要和其他人競爭,試圖建立自己的市場推廣能力,弄清楚如何分發產品。而每一個潛在客戶都很忙,還有其他各種事情。
我可以描繪一種未來的版本:即使“激進的富足”(radical abundance)成真,人類的注意力仍然是僅存的稀缺商品。所以我預計這依然會很難,你需要想出有創意的點子,并打造出偉大的產品。
觀眾:
你好Sam,我是 George。我是一名獨立開發者。我正在基于Codex SDK構建一種編排多個智能體(Agent)的方法。我想問你對你們的Agent Builder(智能體構建器)工具的未來愿景。
目前它還只是工作流和提示詞(Prompt)的串聯。我想知道,作為一個基于 Codex SDK 的構建者,我是安全的嗎?也就是說,你認為未來會有很多不同類型的多智能體編排UI存在的空間嗎?還是說 OpenAI 會把這一塊也做了?
Sam Altman:
不,我認為我們還不知道“正確”的交互界面應該是什么樣的。我們不知道人們將如何使用它。我們看到有人構建了令人難以置信的多智能體系統;我們也看到有人構建了非常棒的單一交互線程。我們不可能獨自搞定所有事情。而且,并不是每個人想要的東西都一樣。
有些人可能會像老電影里演的那樣,面對30個電腦屏幕,盯著這里瘋狂的數據,操作那里,把東西挪來挪去。而我認為也會有人想要一種非常平靜的語音對話模式,他們每小時只對電腦說一句話,電腦在后臺處理很多事情,他們不需要時刻盯著。他們試圖認真思考自己說的話,不想要那種被成堆智能體持續“監督工作”的感覺。
就像很多其他事情一樣,人們必須嘗試不同的方法,看看自己喜歡什么。世界可能會收斂到幾種主流模式,但我們無法把所有模式都探索完。
我認為,構建工具來幫助人們利用這些極其強大的模型提高生產力,是一個非常好的主意。這在目前是完全缺失的。這些模型的能力上限,與大多數人目前能從中挖掘出的價值之間存在著巨大的鴻溝,而且這個鴻溝還在擴大。未來肯定會有人構建出工具來真正幫助大家做到這一點,目前還沒有人完全做對。
我們也會嘗試做我們自己的版本,但這看起來是一個有著巨大空間的領域,而且人們會有不同的偏好。如果你們有什么希望我們構建的功能,請告訴我們,我們可以嘗試。
觀眾:
Sam,我是Valerie Chapman,我正在OpenAI平臺上構建 Ruth。目前女性因為薪資差距大約損失了100萬美元的收入,我想聽聽你的看法。你認為AI如何能被用來解決這些已經存在了幾十年的經濟差距?
Sam Altman:
雖然有很多復雜的情況,但我認為其中一個主要的好消息是,AI 將帶來巨大的通縮效應。
我在這個問題上反復思考過,因為你可以想象一些奇怪的情況發生,比如世界上所有的錢都投入到自我復制的數據中心之類的東西里去了。但總體來看,鑒于目前在計算機前能完成的工作所取得的進展,變革將很快將在機器人技術和其他領域發生,我們的經濟將面臨巨大的通縮壓力。
我說“主要是好消息”,是因為這其中也會有一些復雜的事情需要去應對。除了那些受社會或政府政策限制而無法降價的領域(比如在舊金山建造更多住房之類的),我預計其他東西會變得極其便宜,而且這種趨勢會非常強勁且迅速。
無論社會結構是否天然賦予了某些人所有的優勢,這種對個體能力的賦能,看起來將會不斷上升,越來越高。直到現在我還是覺得這點很難讓人完全理解。你知道,我想說到今年年底,只需要花費100到1000美元的推理成本,再加上一個好點子,你就能開發出一款在過去需要整個團隊花上一年才能完成的軟件。這種經濟變革的規模之大,至少對我來說,是很難在腦海中完全構建出來的。
這對人們來說應該是一件非常賦能的事情。它意味著極大的豐富性和可獲取性,意味著創造新事物、新公司、發現新科學等等的成本將大幅降低。我認為這應當成為社會的一種平衡力量,讓那些過去沒有得到公平對待的人獲得一個真正的好機會。只要我們不在相關政策上犯大錯,雖然這確實有可能發生。
我確實擔心,你可以想象在某些世界里,AI會導致權力和財富的高度集中。因此,防止這種情況發生,感覺必須成為政策的主要目標之一。
觀眾:
我是Ben Hilac。我是一家名為Raindrop的公司的CTO。我很好奇,當你展望未來時,是如何看待模型的“專用化”與“通用化”的?
舉個例子,GPT-4.5是我覺得第一個真正擅長寫作的模型。我記得當時看到它的輸出在想:“這寫得真不錯。”但最近在X上有很多關于GPT-5在ChatGPT中寫作表現的討論,說它有點笨重、難以閱讀。
顯然,GPT-5是一個更好的模型,工具使用能力很強,中間推理能力也很棒,諸如此類。但是模型的能力變得有點“參差不齊”,或者說變得更偏科了。比如它的編程能力的非常突出,但在寫作上卻沒那么突出。所以我很好奇OpenAI是如何看待這一點的?
Sam Altman:
我覺得我們確實把這點搞砸了。我們會在未來的GPT-5.x版本中改進,希望它的寫作能力比4.5好得多。
我們當時確實決定,我認為理由也很充分,把5.2版本的大部分精力放在智能、推理、編程、工程這類事情上。我們的資源(帶寬)是有限的,有時候專注于一件事就會忽略另一件事。但我相信,未來是屬于非常優秀的通用模型的。
即使你想做一個非常擅長編程的模型,如果它能寫得一手好文章也是很棒的。比如,如果你想讓它為你生成一個完整的應用程序,你會希望里面的文案是好的。當它與你互動時,你會希望它具有某種深思熟慮、敏銳的個性,并且表達清晰。這里的寫作能力是指思路清晰,而不是指辭藻華麗。
所以我希望我們能推動未來的模型在所有這些維度上都變得非常好,我想我們會做到的。我認為“智能”是一種令人驚訝的通用能力,我們可以在單個模型中把所有這些事情都做得很好。目前看來,這確實是一個推動所謂“編程智能”的重要時刻。但我們會努力在其他方面也迅速趕上并做到卓越。
觀眾:
我是Unifi公司的CTO。接著你剛才的話題,我們做的是市場自動化(GTM Automation)。我們思考很多并投入大量時間的一個領域是那種“永遠在線的AI”,一種無處不在的AI。
你說過一句話讓我很有共鳴,就是“智能將便宜到無需計量”。對于我們要為客戶運行數百萬、數千萬甚至數億個智能體來說,限制因素就是成本。你是怎么看待小模型,以及未來幾個月或幾年開發者面臨的劇烈成本下降?
Sam Altman:
我認為到2027年年底,我們應該能夠提供某種GPT-5.2x到更高水平的智能。你想猜個數字嗎?不然我就給個預測。有人想猜嗎?我會說成本至少會降低100倍。
但還有一個維度我們過去沒怎么考慮,而現在隨著模型輸出變得如此復雜,越來越多的人在催促我們提高交付速度,而不是降低成本。但其實我們成本曲線下降這方面做得很好。你可以看看我們從最初的o1預覽版到現在取得的進展。
但我們還沒怎么思考過如何以1/100的時間交付同樣的輸出(也許價格會高很多)。我認為對于你提到的很多應用場景,人們真的會想要這種速度。
我們必須弄清楚如何在優先考慮這兩者之間取得平衡。不幸的是,這是兩個非常不同的問題。但假設我們全力推動降低成本,并且假設這也是你們以及市場想要的,那么我們可以在降低成本這條路上走得很遠。
觀眾:
目前的界面并不是為智能體(Agents)設計的,但我們看到“為我構建的App”正在興起。為什么自定義界面的創新會進一步加速微型應用的趨勢?
Sam Altman:
是的,這是我在最近使用Codex時注意到的一個現象。我不再把軟件看作是一個靜態的東西。
如果我有一個小問題,我期望電腦能立刻寫一段代碼幫我解決它。我認為這個趨勢會走得更遠。我懷疑我們使用計算機和操作系統的方式將會徹底改變。
我不認為這會變成每次你需要編輯文檔時,系統會當場為你寫一個新版本的文字處理軟件,因為我們已經很習慣現有的界面了,按鈕還在上次那個位置這很重要。
但對于我們做的很多其他事情,我認為我們會發現,我們期望軟件是專門為我們編寫的。也許我想每次都用同一個文字處理軟件,但我確實有一些重復的使用怪癖,我希望軟件能日益定制化。
你知道,這可能是一個靜態的或緩慢進化的軟件,但它是為我而寫的,我使用它的方式和你使用它的方式是不同的。這種我們的工具不斷進化并專門為我們改變的想法,看起來是必然會發生的。
當然,在OpenAI內部,人們現在已經非常習慣在工作流中使用Codex了。每個人都有自己獨特的定制小習慣,使用方式也截然不同。這似乎是必然的趨勢,我認為這是構建產品的一個非常好的方向。去弄清楚未來的形態以及人們將如何操作,這看起來很棒。
觀眾:
當創業公司的功能很快就會被模型更新所取代時,建設者該如何思考產品的“耐用性”?你承諾絕對不會去吞噬的技術棧是哪一層?
Sam Altman:
我們之前稍微聊過一點這個話題。人們很容易誤以為商業的“物理定律”已經完全改變了,其實還沒有。它們可能會隨著時間推移而改變,但目前真正的變化是你工作得更快了,創造新軟件的速度快得多。
但是,建立一家成功創業公司的所有其他規都沒有變:你需要找到獲取用戶的方法,解決市場進入(GTM)問題,提供有粘性的產品,建立某種護城河、網絡效應或競爭優勢,無論你怎么稱呼它。
好消息是,這些規則對我們來說也沒變。有很多創業公司做的事情,可能在一個完美世界里我們早就該做了,但太晚了,別人已經建立了真正持久的優勢,這種情況還會繼續發生。
當人們問我這類問題時,我總是給出一個通用的思考框架:如果 GPT-6 是一次驚人的、巨大的更新,你的公司會感到高興還是難過?
我鼓勵大家去構建那些你極其渴望模型變得更好的產品。這樣的構建方向有很多。相反,如果你的產品只是在模型邊緣打個小補丁,雖然如果你在模型升級前建立了足夠的優勢也可能行得通,但這是一條更艱難、壓力更大的路。
觀眾:
關于能夠自主運行長工作流而無需人類持續干預的智能體(Agents),現實的時間線是怎樣的?畢竟現在即使是簡單的鏈上任務往往也會在5到10步后崩潰。OpenAI 有人想發表一下意見嗎?
OpenAI 員工:
我認為這真的取決于任務類型。在 OpenAI 內部,我們看到人們以非常特殊的方式提示 Codex。也許他們在使用 SDK,就像一個定制的線束不斷提示它繼續,但他們基本上可以讓它永遠運行。所以我認為這不是“何時”的問題,而是視野拓寬的問題。
如果你有一個非常具體的任務且你很了解它,現在就可以嘗試。如果你開始想:“好吧,我想提示模型去建立一個創業公司”,這是一個更開放的問題,驗證循環要難得多。所以我建議你弄清楚如何將其分解為不同的問題,讓智能體能夠自我驗證,或者讓你能在最后驗證其最終輸出。隨著時間推移,我們可以讓智能體做越來越多的任務。
觀眾:
Sam,我想回到關于“人類注意力和市場進入的問題上。我總是認為,人類注意力是消費側的限制因素。而在生產側,對于所有的建設者來說,限速因素是“想法的質量”。我花很多時間幫助 AI 公司做 GTM,很多時候產品其實根本不值得用戶的關注。所以我想問,你們能構建什么工具來提高人們想出的點子的質量呢?
Sam Altman:
現在流行把 AI 的輸出稱為“垃圾(slop)”,但世界上也有很多人類制造的垃圾。想出好的新點子是非常難的,我越來越相信,我們的思考受限于我們的工具。
我認為我們應該嘗試構建幫助人們想出好點子的工具。我相信有很多這樣的機會。隨著創造的成本持續暴跌,我們將擁有如此緊密的反饋循環來嘗試點子,從而更快地找到好點子。而且隨著 AI 能夠發現新科學,以及編寫非常復雜的代碼庫,我有信心將會出現一個全新的可能性空間。
但是,很多人都有這樣的經歷:坐在 AI面前,卻不確定下一步該要求什么。如果我們能構建工具來幫助你想出好點子。我相信我們能做到。我相信我們可以通過分析你過去所有的工作和代碼,試圖找出什么對你有用或有趣,并持續為你提供建議。
如果我們能提供一個真正偉大的“頭腦風暴伙伴”。我生命中有三四個人,每次和他們相處,我離開時都會帶著很多想法。他們非常擅長提問或給你提供構建的基礎。比如 Paul Graham(YC創始人)在這方面就強得離譜。
如果我們能構建一個“Paul Graham 機器人”,你可以和它進行同樣的互動來幫助產生新想法,哪怕其中大多數是壞主意,哪怕 100 個點子里有 95 個你都說“絕對不行”。但我認為像這樣的東西,將對世界上涌現的好東西的數量做出重大貢獻。而且模型感覺應該具備這種能力。
對于 GPT-5.2(我們在內部使用的一個特殊版本),我們第一次從科學家那里聽到,這些模型在科學上的進展不再是微不足道的了。既然一個模型能提出新的科學見解,我無法相信它不能提出關于產品構建的新見解。只要有不同的引導機制和稍微不同的訓練方式。
觀眾:
大家好。我是Theo,開發者YouTuber也是 YC 創始人。我也真的很想要那個 Paul Graham 機器人。我想問一個稍微不同的問題,更多關于技術方面的。我真的很喜歡我們使用的構建模塊技術不斷進化,我經歷過Web領域的一些瘋狂革命,比如轉向 TypeScript 和 Tailwind 等等。
隨著模型和我們用來構建的工具變得更好,我擔心的一個問題是:我們可能會被困在現有的工作方式中,就像美國的電網是以某種方式建立的,導致事情變得更糟且我們無法真正改變它。你看到這種可能性了嗎?我們是否正在用現有的技術打地基,導致未來更難更換?因為現在即使試圖讓當前模型使用兩年前更新的技術,感覺也像拔牙一樣難。你認為我們能引導模型去使用新東西嗎,還是說我們只能在現有的技術基礎上修修補補?
Sam Altman:
我認為我們在讓模型使用新事物方面真的會做得很好。本質上,如果我們正確使用這些模型,它們就像通用推理引擎。目前的架構確實內置了大量世界知識。但我認為我們正朝著正確的方向發展。
我希望在未來幾年內,模型能比人類更快地更新知識和學習新技能。一個我們將引以為豪的里程碑是:當模型面對全新的東西,如新環境、新工具、新技術等等,你只需要解釋一次(或者讓模型探索一次),它就能超級可靠地使用并做對。這感覺并不遙遠。
觀眾:
抱歉,我有一個問題我覺得你可能已經觸及到了。作為一名科學家,而且是年紀稍長的那種。當你做一個科學項目時,它往往會產生多個進一步研究的想法。所以想法是指數級增長的,而一個科學家執行這些想法的時間卻是線性減少的。這些工具加速它的方式令人難以置信。
但我們都很貪婪,想要更多。你之前提到了這一點,但你認為除了幫助我們在更短的時間內追求有趣的想法之外,是否會有一個轉變,讓模型接管整個研究事業?如果是這樣,你認為這是來自現有的算法,還是需要新的想法或世界模型之類的東西?
Sam Altman:
我認為距離模型在大多數領域進行真正完全閉環的自主研究還有非常長的路要走。
我們可以看看像數學這樣的領域,然后說:“好吧,那個不需要濕實驗室或物理輸入。”也許你可以通過非常努力的思考并不斷更新模型來取得巨大進展。但即使在那里,目前利用模型取得最大進展的數學家們,依然非常深度地參與其中。他們會查看中間進度,然后說:“不,這感覺不對,我的直覺告訴我這條路徑上有不同的東西。”但我遇到過幾位數學家,他們現在說他們的一整天都在與最新的模型合作,進展神速,但他們做的事情與模型非常不同。
老實說,這感覺很像國際象棋歷史上深藍擊敗卡斯帕羅夫后的那段時期。當時有一段時間,AI 比人類強,但“人類+AI”比單純的 AI 更強。但在那之后很快,AI 再次變得更強,人類的干預反而只會把事情搞砸。
我有一種預感,對于許多類型的研究而言,隨著時間的推移,情況會變得極其復雜,以至于AI在理解多步驟任務方面的表現,將超越大多數人,甚至所有人。
不過,在創造力、直覺和判斷力方面,目前這一代的模型似乎還差得很遠。我想不出任何原則性的理由來解釋為什么我們無法達到那個境界,所以我假設我們最終會做到。
但在今天,我不認為僅僅對 GPT-5 或 GPT-6 說“去解決數學問題”,就能勝過幾個非常優秀的人利用AI輔助來做數學研究。這些人可以判斷“這是一個好的方向”,或者即使我們可以驗證并說“你做了一個很棒的證明,把它放回訓練集”,這其中還有其他的事情在發生。
不過你提到了一點關于工作流程的問題,也就是你解決了一個問題,卻引出了許多新問題。這正是與那些積極使用AI的科學家交流時非常酷的地方。我的意思是,他們在這個過程中消耗了大量的GPU算力,但我認為出現了一種新技能,那就是能夠列出20個新問題,然后對它們進行“廣度優先搜索”。我不會在任何一個問題上鉆得太深,而是把AI當作“無限的研究生”來使用——有人是這么形容的。其實我最近把這個說法升級成了“無限的博士后”。
關于物理科學的自動化,我們經常反復討論是否應該為每個領域建立自動化的濕實驗室。我們對此持開放態度,但也可能全世界會自己設計出很棒的實驗,利用現有的設備,并樂于回饋數據。看著科學界擁抱我們的新模型,以及他們如此樂于提供幫助,這種模式似乎是行得通的。這顯然會構建一個更輕松、更美好、更分布式、匯聚更多聰明人和不同設備的世界。
觀眾:
Sam,我是 Emmy。我是斯坦福的學生,經營著一家生物安全初創公司。接續您關于科學實驗以及云實驗室未來發展的討論,我的團隊花了很多時間思考如何防止AI輔助的生物重組帶來的危害,同時也思考如何利用AI來提升安全基礎設施。所以我想問的是,在這個未來的路線圖中,安全處于什么位置?您如何看待這些問題?
Sam Altman:
你是泛指安全還是特指生物安全?
觀眾:
兩者都是,最好是生物安全。
Sam Altman:
在2026年,AI可能會在很多方面出問題。當然,我們非常擔心的一個領域就是生物學。
現在的模型在生物學方面表現相當出色。目前我們,不僅僅是OpenAI,而是全世界其他公司的策略是試圖限制誰能訪問這些模型,并設置一堆分類器以防止幫助人們制造新型病原體。但我認為這種做法撐不了太久。
我認為世界在AI安全,特別是AI生物安全方面需要做出的轉變,是從“封堵”轉向“韌性(resilience)。我的聯合創始人Wojtek用了一個我很喜歡的關于消防安全的類比。火為社會帶來許多美好的事物,但也開始燒毀城市。我們曾試圖采取各種措施限制火的使用。我這個周末才剛知道,“宵禁”(curfew)一詞其實源于以前為了防止燒毀城市而不允許生火的時候。后來我們在應對火災的韌性方面做得更好了,我們制定了消防法規,發明了阻燃材料等等。現在的社會在這方面已經做得很好了。
我認為我們需要以同樣的方式思考AI。AI確實會給生物恐怖主義和網絡安全帶來真正的問題,但AI同時也是解決這些問題的方案。它也是許多其他問題的解決方案。
我認為我們需要全社會的努力來提供這種韌性的基礎設施,而不是指望實驗室總能封堵住它們該封堵的東西。畢竟世界上會有很多優秀的模型出現。
我們一直在與許多生物研究人員和公司交流,探討如何應對新型病原體。很多人對這個問題感興趣,也有很多人反饋說AI在這方面確實看起來很有幫助,但這不會是一個純粹的技術解決方案。你需要全世界以不同于以往的方式來思考這些事情。
所以我對目前的狀況非常緊張,但除了這種基于韌性的方法外,我看不到其他路徑。而且看起來AI確實能幫助我們快速做到這一點。如果今年AI真的出了什么大問題——那種顯而易見的大問題——我認為生物領域是一個合理的推測方向。
如果你展望明年和后年,你可以想象還有很多其他事情也可能會出大亂子。
觀眾:
我叫 Magna。我的問題有點關于人類協作。當我們談論AI模型進步時,我認為它們變得非常擅長讓你獨自快速學習主題或學科。這也是我們在ChatGPT與教育實驗室中探索過的,我非常重視也很欣賞這一點。但我經常反思的一點是其他人類和人類協作的角色。如果你能觸手可及地得到答案,那你為什么還要花時間,甚至克服摩擦去問另一個人呢?
Sam Altman:
這也是我一直在深入思考的問題,和你之前提到的觀點有關。既然所有的AI編程工具都能以更快的速度完成人類團隊的工作,那么當我們思考合作、協作和集體智慧的產出時,我知道“人類+AI”是一個非常強大的途徑。
觀眾:
但是“多個人類+AI”呢?這說得通嗎?
Sam Altman:
完全說得通。這里面有很多層含義。
我比你們大多數人都年長,Google剛出來的時候我還在上初中。當時的老師試圖讓孩子們發誓不使用它,因為他們覺得如果你動動手指就能查到任何東西,那為什么還要來上歷史課?為什么要背誦任何東西?
這在我看來完全是瘋了。我當時的想法是:實際上,我會變得更聰明,能學到更多東西,能做更多的事。這是我成年后將與之共存的工具。如果我不學習使用它,卻強迫我學習一些假設它不存在的東西,那是很荒謬的。這感覺就像是,明明已經有了計算器,卻還強迫我學習使用算盤,僅僅因為那是一個“需要學習的重要技能”。
我對AI工具也有同樣的感覺。我理解在目前的教學方式下,AI工具是個問題。但這表明我們需要改變教人的方式。而不是說我們不希望你能用ChatGPT幫你寫東西,因為世界將會變成那樣。你仍然需要學會思考,而學習寫作或練習寫作對于學習如何思考非常重要。但很可能,我們教你思考的方式以及評估你思考能力的方式已經變了,我們不應該假裝沒變。
所以我完全覺得這沒問題。那些前10%的自學者已經做得非常棒了。我們會找出新的課程教學方法,帶動其他學生跟上。
然后是你提到的另一點:如何讓這成為一件協作的事情,而不僅僅是你獨自對著電腦學習、表現和做驚人的事情?
我們還沒有看到這方面的確鑿證據,這也是我們試圖衡量的東西。我懷疑在一個AI無處不在的世界里,人與人的連接將變得更有價值,而不是更少。人們會更看重聚在一起與他人共事。
我們已經開始看到人們探索讓這變得更容易的界面。當我們考慮制造自己的硬件、自己的設備時,我們思考了很多,甚至可能是首先思考的就是一個“多人協作+AI”的體驗會是什么樣子。
我的感覺是,雖然還沒人完全攻克這一點,但我們將驚訝地發現,AI以一種其他技術從未有過的方式賦能了這一點。你可以有五個人圍坐在桌旁,中間有一個小機器人之類的東西。作為一個團隊,你們的生產力會高得多,而且你們會習慣這種常態。比如每一次團隊頭腦風暴,每一次試圖解決問題,都會有AI參與其中,幫助團隊做得更好。
觀眾:
太棒了。順便提醒一下,任何需求只要告訴你們,你們可能就會做出來是吧?
Sam Altman:
哎呀,說漏嘴了。
觀眾:
謝謝。我想問的是,隨著Agent開始更多地運行和操作生產系統,特別是在大規模應用時,你認為哪里是被最嚴重低估的故障模式?比如安全性、成本、可靠性?與之相關的,目前哪里的艱巨工作是被投資不足的?
Sam Altman:
到處都是問題。你提到了一點,這讓我個人非常驚訝,我想讓我們這里的很多人都感到驚訝。
當我第一次開始使用Codex時,我就在想:“我不知道這東西會怎么發展,但我絕對不會給這東西完全的、無人監督的電腦訪問權限。”我對此非常自信。
但我只堅持了大約2個小時。然后我就想:“你知道嗎,這看起來很合理,這個Agent做的事情似乎真的很合理。我討厭每次都要批準這些命令。我就把權限打開一會兒,看看會發生什么。”
然后我就再也沒有把全權限關掉過。我想其他人也有類似的經歷。所以我的擔憂是:這些工具是如此強大和便利,雖然故障率很低,但一旦發生故障可能就是災難性的。我們會滑向一種“活在當下”的心態,覺得“希望能沒事”。
隨著模型能力越來越強,越來越難以理解它們所做的一切,如果模型出現不對齊(misalignment),如果在數周或數月的使用中出現某種復雜的問題,或者你在制作的東西中引入了某種安全漏洞……你可以對AI失控的科幻程度持有不同觀點,但我認為將會發生的是:采用這些工具的壓力,或者說使用它們的喜悅和力量是如此巨大,以至于人們會被裹挾著前行,而沒有充分思考運行這些東西的復雜性,以及如何確保他們設置的沙盒是安全的。
我普遍的擔憂是,能力將急劇上升。我們會習慣于模型在某個水平上的運作方式,并決定信任它們。如果在沒有建立非常好的、我稱之為“宏觀安全基礎設施”的情況下,我們將像夢游一樣陷入某種危機。我認為建立這種安全基礎設施將是一個偉大的創業方向。
觀眾:
我想回到關于教育的話題。我叫Claire,是伯克利大學認知科學和設計專業的大二學生。我在高中時看到同學們用ChatGPT寫論文和作業。現在我在大學里,我們在討論關于AI政策、課程作業、計算機科學和人文學科的問題。
我想問,如果在幼兒園和初中時期,在真正塑造人們如何解決問題、如何寫作和思考的時期,AI進入課堂會是什么樣子?作為一個現在的父親,你認為AI在這些成長期將如何塑造教育?
Sam Altman:
總體來說,我支持讓計算機遠離幼兒園。我認為幼兒園的孩子應該在外面跑來跑去,接觸真實的物品,嘗試學習如何與彼此互動。所以,不僅我不建議在大多數幼兒園使用AI,大多數時候我也不會放計算機進去。
我認為在發展心理學上,我們仍然不了解技術的所有影響。關于社交媒體對青少年的影響已經有很多文章,看起來相當糟糕。但我有一種感覺,不幸的是,大量技術對幼兒的影響甚至更糟,而且目前討論得相對較少。我認為在我們要更好地理解這一點之前,幼兒園可能不需要使用大量的AI。
觀眾:
我叫Alan,我在生物制藥行業。生成式AI對臨床試驗文檔的編寫非常有幫助,加速了很多事情,非常棒。我們也試圖用它進行藥物設計,特別是化合物設計。我們遇到的一個問題是3D推理。我想知道這是否會有一個拐點,或者你是否看到了這方面的未來?
Sam Altman:
我們會解決這個問題的。我不知道這是不是2026年能解決的事。但這是一個超級普遍的需求,我認為我們知道怎么做。我們只是有很多其他緊急領域需要推進,但我們會做到的。
觀眾:
Sam,我是Dan。我剛從倫敦的一所大學退學,加入了W26 Y Combinator批次。我有兩個問題。第一,我的父母仍然在某種程度上向我施壓,讓我完成大學學業。你認為大學目前的狀況有時會是一種限制嗎?第二,你做天使投資嗎?
Sam Altman:
我也是大學退學的,我父母花了10年時間才停止問我什么時候回去。所以我覺得父母就是會這樣,他們愛你,他們試圖給你他們認為最好的建議。你就繼續向他們解釋:如果你想回去,你隨時可以回去,但現在的世界不同了,而且會持續變得不同。
每個人都得做自己的決定,但我認為你需要做你自己的決定,而不是照社會告訴你的去做。
我個人認為,如果你是一個AI建設者,現在這個時候待在大學里可能不是對你時間的最佳利用。如果你是一個有野心、高能動性和驅動力的人,這是一個非同尋常的時期。而且你知道,你以后總是可以回去的。
我想你可以告訴你父母,這并不意味著大學對很多人來說不是正確的事,也不意味著它將來某天對你來說不是正確的事,但現在你要做這件事,我想他們最終會理解的。
關于第二點,我尊重這種拼搏精神,但我不再做天使投資了。我很懷念它。但我忙于OpenAI,而且這會變得很奇怪。如果我最終投資的公司是OpenAI的大客戶,我決定還是不投比較簡單。
觀眾:
Sam,我是來自WorkOS的Michael。我們做很多關于認證、身份和登錄的事情。所以我有個功能請求:用我的ChatGPT賬號登錄。我想很多人會喜歡這個。
Sam Altman:
我們會做這個的。人們一直問我要這個功能。你需要什么?你是希望人們能帶上他們的Token預算,還是希望他們帶上ChatGPT的記憶?
觀眾:
這就是我的問題。Token預算肯定需要。但我認為還有其他東西,比如我的公司有權訪問哪些MCP服務器?或者ChatGPT有關于我有什么記憶?我在做什么項目?我很好奇你是怎么想的,因為ChatGPT從工作角度和非常個人的角度都知道我很多事情。開發者該如何利用這一點?
Sam Altman:是的。所以我們確實想弄清楚怎么做。但這非常可怕,因為ChatGPT確實知道你太多事情了。
如果你告訴一個和你非常親密的人一堆秘密,你可以相對自信地認為他們知道確切的社交分寸:什么時候跟誰分享什么,某件事比另一件事更重要。我們的模型還沒完全達到那個程度,雖然它們正變得相當不錯。
如果我把我的ChatGPT賬號連接到一堆網站上,然后說“利用你從我所有聊天記錄和連接內容中知道的信息,自行判斷何時分享什么”,我會感到不舒服。
但當我們能做到這一點時,這顯然是一個很酷的功能。在此期間,我認為僅僅做一些關于Token預算的事情,比如如果我付費使用了Pro模型,那我可以在其他服務上使用它。這看起來是一件很酷的事情。所以我想我們至少會做這個,我們會試圖找到正確的信息共享方式,但我們真的不想把這件事搞砸。
觀眾:
Sam,我叫Oleg。我想我們都同意,軟件開發作為一門手藝最近發生了巨大的變化。但與此同時,LinkedIn上仍然有OpenAI招聘軟件開發工程師的職位。我很好奇,在過去的幾個月或幾年里,面試發生了怎樣的變化?
Sam Altman:
我們會繼續招聘軟件開發人員。但我們第一次——我知道每家其他公司和初創公司也在思考這個問題——計劃大幅放慢我們的人員增長速度,因為我們認為我們可以用更少的人做更多的事。
我認為目前我們面臨的很多阻礙,或者其他公司面臨的阻礙,僅僅是因為大多數公司建立的內部政策并沒有考慮到“大多數同事是AI”的情況。這需要一段時間來適應。
但我認為我們不應該做的是,我也希望其他公司不要這樣做,就是瘋狂招聘,然后突然意識到AI可以做很多事情,你不需要那么多人了,然后不得不進行某種非常不舒服的裁員對話。
所以我認為對我們來說正確的方法是放慢招聘速度,但保持招聘。我不相信未來OpenAI會有零個員工。在為了很長一段時間內,我們將擁有逐漸增加的人數,做著多得多的事情。這也是我預期整體經濟形態會呈現的樣子。
至于面試是什么樣子的,它還沒有發生應有的變化,但我今天還在和一個會議上的人討論我們希望它如何變化。我們基本上希望讓你坐下來,做一件在去年這個時候一個人兩周都不可能完成的事情,然后看你在10分鐘或20分鐘內完成它。
這就是高優先級的點:你想通過面試看到人們能夠高效地以這種新方式工作。我認為軟件工程面試長期以來一直很糟糕,也許不太相關,但現在它們變得更不相關了。
還有更普遍的一點,這幾個問題都暗示了,未來的公司是沒有太多人、擁有大量AI同事?還是未來的贏家是完全的AI公司,比如只有一機柜的GPU,沒有人類?我真的希望是前者。
有很多理由表明它可能接近后者。但是,如果公司不積極采用AI,如果公司不弄清楚如何招聘能有效使用這些工具的人,它們最終會被完全沒有人類、不需要遵守阻止大公司使用AI的愚蠢政策的全AI公司淘汰。這感覺對社會來說將是一件非常不穩定的事情。
我們一直在試圖弄清楚如何談論這個問題,因為這聽起來像是我們在自賣自夸,但我認為公司非常迅速地大規模采用AI是非常重要的。
觀眾:
Sam,我是Cole。我是一名創作者和電影攝影師。我認為尤其是在過去的一年里,AI完全改變了我們講故事的方式,也因此改變了我們看待自己的方式。在創意領域有很多有趣的嘗試,比如Sora,它是一個非常有趣的將“自我”作為畫布的用法,讓你能夠使用AI將自己置入所有這些奇幻的場景中。真的很好奇,隨著這些模型繼續進步,你認為人類創意與AI輔助創作之間的關系將走向何方?
Sam Altman:
我們現在可以研究并學到最多的領域是圖像生成。它存在的時間最長。創意社區使用它,討厭它,也最喜歡它。
這其中有很多有趣的觀察,其中之一是,如果被告知圖片是由人制作的而不是AI,圖像的消費者會報告顯著更高的欣賞度和滿意度。
我認為這將是未來幾十年的一個深刻趨勢:我們非常在乎其他人,而對機器毫不在意。在所有對AI的蔑稱中,“Clanker(破銅爛鐵)”是我最喜歡的一個。我覺得它非常喚起人們的情緒反應。
你可以看到這些令人難以置信的、美麗的圖像,然而一旦你被告知那是AI做的,許多人的主觀欣賞度就會直線下降。
去年我在網上看到一個東西,他們去找那些聲稱非常討厭AI生成藝術(靜態圖片)的人。這些人還會說:“我肯定能分辨出哪些是AI生成的,因為它們很糟糕。”
然后給他們看10張圖,讓他們給最喜歡的排序。一半完全由人類完成,一半完全由AI完成。結果相當一致,他們會把AI生成的排在前面。然后一旦被告知真相,他們就會說:“其實我不喜歡它,這不是我想要的。”
這就是某種測試:你到底喜歡什么?當我讀完一本我喜歡的書,我想做的第一件事就是去查作者,了解他們的生活,以及是什么引導他們寫出這本書,因為我感到與這個我不認識的人建立了聯系,我想了解他們。
我想如果我讀了一本偉大的小說,最后得知它是由AI寫的,我會感到某種悲傷和失落。
我認為這將是一個深刻而持久的趨勢。然而,如果藝術作品哪怕只有一點點人類的指導(至于多少算少,我們要隨著時間推移去觀察),人們似乎就沒有那種強烈的負面情緒。這種情況已經存在很久了,如果數字藝術家使用Photoshop,人們仍然喜歡他們的藝術。
所以我基于現在從創作者和消費者那里看到的行為,我的預期是:人、他們的人生故事、他們的編輯或策劃過程,將變得非常重要。廣義上講,至少從我們在圖像中學到的來看,我們不會想要完全由AI生成的藝術。
觀眾:
Sam,我叫Keith Curry,剛從舊金山州立大學畢業。我的問題圍繞個性化和記憶。第一部分是你認為這將如何隨時間演變?第二是你對更細粒度的看法,比如記憶分組?例如這是我的工作身份,這是我的個人身份。這樣當你進行不同的提示時,你可以更有選擇性地決定包含什么。
Sam Altman:
是的。我們將大力推進記憶和個性化。很明顯,人們想要它,它提供了更好的工具使用體驗。
我自己也經歷了一個轉變,但在這個點上,我已經準備好讓ChatGPT查看我的整個電腦和整個互聯網并且知道一切。因為它帶來的價值太高了,我不像以前那樣對此感到不舒服。我真的希望所有AI公司都非常認真地對待安全和隱私,我也希望整個社會都這樣做,因為效用太大了。
AI將會了解我的一生。我不會阻礙這一點。我還覺得自己沒準備好戴那種記錄一切的眼鏡,出于很多原因那仍然讓人不舒服,但我確實準備好說:“你可以訪問我的電腦。弄清楚發生了什么,對我有用,理解一切,擁有我數字生活的完美映射。”
我很懶。我認為大多數用戶也很懶。所以我不想坐在那里必須分組:這是工作記憶,這是個人記憶。我想要并且我相信可能實現的是:AI對我生活中復雜的規則、互動和層級有如此深刻的理解,以至于它知道何時使用什么,在哪里暴露什么。我們最好弄清楚這一點,因為我認為這也是大多數用戶想要的。
觀眾:
Sam,我叫Luan。我是來自越南的一名國際學校學生。我的問題是,你認為在AI時代,人們應該學習的最重要的技能是什么?
Sam Altman:
人們應該學習的都屬于軟技能,沒有一個是像“學編程”那樣,盡管這在過去一段時間一直是正確的建議。
這些軟技能包括:具有高能動性、擅長產生想法、非常有韌性、能夠適應快速變化的世界。我認為這些將比任何特定的技能都重要,而且我認為這些都是可學習的。
這是我作為創業投資者遇到的驚喜之一就是你可以帶一群人,在一個為期三個月的訓練營式環境中,讓他們變得極其強大,并在我剛才提到的所有維度上做到這幾點。這非常令人驚訝的。這對我來說是一個很大的認知更新。所以我認為這些可能是最重要的技能,而且它們是非常容易習得的。
Sam Altman:
非常感謝大家來交流。我們真的希望得到關于你們想讓我們構建什么的反饋。
假設我們將擁有一個比當前模型強100倍的模型,擁有100倍的上下文長度,100倍的速度,成本降低100倍,完美的工具調用能力,極端的連貫性……我們會到達那里的。
告訴我們你們想讓我們構建什么。我們會在這附近待一會兒。謝謝大家的到來。
本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4830566.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.