<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      ChatGPT本來要5天后關掉

      0
      分享至

      "發ChatGPT只是為了看看能不能收集一些真實的用戶數據。我們預期可能一開始有1萬2萬用戶,然后慢慢跌回去,5天之后沒人了就關掉。"

      這是翁家翌在一期播客里說的。
      他是誰?從GPT-3.5、GPT-4、GPT-4o到GPT-5,每一個OpenAI大模型發布,貢獻者名單里都有他的名字。他在OpenAI內部搭建了整個后訓練階段的強化學習基礎設施——簡單說,就是讓GPT從"會說話"變成"聰明好用"的那套系統。

      2022年11月30日,ChatGPT上線。

      結果不是慢慢跌回去,是指數增長,服務器被打爆好幾次。

      "我當時在歐洲開會,發現周圍所有人都在討論ChatGPT。"

      但他自己一開始并不覺得這東西有多厲害。

      "我第一次用可能會覺得,哦,這是個會說話的模型,也就這樣吧。用了幾次發現能幫我解決一點代碼問題,但也不能幫我解決那么多。"

      因為他提前接觸了,有個循序漸進的過程,所以不覺得它多突然。但對外面的人來說,這是一個巨大的沖擊。

      "這是我沒想到的。"

      現在回頭看,ChatGPT的成功有很大的偶然性。如果當時真的沒人用,可能就關掉了。

      這期播客兩個多小時,我從頭看到尾。翁家翌講了很多OpenAI內部的事情,有些挺顛覆認知的。

      GPT-4的強化學習是比GPT-3.5先調通的。

      "3.5當時用的是舊的基礎設施,新的是2022年8月剛好。我先在新的上面調通了第一版PPO,用的是GPT-4。"

      所以技術時間線和產品發布時間線是兩回事。外面的人以為3.5先做出來,4是升級版。實際上后訓練這塊,4先跑通的。

      OpenAI的模型為什么比別人強?有什么黑魔法嗎?

      "沒有黑魔法。每家的基礎設施都有不同程度的bug,誰修bug越多,誰的模型訓得就越好。"

      他甚至說:"算法連改都不用改,把bug全修了就很好。"

      這話聽起來有點反直覺。大家總覺得OpenAI一定有什么秘密武器,什么獨家算法。結果核心競爭力是"修bug修得多"。

      怎么知道訓出來的模型是好的?有什么客觀指標嗎?

      "沒有。最后就是你真的拉下來看一看,跟它交互幾次,多找幾個人來投票。"

      就這么樸素。

      2024年,DeepSeek崛起,OpenAI內部緊張了一波。

      但緊張的原因不是很多人以為的"榜單被超了"。

      "我們很長時間以來都沒有為了刷榜做什么事情。我們真正在意的是迭代速度。DeepSeek聲稱他們的迭代速度非常快,這個引起了很多人的警覺。"

      在這個行業,迭代速度就是生死線。單位時間內能跑多少次實驗、能驗證多少個idea,決定了你能走多遠。

      "內部的迭代速度其實相比于一些小團隊是有點慢的。組織大了就是這樣。"

      OpenAI從翁家翌入職時的280人,漲到了現在的3000多人。組織大了,context sharing就難了,代碼庫開始臃腫,迭代速度自然會掉下來。

      他還提到一個細節:DeepSeek出來之后,John Schulman(OpenAI聯合創始人,PPO算法發明者)問過他,要不要把強化學習的基礎設施開源。

      "我當時覺得不太好吧,為了公司的考量。但他確實問了我這個事。"

      那這個人是怎么進OpenAI的?

      說出來可能會讓一些人感到安慰:他不是傳統意義上的天才。

      NOI(全國信息學奧林匹克競賽)拿的是銅牌,福建省隊倒數第一,其他人全是銀牌以上。高考面臨兩個選擇:簽上海交大本一線錄取,穩了;或者簽清華降60分,但萬一發揮失常呢?

      他選了清華。

      "當時對這種不確定性非常害怕,但想了想,我應該也沒那么差吧。"

      后來申請美國讀博,圖靈獎得主Yoshua Bengio的推薦信,結果PhD全拒,只拿到CMU的碩士。

      "當時還是有點失望的。整個清華內部的氛圍就是PhD比master好,這個鄙視鏈你身在其中很難擺脫。"

      但他很快想通了。

      "如果你想進工業界,那讀PhD就是浪費生命。"

      他有一套自己的評價體系。

      導師跟他說過:計算機系的評價標準有三個——論文、比賽、GitHub star三位數以上。

      "這給了我一個完全不一樣的想法。我可以在開源社區搞一些事情,讓自己跟別人不一樣。而不是花很多時間去刷GPA。"

      GPA他怎么處理的?

      "最低限度投入。算一下期末考之前已經多少分了,夠用就行,多一分都不想花時間。"

      他在清華干了一件讓學長學姐不太高興的事:把自己收集到的所有作業、資料、上古材料,全部在GitHub上開源了。

      "你現在隨便抓個計算機系的學弟問,認不認識翁家翌,應該認識。因為大家都看我的作業活的。"

      為什么要這么做?

      "我覺得應該打破信息差。信息差在清華是個很有用的東西,但我覺得每個人都應該平等地擁有這個信息。"

      大二他進了朱軍老師的實驗室做強化學習。第一個項目是用神經網絡通關一個90年代的射擊游戲Doom,拿了比賽冠軍。

      但他不享受做研究的過程。

      "環境太單一了,你要瘋狂overfit。用各種技巧防止訓練崩了,即使沒崩你也不知道怎么調參才能調對。這個比CV難十倍一百倍,全是玄學。"

      他發現自己對調參這件事有生理上的排斥。但他擅長另一件事:寫代碼、重構代碼、讓代碼更好用。

      "我就想,與其自己去卷這些調參的事,不如造一套工具,讓想卷的人更方便地卷。"

      2020年疫情期間,他在家花兩周時間寫了一個開源的強化學習框架叫天授(Tianshou)。

      為什么只要兩周?

      "如果你把抽象搞對的話,一個算法可能就20行代碼不到。"

      他看過當時最流行的RLlib,幾十萬行代碼,太復雜了。所以他推倒重來,自己從頭寫。

      "代碼最重要的是一致性。如果從頭到尾都是一個人寫的,那肯定是一致的。"

      同期他還做了一個簽證查詢網站叫退學online。疫情期間美國領事館開開關關,留學生需要實時知道哪里能約到簽證。他自己有這個需求,就順手寫了個爬蟲開源出去。后來點擊量超過1000萬。

      這兩個項目都不是為了發論文、不是為了申請。

      "我想做一些能夠產生影響力的事情,哪怕虧錢也行。"

      2022年找工作的時候,他手上有幾個offer:幻方(后來的DeepSeek)、OpenAI、英偉達。

      他選了OpenAI。當時ChatGPT還沒發布,OpenAI在很多人眼里只是一個做強化學習研究的實驗室。

      面試他的是John Schulman。

      "他說我的GitHub非常漂亮。"

      最后一輪面試,Schulman出了一道很開放的題,給三個小時。翁家翌兩個小時就做完了。

      "這道題他只給兩個人測過,一個是我,另一個是后來做Codex的那個人。我們都通過了。"

      他后來總結了一句話:

      "教一個researcher如何做好engineering,要遠比教一個engineer如何做好research來的難。"

      現在的AI行業,idea不值錢。值錢的是單位時間內你能驗證多少個idea、能正確地迭代多少次。這取決于工程能力。

      "你找個有研究直覺的人討論一下,idea就出來了。但你能不能把基礎設施搭對、能不能快速迭代,這個是稀缺的。"

      播客里還聊到一個問題:OpenAI做的東西,外面的人能復刻嗎?

      "你可以這么認為。其實就是把最簡單的東西做好就好了,沒有什么黑魔法。"

      他甚至說:OpenAI現在沒有誰是不可替代的。

      "一個健康的組織是所有人都可以替代的。你只要能夠持續培養新人,有造血能力,讓組織正常運轉就可以了。"

      走了很多人?沒關系,可以再培養。

      "哪怕雖然走了很多人,但是還是可以花一些時間精力,然后再培養一波新人,持續的造血,相當于干細胞一樣。"

      訪談最后,主持人問他怎么定義AGI。

      "OpenAI內部有個笑話,你抓15個人,可能有20種定義AGI的方法。"

      他自己的定義是:如果能完成80-90%他認為有意義的任務,那就是AGI了。

      "目前還沒有。我還是不放心讓它直接改我的代碼。"

      但他很確定AGI會來。

      "AGI是板上釘釘的事了。"

      他還講了一個內部故事:o1模型剛出來的時候,內部很多人都覺得"我的工作要被取代了"。

      "我們甚至想說,那就寫一堆屎山吧,反正以后AI會幫我們清理。"

      結果呢?

      "一兩年過去了,屎山還在。每個人都會過度反應,覺得技術來了我們要怎么怎么樣,但實際上它是一個很慢很慢的循序漸進的過程。"

      主持人最后讓他留一段話。

      他說:

      "我曾經想通了我想要什么,但現在又想不通了。這個問題值得一生去思考。"

      一個95后,站在AI風暴的中心,相信AGI即將到來,但說自己"又想不通了"。

      這可能是最真實的狀態。

      視頻來源:WhynotTV Podcast

      B站:https://www.bilibili.com/video/BV1darmBcE4A/

      YouTube:https://www.youtube.com/watch?v=I0DrcsDf3Os

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      娛樂圈著名6對“死對頭”,個個矛盾根深蒂固,至今老死不相往來

      娛樂圈著名6對“死對頭”,個個矛盾根深蒂固,至今老死不相往來

      a入畫淺相思
      2026-02-18 18:16:12
      爆大冷!第90分鐘絕殺,皇馬轟然倒下,姆巴佩不敢相信

      爆大冷!第90分鐘絕殺,皇馬轟然倒下,姆巴佩不敢相信

      足球狗說
      2026-02-22 03:26:49
      接事業運,瑞典女選手跳出44分收獲冬奧會銀牌

      接事業運,瑞典女選手跳出44分收獲冬奧會銀牌

      懂球帝
      2026-02-21 20:03:15
      辭去央視鐵飯碗,帶著兒子嫁給張譯,20年過去,才知道她有多明智

      辭去央視鐵飯碗,帶著兒子嫁給張譯,20年過去,才知道她有多明智

      阿廢冷眼觀察所
      2026-02-21 13:48:22
      沖東部第2!哈登激活雙塔,騎士才能質變!美媒:泰森會是X因素

      沖東部第2!哈登激活雙塔,騎士才能質變!美媒:泰森會是X因素

      一登侃球
      2026-02-22 00:07:42
      省直機關女工程師陷美男計,拉公職人員丈夫當間諜17年,央視披露

      省直機關女工程師陷美男計,拉公職人員丈夫當間諜17年,央視披露

      大象新聞
      2026-02-21 16:44:08
      去的時候好好的,回來的時候卻

      去的時候好好的,回來的時候卻

      中國民航人
      2026-02-21 18:07:25
      強化學習之父最新演講:大模型是一時狂熱,AI的真正時代還沒開始

      強化學習之父最新演講:大模型是一時狂熱,AI的真正時代還沒開始

      DeepTech深科技
      2026-02-19 20:15:12
      北方多地遭遇沙塵天氣,至少10架客機備降臨近機場,乘客稱好多人落地后嘔吐,航司客服回應

      北方多地遭遇沙塵天氣,至少10架客機備降臨近機場,乘客稱好多人落地后嘔吐,航司客服回應

      極目新聞
      2026-02-21 21:13:34
      遭93分鐘絕平!1.2億先生低迷,切爾西主場爆冷,下輪死磕阿森納

      遭93分鐘絕平!1.2億先生低迷,切爾西主場爆冷,下輪死磕阿森納

      我的護球最獨特
      2026-02-22 01:02:15
      上海大叔55歲未婚,住垃圾堆卻要穿名牌,打開冰箱后才知啥叫生活

      上海大叔55歲未婚,住垃圾堆卻要穿名牌,打開冰箱后才知啥叫生活

      寒士之言本尊
      2025-09-08 23:20:45
      明日正月初六,早上做好兩件事,討個一順百順萬事順!

      明日正月初六,早上做好兩件事,討個一順百順萬事順!

      時尚的弄潮
      2026-02-21 16:52:03
      王濛揭短道國家隊老底!球迷擔心國乒會步其后塵,王勵勤害怕嗎?

      王濛揭短道國家隊老底!球迷擔心國乒會步其后塵,王勵勤害怕嗎?

      三十年萊斯特城球迷
      2026-02-21 23:30:04
      軍令如山!3月1日起全軍實行終身負責制,從嚴治軍強根基

      軍令如山!3月1日起全軍實行終身負責制,從嚴治軍強根基

      我心縱橫天地間
      2026-02-19 23:15:18
      第一集就要打碼,這部新劇太炸裂了

      第一集就要打碼,這部新劇太炸裂了

      天天美劇吧
      2026-02-20 17:58:59
      人到晚年才醒悟:兄弟姐妹之間,最大的災難往往源于“過得太好”

      人到晚年才醒悟:兄弟姐妹之間,最大的災難往往源于“過得太好”

      風起見你
      2026-02-21 10:12:01
      劍南春|皇馬1-2遭奧薩蘇納絕殺,巴爾韋德一條龍助攻維尼修斯破門

      劍南春|皇馬1-2遭奧薩蘇納絕殺,巴爾韋德一條龍助攻維尼修斯破門

      懂球帝
      2026-02-22 03:30:31
      明日正月初六,早上做好兩件事,討個一順百順萬事順!

      明日正月初六,早上做好兩件事,討個一順百順萬事順!

      荷蘭豆愛健康
      2026-02-22 02:02:34
      奧運冠軍,拉開拉鏈,Nike贏麻了

      奧運冠軍,拉開拉鏈,Nike贏麻了

      設計癖
      2026-02-21 21:33:49
      全新日產軒逸2月24日上市:最新設計語言,現款11.39萬元起

      全新日產軒逸2月24日上市:最新設計語言,現款11.39萬元起

      IT之家
      2026-02-21 20:56:46
      2026-02-22 06:00:49
      AI進化論花生 incentive-icons
      AI進化論花生
      AI博主,AppStore付費榜第一的小貓補光燈app開發者
      142文章數 64關注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個吉祥物

      娛樂要聞

      黃曉明澳門賭博輸十幾億 本人親自回應

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      旅游
      房產
      數碼
      手機
      軍事航空

      旅游要聞

      上海的氣韻 | 馬上啟程來上博,博物館里過大年

      房產要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      數碼要聞

      AMD RX 9060 XT成功超頻4.769GHz!打破世界紀錄

      手機要聞

      三星Galaxy S26系列顏色曝光:將推6種配色,兩款為線上專屬

      軍事要聞

      硬核揭秘!福建艦“一馬當先”底氣何在

      無障礙瀏覽 進入關懷版