今天聽完OpenAI華人工程師翁家翌和xAI工程師Sulaiman Ghori的播客采訪。發現兩位的分享有種隔空的默契,關于模型迭代、AI公司如何進步的觀點很類似,也很有啟發。
先介紹翁家翌大佬,他從清華本科畢業后出國讀研,后來在OpenAI發布ChatGPT之前加入了這家公司。作為RL Infra的關鍵工程師,他參與了GPT-3.5、GPT-4、GPT-5等核心模型的訓練。
1??翁家翌一直強調,現在模型性能的提升,很多時候是infra迭代速度決定的。背后邏輯是,如果要驗證一個想法,那一定需要Infra支持。這個時候如果Infra正確,那么誰在更短時間內驗證的次數多、迭代效率高,就越可能找到最有效的方案。
2??順著這個邏輯,之后最容易被取代的是researcher,因為idea is cheap,可以和別人、AI討論生產。這里翁家翌還分享了一個自己同事的金句:“教一個researcher如何做好engineering,比教一個engineer如何做好research難得多。”(…
3??他還覺得OpenAI不是infra迭代速度最快的,因為公司現在好幾千人了,組織大就會降低效率。去年DeepSeek震驚全球時讓OpenAI內部很警覺,因為“DeepSeek那波迭代聲稱很快”。目前OpenAI內部在重構新Infra架構,加速迭代。他還說OpenAI“早就不做為了刷榜而做的事了”。
另外就是xAI的工程師Sulaiman Ghori也上了播客。他說了很多xAI內部的秘密秘?(似乎現在因為泄密太多被馬斯克開除了…
Sulaiman Ghori創業失敗后加入xAI,還是神秘兮兮的MacroHard項目的早期成員。他轉入這個項目時組里只有兩個人。聽Sulaiman Ghori分享,感覺xAI已經把“速度”這件事刻在骨子里:
1?? xAI現在的一部分技術路線押注小模型,不搞Scaling那套,要靠“迭代速度”取勝。
這背后的原因是,模型小=訓練成本低=周期短=試錯成本低。大家可以多試幾個方向,發現效果好的方向就去加碼。
2??xAI并行跑著的幾十個訓練任務通常由少數幾個人負責。如果某個條件暫時不成熟(比如硬件、數據這幾天不就緒)會先跑幾種方案,看哪個今天能交付、能產生收入或效果,兩周后條件成熟再切換。
3??馬斯克在內部強調過,xAI招聘不強調單獨的Researcher,大家都是engineer。
聽完這兩期內容,感覺翁家翌和Sulaiman Ghori的分享確實是殊途同歸:有迭代速度才有驗證和試錯空間。尤其當架構需要創新,idea需要驗證,競爭對手又特別強的時候,敏捷就是一切!
#馬斯克 #OpenAI#AI#科技播客精華
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.