<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      MIT天才博士剛畢業,就被前OpenAI CTO搶走!年薪或300萬起步

      0
      分享至


      新智元報道

      編輯:桃子

      【新智元導讀】MIT天才博士,清華學霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型預訓練。

      MIT天才博士一畢業,火速加盟OpenAI前CTO初創!

      最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學位。

      下一步,他將加入Thinking Machines,專注于大模型預訓練的工作。


      評論區下方,英偉達科學家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。



      清華雙學位學霸,MIT博士開掛人生

      打開他的個人主頁,多元而充實的經歷便映入眼簾。

      肖光烜本科畢業于清華大學,拿到了雙學位,主修的是計算機科學,金融學是第二學位。


      在此期間,他獲得了清華大學綜合優秀獎學金(2019)、全國大學生數學建模競賽(CUMCM)一等獎(2020)、國家獎學金(2020)、清華大學「未來學者」獎學金(2021)等多項獎項。

      他曾于2020–2021年作為訪問生(Visiting Student),前往斯坦福大學計算機系開展科研工作。

      2022年,肖光烜加入MIT攻讀博士學位,導師為韓松(Song Han)教授。

      個人研究方向聚焦于:深度學習的高效算法與系統,尤其是大規模基礎模型(Foundation Model)。


      他于2022年9月至2026年1月,在MIT EECS擔任全職研究助理(Research Assistant)。

      讀博期間,肖光烜曾多次進入全球頂級科技大廠從事前沿研究實習,具備了豐富的一線工業研發的經驗。

      2023年,他曾加入Meta實習,研究方向為「流式語言模型的高效注意力機制」,相關成果發表在arxiv上。


      論文地址:https://arxiv.org/pdf/2309.17453

      2024年2-5月期間,他作為英偉達實習生,研究方向是為長上下文大語言模型推理加速。

      他和團隊提出了DuoAttention,結合檢索與流式注意力頭,實現高效推理。


      論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

      隨后,他又參與了多項核心研究項目,其中包括:

      • XAttention:基于反對角評分的塊稀疏注意力機制

      • StreamingVLM:面向無限視頻流的實時理解模型

      • FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優化

      值得一提的是,肖光烜在研究之外,還有豐富的興趣愛好,比如足球、乒乓球、圍棋、鋼琴。

      他曾擔任所在院系足球隊的隊長兼先鋒,貝多芬的作品是個人最愛。


      一篇博士論文,破解LLM三大難題

      比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。


      不得不承認,如今大模型已經無所不能,但它們依然太貴了。

      顯存爆炸、推理太慢、長上下文直接OOM(內存溢出),這是幾乎所有LLM工程團隊每天都在面對的現實。

      Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個罕見的、從工程到理論、從算法到架構的完整答案。

      論文中, 他們提出了SmoothQuant,解決了一個長期困擾工業界的問題——激活值異常(activation outliers)。

      SmoothQuant通過一個巧妙的數學等價變換,把量化難點從「激活」轉移到「權重」。

      結果,它實現了首個在十億級模型上W8A8無損量化,無需重新訓練,顯存更小、推理更快。

      針對超長序列的處理,作者在StreamingLLM中發現了「注意力匯點」(attention sink)現象——

      即使沒有任何語義,初始token會被后續token持續關注。這些token的作用不是「理解」,而是數值穩定。

      結果,實現了常數內存的流式推理,模型上下文長度從數千token擴展到百萬級

      更進一步,他們又把這一思想推廣到多模態,StreamingVLM可以在保持時間一致性的同時處理長達數小時的視頻內容。

      對于超長上下文場景,團隊又提出一個互補方案,分別針對不同的性能瓶頸。

      • KVCache太大,采用DuoAttention

      注意力頭本身就有分工:少數負責「全局檢索」,多數只看「最近上下文」。

      DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

      • 預填充(Prefill)太慢,采用XAttention

      利用反對角線評分機制,僅識別、計算必要的注意力塊,從而實現顯著的加速效果。

      論文的最后,并沒有止步于「優化現有模型」,通過對MoBA(塊混合注意力) 的信噪比分析,作者證明了:

      理論上,block越小越好。

      但現實是,GPU不答應,于是有了FlashMoBA,一種定制化的CUDA內核,使小塊架構在實踐中可行,并實現了最高可達9倍的速度提升。

      這篇論文的價值在于,構建了一整套高效大模型的完整框架,既回應了當下的現實挑戰,也為下一代計算高效、普惠可及的AGI奠定了基礎。

      平均350萬年薪,碾壓OpenAI

      最后來到一個大家比較感興趣的話題——薪資。

      去年,硅谷人才爭奪戰激烈,BI一篇獨家挖到了Thinking Machines(TML)給員工們開出的薪資——

      基礎年薪高達50萬美元(約350萬元)。


      據BI獲取的招聘數據,TML向兩名技術員工支付了45萬美元的基礎年薪,另一名員工的年薪則高達50萬美元。

      第四名員工被列為「聯合創始人/機器學習專家」,其年薪同樣為45萬美元。

      這些薪酬數據,來自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

      總體來看,TML為這四名技術員工提供的平均年薪達到462,500美元。

      相較之下,TML明顯高于業內更為成熟LLM公司——

      OpenAI在相關申報文件中列出的29名技術員工,平均年薪為292,115美元。

      其中最高薪資為53萬美元,最低為20萬美元。

      Anthropic向14名技術員工支付的平均年薪為387,500美元,薪資區間在30萬至69萬美元之間。

      雖然比起Meta瘋狂的超1萬億美元薪酬還差得遠,但這一水平也在硅谷數一數二。

      果然,21世紀最貴的還是人才。


      參考資料:

      https://x.com/Guangxuan_Xiao/status/2008779396497502337

      https://guangxuanx.com/

      https://scholar.google.com/citations?user=sRGO-EcAAAAJ

      https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

      https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

      秒追ASI

      ?點贊、轉發、在看一鍵三連?

      點亮星標,鎖定新智元極速推送!


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      英國研究院預言,一旦中美爆發沖突,決定戰爭走向的不是導彈

      英國研究院預言,一旦中美爆發沖突,決定戰爭走向的不是導彈

      小莜讀史
      2025-12-04 20:31:11
      馬克龍:法國將投票反對歐盟與南共市簽署自貿協定

      馬克龍:法國將投票反對歐盟與南共市簽署自貿協定

      財聯社
      2026-01-09 05:40:05
      下一只即將翻倍股,名單曝光!

      下一只即將翻倍股,名單曝光!

      證券市場周刊
      2026-01-09 20:10:28
      印巴空戰背后的殘酷真相:世界上除了中美,其實全是“紙老虎”

      印巴空戰背后的殘酷真相:世界上除了中美,其實全是“紙老虎”

      云上烏托邦
      2026-01-09 13:09:35
      上海豪門晚宴名場面!吳千語娜然雙生花同框,敬酒被無視引熱議

      上海豪門晚宴名場面!吳千語娜然雙生花同框,敬酒被無視引熱議

      究竟誰主沉浮
      2026-01-09 21:42:30
      什么情況?9場比賽5場0分,卻連續首發出場 球迷:有后臺?

      什么情況?9場比賽5場0分,卻連續首發出場 球迷:有后臺?

      體育哲人
      2026-01-09 20:38:54
      一顆榴蓮,快讓東南亞卷成“晉西北”了!

      一顆榴蓮,快讓東南亞卷成“晉西北”了!

      流蘇晚晴
      2026-01-07 20:13:10
      52歲復出屠榜?這位阿姨才是真正的業界鋼鐵俠!

      52歲復出屠榜?這位阿姨才是真正的業界鋼鐵俠!

      素然追光
      2026-01-06 05:50:03
      多哈冠軍賽8強產生,國乒女單4人各守一個分區,男單注定孤軍作戰

      多哈冠軍賽8強產生,國乒女單4人各守一個分區,男單注定孤軍作戰

      天涯遠行人
      2026-01-10 04:24:41
      最低調普京女婿被億萬富豪當街暴打:拒絕10億賠償,只提一個要求

      最低調普京女婿被億萬富豪當街暴打:拒絕10億賠償,只提一個要求

      貳文
      2024-10-31 00:30:11
      金價一旦跌破這個數,無數家庭將“一夜返貧”,希望你不在其中

      金價一旦跌破這個數,無數家庭將“一夜返貧”,希望你不在其中

      王二哥老搞笑
      2026-01-09 11:48:45
      如果身體不行了,老王應該想明白了

      如果身體不行了,老王應該想明白了

      媒體訓練營
      2026-01-09 11:12:27
      央視曝光!知名國酒是酒精勾兌,年份包裝全造假,電商成重災區

      央視曝光!知名國酒是酒精勾兌,年份包裝全造假,電商成重災區

      單手搓核彈
      2026-01-05 10:16:10
      烏美安全協議基本就緒 俄指認“戰爭軸心”

      烏美安全協議基本就緒 俄指認“戰爭軸心”

      新華社
      2026-01-09 07:35:09
      紅利資產有望迎來“春季躁動”,紅利價值ETF易方達(563700)即將分紅

      紅利資產有望迎來“春季躁動”,紅利價值ETF易方達(563700)即將分紅

      每日經濟新聞
      2026-01-09 13:03:30
      名將有后!前國羽一姐高調宣布懷孕,曾兩奪世界冠軍可惜25歲退役

      名將有后!前國羽一姐高調宣布懷孕,曾兩奪世界冠軍可惜25歲退役

      攬星河的筆記
      2026-01-08 18:24:10
      斯普利特為什么讓楊瀚森打16分半鐘?拓媒揭秘原因,說得有道理

      斯普利特為什么讓楊瀚森打16分半鐘?拓媒揭秘原因,說得有道理

      格斗聯盟
      2026-01-09 15:56:33
      林詩棟五局激戰3-2惜敗多哈冠軍賽,國乒晉級男單八強

      林詩棟五局激戰3-2惜敗多哈冠軍賽,國乒晉級男單八強

      小犙拍客在北漂
      2026-01-09 17:37:21
      不出中國所料:日本的幫手已到,難怪特朗普按兵不動,他留了一手

      不出中國所料:日本的幫手已到,難怪特朗普按兵不動,他留了一手

      關權教授聊經濟
      2025-12-24 11:28:38
      “前面路口有警察?!”,東莞很多人突然被攔下...

      “前面路口有警察?!”,東莞很多人突然被攔下...

      東莞好生活
      2026-01-09 23:04:02
      2026-01-10 07:28:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14296文章數 66451關注度
      往期回顧 全部

      教育要聞

      上好一節課的終極秘密:不是技巧,是“通透”

      頭條要聞

      特朗普:美扣押一艘離開委內瑞拉油輪 石油將出售

      頭條要聞

      特朗普:美扣押一艘離開委內瑞拉油輪 石油將出售

      體育要聞

      金元時代最后的外援,來中國8年了

      娛樂要聞

      關曉彤鹿晗風波后露面 不受影響狀態佳

      財經要聞

      投資必看!瑞銀李萌給出3大核心配置建議

      科技要聞

      市場偏愛MiniMax:開盤漲42%,市值超700億

      汽車要聞

      助跑三年的奇瑞 接下來是加速還是起跳?

      態度原創

      教育
      藝術
      健康
      家居
      旅游

      教育要聞

      女生考中央司法警官學院?四大要求精準達標!

      藝術要聞

      15位著名畫家的女性之美:哪一張觸動了你的心?

      這些新療法,讓化療不再那么痛苦

      家居要聞

      木色留白 演繹現代自由

      旅游要聞

      想看霧凇別瞎跑!吉林阿什哈達這 5 個觀賞秘訣,幫你避開空跑遺憾

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 咸宁市| 承德市| 无码久久久久久| 亚洲欧美天堂| 3p小视频| 亚洲精品免费视频| 大洼县| 国模少妇无码一区二区三区| 亚洲AV无码久久精品日韩| 亚洲精品国产综合99久久夜夜嗨 | 超碰狠狠干| 中文字幕av久久爽一区| 久久永久视频| 色偷偷88888欧美精品久久久| 亚洲真人无码永久在线| 天天躁日日躁欧美老妇app| 一本色道久久综合亚洲精品| 国产99久一区二区三区a片| 欧洲美女粗暴牲交免费观看| 亚洲欧洲∨国产一区二区三区| 久久人人妻人人爽人人爽| 久久99嫩草熟妇人妻蜜臀| 日韩综合| 日韩AV有码无码一区二区三区| 亚洲自偷精品视频自拍| 中文无码网| 99久久精品费精品国产一区二区 | 龙胜| 国产三级国产精品国产专区 | 精品国产一区二区三区四区阿崩| 国产精品亚洲一区二区三区在线| 人妻另类 专区 欧美 制服| 无码一区二区三区久久精品| 色情一区| 亚洲色图视频在线观看网站| 国产精品久久久久久福利69堂| 久久久国产99久久国产久一| 丰满岳乱妇一区二区三区 | 亚洲av无码成人影院一区| 麻豆AV在线| 91高清在线观看|