<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      MIT天才博士剛畢業,就被前OpenAI CTO搶走!年薪或300萬起步

      0
      分享至


      新智元報道

      編輯:桃子

      【新智元導讀】MIT天才博士,清華學霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型預訓練。

      MIT天才博士一畢業,火速加盟OpenAI前CTO初創!

      最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學位。

      下一步,他將加入Thinking Machines,專注于大模型預訓練的工作。


      評論區下方,英偉達科學家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。



      清華雙學位學霸,MIT博士開掛人生

      打開他的個人主頁,多元而充實的經歷便映入眼簾。

      肖光烜本科畢業于清華大學,拿到了雙學位,主修的是計算機科學,金融學是第二學位。


      在此期間,他獲得了清華大學綜合優秀獎學金(2019)、全國大學生數學建模競賽(CUMCM)一等獎(2020)、國家獎學金(2020)、清華大學「未來學者」獎學金(2021)等多項獎項。

      他曾于2020–2021年作為訪問生(Visiting Student),前往斯坦福大學計算機系開展科研工作。

      2022年,肖光烜加入MIT攻讀博士學位,導師為韓松(Song Han)教授。

      個人研究方向聚焦于:深度學習的高效算法與系統,尤其是大規模基礎模型(Foundation Model)。


      他于2022年9月至2026年1月,在MIT EECS擔任全職研究助理(Research Assistant)。

      讀博期間,肖光烜曾多次進入全球頂級科技大廠從事前沿研究實習,具備了豐富的一線工業研發的經驗。

      2023年,他曾加入Meta實習,研究方向為「流式語言模型的高效注意力機制」,相關成果發表在arxiv上。


      論文地址:https://arxiv.org/pdf/2309.17453

      2024年2-5月期間,他作為英偉達實習生,研究方向是為長上下文大語言模型推理加速。

      他和團隊提出了DuoAttention,結合檢索與流式注意力頭,實現高效推理。


      論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

      隨后,他又參與了多項核心研究項目,其中包括:

      • XAttention:基于反對角評分的塊稀疏注意力機制

      • StreamingVLM:面向無限視頻流的實時理解模型

      • FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優化

      值得一提的是,肖光烜在研究之外,還有豐富的興趣愛好,比如足球、乒乓球、圍棋、鋼琴。

      他曾擔任所在院系足球隊的隊長兼先鋒,貝多芬的作品是個人最愛。


      一篇博士論文,破解LLM三大難題

      比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。


      不得不承認,如今大模型已經無所不能,但它們依然太貴了。

      顯存爆炸、推理太慢、長上下文直接OOM(內存溢出),這是幾乎所有LLM工程團隊每天都在面對的現實。

      Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個罕見的、從工程到理論、從算法到架構的完整答案。

      論文中, 他們提出了SmoothQuant,解決了一個長期困擾工業界的問題——激活值異常(activation outliers)。

      SmoothQuant通過一個巧妙的數學等價變換,把量化難點從「激活」轉移到「權重」。

      結果,它實現了首個在十億級模型上W8A8無損量化,無需重新訓練,顯存更小、推理更快。

      針對超長序列的處理,作者在StreamingLLM中發現了「注意力匯點」(attention sink)現象——

      即使沒有任何語義,初始token會被后續token持續關注。這些token的作用不是「理解」,而是數值穩定。

      結果,實現了常數內存的流式推理,模型上下文長度從數千token擴展到百萬級

      更進一步,他們又把這一思想推廣到多模態,StreamingVLM可以在保持時間一致性的同時處理長達數小時的視頻內容。

      對于超長上下文場景,團隊又提出一個互補方案,分別針對不同的性能瓶頸。

      • KVCache太大,采用DuoAttention

      注意力頭本身就有分工:少數負責「全局檢索」,多數只看「最近上下文」。

      DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

      • 預填充(Prefill)太慢,采用XAttention

      利用反對角線評分機制,僅識別、計算必要的注意力塊,從而實現顯著的加速效果。

      論文的最后,并沒有止步于「優化現有模型」,通過對MoBA(塊混合注意力) 的信噪比分析,作者證明了:

      理論上,block越小越好。

      但現實是,GPU不答應,于是有了FlashMoBA,一種定制化的CUDA內核,使小塊架構在實踐中可行,并實現了最高可達9倍的速度提升。

      這篇論文的價值在于,構建了一整套高效大模型的完整框架,既回應了當下的現實挑戰,也為下一代計算高效、普惠可及的AGI奠定了基礎。

      平均350萬年薪,碾壓OpenAI

      最后來到一個大家比較感興趣的話題——薪資。

      去年,硅谷人才爭奪戰激烈,BI一篇獨家挖到了Thinking Machines(TML)給員工們開出的薪資——

      基礎年薪高達50萬美元(約350萬元)。


      據BI獲取的招聘數據,TML向兩名技術員工支付了45萬美元的基礎年薪,另一名員工的年薪則高達50萬美元。

      第四名員工被列為「聯合創始人/機器學習專家」,其年薪同樣為45萬美元。

      這些薪酬數據,來自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

      總體來看,TML為這四名技術員工提供的平均年薪達到462,500美元。

      相較之下,TML明顯高于業內更為成熟LLM公司——

      OpenAI在相關申報文件中列出的29名技術員工,平均年薪為292,115美元。

      其中最高薪資為53萬美元,最低為20萬美元。

      Anthropic向14名技術員工支付的平均年薪為387,500美元,薪資區間在30萬至69萬美元之間。

      雖然比起Meta瘋狂的超1萬億美元薪酬還差得遠,但這一水平也在硅谷數一數二。

      果然,21世紀最貴的還是人才。


      參考資料:

      https://x.com/Guangxuan_Xiao/status/2008779396497502337

      https://guangxuanx.com/

      https://scholar.google.com/citations?user=sRGO-EcAAAAJ

      https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

      https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

      秒追ASI

      ?點贊、轉發、在看一鍵三連?

      點亮星標,鎖定新智元極速推送!


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      潛艇護航是大忌!俄油輪改名掛旗也沒用,被美軍P-8A死死拿捏

      潛艇護航是大忌!俄油輪改名掛旗也沒用,被美軍P-8A死死拿捏

      大國知識局
      2026-01-08 23:19:54
      中美貿易戰掀桌子了,1月10日,凌晨的四大消息正式發酵!

      中美貿易戰掀桌子了,1月10日,凌晨的四大消息正式發酵!

      叮當當科技
      2026-01-10 06:03:51
      炸鍋了!中年婦女真的很容易被殺豬盤啊,評論看的一陣后怕

      炸鍋了!中年婦女真的很容易被殺豬盤啊,評論看的一陣后怕

      有趣的火烈鳥
      2025-12-30 14:14:31
      謝賢前女友大曝戀愛私隱!三年不碰她,卻每天給她做“四哥菜芯”

      謝賢前女友大曝戀愛私隱!三年不碰她,卻每天給她做“四哥菜芯”

      阿纂看事
      2026-01-09 10:19:00
      我教練呢?喀麥隆出局姆伯莫提前回歸曼聯,但主教練已經下課

      我教練呢?喀麥隆出局姆伯莫提前回歸曼聯,但主教練已經下課

      懂球帝
      2026-01-10 10:14:29
      麻省理工研究警告:未來華北平原不宜人類居住!理論依據是什么?

      麻省理工研究警告:未來華北平原不宜人類居住!理論依據是什么?

      小熊侃史
      2026-01-08 07:55:03
      日本5歲男童卷入扶梯中被活活勒死!滑雪場卻甩鍋扶梯是中國制造,結果被日本網友罵了!

      日本5歲男童卷入扶梯中被活活勒死!滑雪場卻甩鍋扶梯是中國制造,結果被日本網友罵了!

      東京新青年
      2026-01-09 18:55:29
      C羅再輸球!只能踢點球!假摔還要點!評分不如失誤的守門員!

      C羅再輸球!只能踢點球!假摔還要點!評分不如失誤的守門員!

      氧氣是個地鐵
      2026-01-09 15:01:17
      閆學晶兒子上新疆班風波升級!大量博主吐槽其違規,網友義憤填膺

      閆學晶兒子上新疆班風波升級!大量博主吐槽其違規,網友義憤填膺

      小徐講八卦
      2026-01-09 10:41:44
      演都不演了,徐帆回應離婚5個月后,馮小剛的小心思藏不住了

      演都不演了,徐帆回應離婚5個月后,馮小剛的小心思藏不住了

      卷史
      2026-01-10 06:07:44
      1月9日俄烏最新:美帝興,川普王

      1月9日俄烏最新:美帝興,川普王

      西樓飲月
      2026-01-09 20:11:02
      崩了崩了!正負值-65+年薪近4000萬,就這表現,還留著干啥?

      崩了崩了!正負值-65+年薪近4000萬,就這表現,還留著干啥?

      球童無忌
      2026-01-09 23:25:10
      公司聚餐我被擠到角落加座,新來CEO端著酒杯走來:你怎么在這?

      公司聚餐我被擠到角落加座,新來CEO端著酒杯走來:你怎么在這?

      白云故事
      2025-12-21 19:30:12
      遭中方譴責后,馬斯克將星鏈衛星降軌70公里,直逼天宮空間站

      遭中方譴責后,馬斯克將星鏈衛星降軌70公里,直逼天宮空間站

      小莜讀史
      2026-01-08 12:04:38
      前國腳:董路偽裝成中國足球救世主 利用青少年變現 風險家長承擔

      前國腳:董路偽裝成中國足球救世主 利用青少年變現 風險家長承擔

      念洲
      2026-01-10 10:58:01
      楊瀚森鞏固輪換了!投籃5中1,幸好防守合格,卡位積極,夠看了!

      楊瀚森鞏固輪換了!投籃5中1,幸好防守合格,卡位積極,夠看了!

      籃球資訊達人
      2026-01-10 13:39:31
      中國向全世界曝光:美國4400顆衛星,圍堵中國空間站,這是要干啥

      中國向全世界曝光:美國4400顆衛星,圍堵中國空間站,這是要干啥

      諦聽骨語本尊
      2026-01-09 13:01:17
      氣到摔水杯吞里程悲!杜蘭特超大帥卻連敗 休媒:我們不配擁有KD

      氣到摔水杯吞里程悲!杜蘭特超大帥卻連敗 休媒:我們不配擁有KD

      顏小白的籃球夢
      2026-01-10 13:39:01
      鄰居長期蹭我家充電樁,我換了輛油車,物業經理深夜敲門

      鄰居長期蹭我家充電樁,我換了輛油車,物業經理深夜敲門

      今天說故事
      2026-01-05 16:56:52
      胡春華同志最新動態!

      胡春華同志最新動態!

      社評
      2026-01-10 11:37:17
      2026-01-10 14:15:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14299文章數 66451關注度
      往期回顧 全部

      教育要聞

      不可思議,中國數學,中國歷史,文化斷層,文化入侵

      頭條要聞

      媒體:中國若在其任期統一特朗普不悅 中方回應滴水不漏

      頭條要聞

      媒體:中國若在其任期統一特朗普不悅 中方回應滴水不漏

      體育要聞

      楊瀚森:上場時間要去爭取 而不是要求

      娛樂要聞

      趙櫻子稱和蔣毅試婚三天:像試面膜

      財經要聞

      投資必看!瑞銀李萌給出3大核心配置建議

      科技要聞

      傳DeepSeek準備第二次震驚全世界

      汽車要聞

      寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

      態度原創

      游戲
      房產
      本地
      公開課
      軍事航空

      拉瑞安確認《神界》新作不會再用AI生成概念藝術

      房產要聞

      66萬方!4755套!三亞巨量房源正瘋狂砸出!

      本地新聞

      云游內蒙|“包”你再來?一座在硬核里釀出詩意的城

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:已開始從委石油資源中賺錢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲区小说区图片区qvod| 久久久久亚洲精品中文字幕| 年轻女教师hd中字3| 中字无码av电影在线观看网站| 国产午夜福利片在线观看| 九九视频精品13在线观看| 91精品国产午夜福利| 国产愉拍91九色国产愉拍| 91久久精品国产| 精品av综合导航| 岛国免费视频| 国产成人无码精品亚洲| 国产成人精品二三区波多野| 国产成人精品人妻熟女a62v久久| 猫咪AV成人永久网站在线观看| 亚洲精品日韩在线观看| 亚洲va中文在线播放免费| 一本色道久久加勒比综合| 色综合久久蜜芽国产精品| 国产九九| 性xxxx欧美老妇胖老太性多毛 | 久久SE精品一区精品二区| 国产女同疯狂作爱系列| 精品xxx| 99插插| 久久久久久AV无码免费网站动漫| 亚洲av熟女一区二区| 日韩内射美女人妻一区二区三区 | 欧美A∨| 99精品国产一区二区三区2021| 国产精品V在线播放| 白浆一区二区三区| 午夜激情网站| 成人欧美日韩一区二区三区| 亚洲AV高清一区二区三区尤物| 亚洲乱色一区二区三区丝袜| AV无码免费不卡在线观看 | 亚洲无码成人网| 四虎AV| 亚洲欧美首页| 日本极品少妇videossexhd|