<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      MIT天才博士剛畢業,就被前OpenAI CTO搶走!年薪或300萬起步

      0
      分享至

      MIT天才博士,清華學霸肖光烜官宣,正式加盟Thinking Machines,下一步主攻大模型預訓練。

      MIT天才博士一畢業,火速加盟OpenAI前CTO初創!

      最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學位。

      下一步,他將加入Thinking Machines,專注于大模型預訓練的工作。


      評論區下方,英偉達科學家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。



      清華雙學位學霸,MIT博士開掛人生

      打開他的個人主頁,多元而充實的經歷便映入眼簾。

      肖光烜本科畢業于清華大學,拿到了雙學位,主修的是計算機科學,金融學是第二學位。


      在此期間,他獲得了清華大學綜合優秀獎學金(2019)、全國大學生數學建模競賽(CUMCM)一等獎(2020)、國家獎學金(2020)、清華大學「未來學者」獎學金(2021)等多項獎項。

      他曾于2020–2021年作為訪問生(Visiting Student),前往斯坦福大學計算機系開展科研工作。

      2022年,肖光烜加入MIT攻讀博士學位,導師為韓松(Song Han)教授。

      個人研究方向聚焦于:深度學習的高效算法與系統,尤其是大規模基礎模型(Foundation Model)。


      他于2022年9月至2026年1月,在MIT EECS擔任全職研究助理(Research Assistant)。

      讀博期間,肖光烜曾多次進入全球頂級科技大廠從事前沿研究實習,具備了豐富的一線工業研發的經驗。


      論文地址:https://arxiv.org/pdf/2309.17453

      2024年2-5月期間,他作為英偉達實習生,研究方向是為長上下文大語言模型推理加速。

      他和團隊提出了DuoAttention,結合檢索與流式注意力頭,實現高效推理。


      論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

      隨后,他又參與了多項核心研究項目,其中包括:

      • XAttention:基于反對角評分的塊稀疏注意力機制

      • StreamingVLM:面向無限視頻流的實時理解模型

      • FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優化

      值得一提的是,肖光烜在研究之外,還有豐富的興趣愛好,比如足球、乒乓球、圍棋、鋼琴。

      他曾擔任所在院系足球隊的隊長兼先鋒,貝多芬的作品是個人最愛。


      一篇博士論文,破解LLM三大難題

      比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。


      不得不承認,如今大模型已經無所不能,但它們依然太貴了。

      顯存爆炸、推理太慢、長上下文直接OOM(內存溢出),這是幾乎所有LLM工程團隊每天都在面對的現實。

      Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個罕見的、從工程到理論、從算法到架構的完整答案。

      論文中, 他們提出了SmoothQuant,解決了一個長期困擾工業界的問題——激活值異常(activation outliers)。

      SmoothQuant通過一個巧妙的數學等價變換,把量化難點從「激活」轉移到「權重」。

      結果,它實現了首個在十億級模型上W8A8無損量化,無需重新訓練,顯存更小、推理更快。

      針對超長序列的處理,作者在StreamingLLM中發現了「注意力匯點」(attention sink)現象——

      即使沒有任何語義,初始token會被后續token持續關注。這些token的作用不是「理解」,而是數值穩定。

      結果,實現了常數內存的流式推理,模型上下文長度從數千token擴展到百萬級

      更進一步,他們又把這一思想推廣到多模態,StreamingVLM可以在保持時間一致性的同時處理長達數小時的視頻內容。

      對于超長上下文場景,團隊又提出一個互補方案,分別針對不同的性能瓶頸。

      • KVCache太大,采用DuoAttention

      注意力頭本身就有分工:少數負責「全局檢索」,多數只看「最近上下文」。

      DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

      • 預填充(Prefill)太慢,采用XAttention

      利用反對角線評分機制,僅識別、計算必要的注意力塊,從而實現顯著的加速效果。

      論文的最后,并沒有止步于「優化現有模型」,通過對MoBA(塊混合注意力) 的信噪比分析,作者證明了:

      理論上,block越小越好。

      但現實是,GPU不答應,于是有了FlashMoBA,一種定制化的CUDA內核,使小塊架構在實踐中可行,并實現了最高可達9倍的速度提升。

      這篇論文的價值在于,構建了一整套高效大模型的完整框架,既回應了當下的現實挑戰,也為下一代計算高效、普惠可及的AGI奠定了基礎。

      平均350萬年薪,碾壓OpenAI

      最后來到一個大家比較感興趣的話題——薪資。

      去年,硅谷人才爭奪戰激烈,BI一篇獨家挖到了Thinking Machines(TML)給員工們開出的薪資——

      基礎年薪高達50萬美元(約350萬元)。


      據BI獲取的招聘數據,TML向兩名技術員工支付了45萬美元的基礎年薪,另一名員工的年薪則高達50萬美元。

      第四名員工被列為「聯合創始人/機器學習專家」,其年薪同樣為45萬美元。

      這些薪酬數據,來自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

      總體來看,TML為這四名技術員工提供的平均年薪達到462,500美元。

      相較之下,TML明顯高于業內更為成熟LLM公司——

      OpenAI在相關申報文件中列出的29名技術員工,平均年薪為292,115美元。

      其中最高薪資為53萬美元,最低為20萬美元。

      Anthropic向14名技術員工支付的平均年薪為387,500美元,薪資區間在30萬至69萬美元之間。

      雖然比起Meta瘋狂的超1億美元薪酬還差得遠,但這一水平也在硅谷數一數二。

      果然,21世紀最貴的還是人才。


      參考資料:

      https://x.com/Guangxuan_Xiao/status/2008779396497502337

      https://guangxuanx.com/

      https://scholar.google.com/citations?user=sRGO-EcAAAAJ

      https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

      https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

      文章來源:新智元。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中華人民共和國和德意志聯邦共和國聯合新聞聲明

      中華人民共和國和德意志聯邦共和國聯合新聞聲明

      新華社
      2026-02-25 21:46:25
      含淚告別賽場!43歲了,已經是個傳奇!

      含淚告別賽場!43歲了,已經是個傳奇!

      德譯洋洋
      2026-02-25 12:20:33
      疑系統錯誤致“欠款一千萬億”記錄,男子索賠200萬能成嗎?

      疑系統錯誤致“欠款一千萬億”記錄,男子索賠200萬能成嗎?

      紅星新聞
      2026-02-25 15:02:59
      性能之王!新機官宣:3月17日,正式發布上市!

      性能之王!新機官宣:3月17日,正式發布上市!

      科技堡壘
      2026-02-25 13:21:31
      難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產,掛一籠土雞

      難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產,掛一籠土雞

      火山詩話
      2026-02-24 21:56:12
      燒光10億,下載暴跌!騰訊元寶,輸慘了!

      燒光10億,下載暴跌!騰訊元寶,輸慘了!

      功夫財經
      2026-02-25 08:57:30
      朝鮮高層大變動,金正恩親妹妹升職,背后產生哪些不容忽視的影響

      朝鮮高層大變動,金正恩親妹妹升職,背后產生哪些不容忽視的影響

      李昕言溫度空間
      2026-02-25 22:02:45
      近百萬元存款被悄悄轉走!上海獨居老太毫無察覺,還說“我有兩套房,你可以搬來同住”

      近百萬元存款被悄悄轉走!上海獨居老太毫無察覺,還說“我有兩套房,你可以搬來同住”

      瀟湘晨報
      2026-02-25 16:39:13
      日本某居酒屋貼告示:中國游客不允許進入!日網友:干得漂亮!這樣會去更多日本人!

      日本某居酒屋貼告示:中國游客不允許進入!日網友:干得漂亮!這樣會去更多日本人!

      東京新青年
      2026-02-25 17:41:04
      大理拖車4公里1400元:車主硬剛到底,曝光換胎公司,誰都跑不了

      大理拖車4公里1400元:車主硬剛到底,曝光換胎公司,誰都跑不了

      離離言幾許
      2026-02-25 16:13:29
      TVB“御用爛仔”演員游飚去世,終年57歲,李力持發文悼念

      TVB“御用爛仔”演員游飚去世,終年57歲,李力持發文悼念

      紅星新聞
      2026-02-25 11:05:07
      鄭欽文新教練敲定?與里巴分道揚鑣被球迷炮轟:眼露兇光薄情寡義

      鄭欽文新教練敲定?與里巴分道揚鑣被球迷炮轟:眼露兇光薄情寡義

      搏擊江湖
      2026-02-25 19:51:44
      平頂山郟縣毆打少女主謀為何沒有拘留?

      平頂山郟縣毆打少女主謀為何沒有拘留?

      互聯網大觀
      2026-02-25 09:59:23
      比爾·蓋茨道歉!承認與兩俄女子有婚外關系,“從未前往愛潑斯坦的私人島嶼”

      比爾·蓋茨道歉!承認與兩俄女子有婚外關系,“從未前往愛潑斯坦的私人島嶼”

      上觀新聞
      2026-02-25 15:37:09
      《飛馳人生》片尾感謝王思聰借出千萬豪車當背景,韓寒這面子真大

      《飛馳人生》片尾感謝王思聰借出千萬豪車當背景,韓寒這面子真大

      草莓解說體育
      2026-02-26 00:44:23
      緊急預警!81款耳機全淪陷,你戴的不是耳機,是“慢性毒藥”?

      緊急預警!81款耳機全淪陷,你戴的不是耳機,是“慢性毒藥”?

      戧詞奪理
      2026-02-23 15:20:41
      小米起訴自媒體索賠500萬,賬號主體實控人為蔚來創始人李斌

      小米起訴自媒體索賠500萬,賬號主體實控人為蔚來創始人李斌

      新浪財經
      2026-02-25 18:49:08
      女子服務區內躺在后車引擎蓋上阻車視頻曝光,后車駕駛員指責其“人肉插隊”,加油站和交警回應

      女子服務區內躺在后車引擎蓋上阻車視頻曝光,后車駕駛員指責其“人肉插隊”,加油站和交警回應

      極目新聞
      2026-02-25 20:00:30
      春節旅行,看完三亞賬單我沉默了:一家三口10天,燒掉一年血汗錢

      春節旅行,看完三亞賬單我沉默了:一家三口10天,燒掉一年血汗錢

      夜深愛雜談
      2026-02-24 22:41:54
      中到大雨局部暴雨!廣東天氣即將“大變臉”

      中到大雨局部暴雨!廣東天氣即將“大變臉”

      深圳晚報
      2026-02-25 08:12:15
      2026-02-26 03:04:49
      算法與數學之美 incentive-icons
      算法與數學之美
      分享知識,交流思想
      5374文章數 64616關注度
      往期回顧 全部

      教育要聞

      育兒思路 天賦與后天培養

      頭條要聞

      女子爬山失聯10天后遺體被找到 丈夫:她登頂神情恐懼

      頭條要聞

      女子爬山失聯10天后遺體被找到 丈夫:她登頂神情恐懼

      體育要聞

      勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

      娛樂要聞

      黃曉明新戀情!與小22歲美女同游新加坡

      財經要聞

      上海樓市放大招,地產預期別太大

      科技要聞

      “機器人只跳舞,沒什么用”

      汽車要聞

      750km超長續航 2026款小鵬X9純電版將于3月2日上市

      態度原創

      旅游
      本地
      手機
      藝術
      公開課

      旅游要聞

      重慶酉陽櫻花漫古城,吊腳飛檐藏春歸,這才是中式浪漫天花板!

      本地新聞

      津南好·四時總相宜

      手機要聞

      全球1秒營收額?蘋果因買iPhone不送充電器在巴西被罰2萬美元

      藝術要聞

      這些作品太美了,仙氣飄飄,三位大咖不容錯過!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版