<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      騰訊混元3年變形始末

      0
      分享至

      2026.01.12


      本文字?jǐn)?shù):7212,閱讀時(shí)長(zhǎng)大約12分鐘

      作者 |新皮層NewNewThing 陸彥君 吳洋洋

      2025年11月下旬,大學(xué)畢業(yè)生林楓在深圳參加了騰訊青云計(jì)劃閉門會(huì)。活動(dòng)采取定向邀請(qǐng)制,為期兩天,會(huì)議內(nèi)容除了郵輪觀光、參觀騰訊總部,還有一個(gè)環(huán)節(jié)是部門見面會(huì)——姚順雨在現(xiàn)場(chǎng)。

      這次見面會(huì)兩個(gè)小時(shí)左右,姚順雨是開場(chǎng)發(fā)言者,他講了大概只有20分鐘,但富有雄心。

      「他說混元的目標(biāo)是對(duì)標(biāo)全球最頂尖的一批大模型。」林楓對(duì)第一財(cái)經(jīng)「新皮層」說。

      林楓對(duì)姚順雨印象深刻,除了「感覺他是主導(dǎo)混元大模型研發(fā)進(jìn)度的管理者」,他還是林楓在現(xiàn)場(chǎng)看到的騰訊高管中為數(shù)不多的年輕人。


      姚順雨,2025年下半年加入騰訊,此前任職于OpenAI。

      青云計(jì)劃是騰訊2023年下半年提出的面向優(yōu)秀畢業(yè)生的AI人才專項(xiàng)招聘,對(duì)標(biāo)字節(jié)跳動(dòng)的Top Seed人才計(jì)劃。

      與青云計(jì)劃同時(shí)進(jìn)行的是騰訊持續(xù)一年的高薪挖人行動(dòng)。長(zhǎng)期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對(duì)象之一是字節(jié)跳動(dòng)。字節(jié)跳動(dòng)2-2職級(jí)的候選人,跳槽到騰訊后可以獲得T12或T13的職級(jí),相當(dāng)于在字節(jié)跳動(dòng)的原職位連升兩級(jí)。而且,薪酬也會(huì)直接翻倍,有的甚至?xí)嵘?00%。「這種行情最近一個(gè)月才出現(xiàn),以前字節(jié)2-2的候選人會(huì)定下T9或T10的職級(jí),薪資漲幅只有30%。」許嵐說。

      2025年的騰訊就是2024年的字節(jié)跳動(dòng)。2024年,字節(jié)跳動(dòng)加速基礎(chǔ)模型的研發(fā)進(jìn)度,第一個(gè)動(dòng)作也是搶人才——它當(dāng)時(shí)的搶人對(duì)象主要是阿里巴巴,一年后,騰訊「接棒」,從字節(jié)跳動(dòng)搶奪人才。

      多位接近騰訊的人士對(duì)「新皮層」稱,騰訊大概2024年年底就開始大規(guī)模對(duì)外招募基礎(chǔ)模型相關(guān)的人才,并啟動(dòng)一系列組織架構(gòu)調(diào)整。2025年9月姚順雨的加入加速了這一進(jìn)程。

      姚順雨新政

      最開始,入職騰訊混元的外部人才主要來自微軟。自2024年12月起,微軟開源模型WizardLM團(tuán)隊(duì)核心成員孫慶豐、微軟亞洲研究院視覺計(jì)算組前首席研究員胡瀚、微軟WizardLM團(tuán)隊(duì)項(xiàng)目創(chuàng)建者徐燦陸續(xù)加入騰訊。然后是2025年8月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職于微軟亞洲研究院。

      「騰訊只看來自DeepSeek、月之暗面、字節(jié)和阿里這4家基座模型團(tuán)隊(duì)的候選人,其他公司是不看的。」接近騰訊招聘的人士陳立峰對(duì)「新皮層」說。

      他對(duì)「新皮層」稱,2025年年中,字節(jié)跳動(dòng)曾通過發(fā)放「豆包虛擬股」激勵(lì)員工,相當(dāng)于為其大模型團(tuán)隊(duì)漲薪。但正是在這輪股權(quán)激勵(lì)期間,部分字節(jié)豆包員工乘勢(shì)轉(zhuǎn)身加入了騰訊混元,原本年薪總包約為250萬至300萬元的字節(jié)跳動(dòng)員工,加入混元后能拿到年薪300萬以上的Offer。

      2025年12月,字節(jié)跳動(dòng)再次向全球員工發(fā)布了一封漲薪郵件,將公司整體獎(jiǎng)金和調(diào)薪投入分別提升35%和1.5倍,以確保員工薪酬的競(jìng)爭(zhēng)力和激勵(lì)回報(bào)在全球各個(gè)市場(chǎng)都「領(lǐng)先于頭部水平」。

      在字節(jié)的防守下,騰訊的搶人計(jì)劃也加大了力度。「姚順雨的加入是騰訊混元人才招聘的一個(gè)關(guān)鍵節(jié)點(diǎn)。」許嵐說,姚順雨來之前,高管加盟騰訊「屬于大廠間的正常人才流動(dòng)」,姚順雨加入后,混元不僅加強(qiáng)了招聘力度,「對(duì)候選人信息的保密性處理也升級(jí)了」。以姚順雨的加入為節(jié)點(diǎn),騰訊招募了更多大語言模型(LLM)相關(guān)的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內(nèi)的加入者主要研究方向都以多模態(tài)為主。


      多位招聘方人士告訴「新皮層」,姚順雨會(huì)在與LLM相關(guān)的招聘中擔(dān)任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有3位T12職級(jí)的人才來自字節(jié)Seed團(tuán)隊(duì)和DeepSeek,其中一位負(fù)責(zé)預(yù)訓(xùn)練的數(shù)據(jù)工作,還有一位和姚順雨一起做大模型的前沿探索。

      部分混元員工因?yàn)橐樣甑牡絹硇判膫湓觥!杆麄冋J(rèn)為姚順雨可能會(huì)為內(nèi)部爭(zhēng)取更多激勵(lì),就像字節(jié)Seed為團(tuán)隊(duì)成員發(fā)豆包股一樣。」許嵐說,姚順雨接手騰訊混元大模型不久,就與每位團(tuán)隊(duì)成員都有過接觸、聊天,還參加了不同研究小組的團(tuán)建和聚餐。

      姚順雨的舉動(dòng)獲得了部分員工的信任。一位內(nèi)部員工認(rèn)為他「性格討喜,跟著他干活有信心」,另一位內(nèi)部員工認(rèn)為他「管理能力出色」。但也有部分混元成員開始擔(dān)心能力不足被調(diào)整,開始主動(dòng)尋求外部機(jī)會(huì)。「從混元離職的人可能會(huì)變多,無論主動(dòng)還是被動(dòng)。」許嵐說。

      換血只是姚順雨加入混元后的新政之一。在模型策略上,他也提出了不同于混元大模型前任領(lǐng)導(dǎo)者的觀念。

      接近騰訊混元的人士告訴「新皮層」,相較于前任負(fù)責(zé)人,姚順雨更加重視后訓(xùn)練——這在很多人的意料之中,姚順雨此前的主要工作都與后訓(xùn)練更相關(guān)。不過除此之外,他還打算從預(yù)訓(xùn)練的數(shù)據(jù)部分入手,「從數(shù)據(jù)開始重新訓(xùn)練混元」,這相當(dāng)于回到起點(diǎn)。林楓稱,姚順雨在11月的青云計(jì)劃閉門會(huì)上還提出過一個(gè)明確要降低「發(fā)版速度」的計(jì)劃,「他說以前混元模型在內(nèi)部更新版本的速度很快,有時(shí)候一周就會(huì)發(fā)布兩個(gè)版本。他來到這里的第一件事就是降低發(fā)版速度,打磨好整體模型再發(fā)。」林楓說。

      在被騰訊挖角之前,姚順雨只在OpenAI工作過一年,深度參與Operator、Deep Research等智能體項(xiàng)目。更早之前,他剛剛從普林斯頓博士畢業(yè),研究方向是自然語言處理與強(qiáng)化學(xué)習(xí)。攻讀博士學(xué)位期間,他的主要科研成果有兩個(gè),一個(gè)是ToT(Tree of Thoughts,思維樹),這個(gè)計(jì)算框架讓AI在解決復(fù)雜問題時(shí)能夠?qū)栴}拆解為多步思維步驟并探索多條路徑,最終找到最優(yōu)路徑。還有一個(gè)是ReAct,這個(gè)算法讓大模型可以邊推理邊行動(dòng)。ToT和ReAct都可應(yīng)用于模型的后訓(xùn)練階段,提升模型的多步推理和動(dòng)手操作能力。OpenAI的Operator、Deep Research等智能體項(xiàng)目中都有ToT和ReAct的影子。

      也就是說,騰訊把姚順雨從OpenAI挖過來時(shí),他只有一年的工作經(jīng)驗(yàn)。但騰訊提供的可能是國(guó)內(nèi)大模型人才戰(zhàn)中無論職位還是薪酬都最高的標(biāo)準(zhǔn)。2025年9月,市場(chǎng)傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨后辟謠。這個(gè)數(shù)字不一定真實(shí),但1998年出生的姚順雨一定是國(guó)內(nèi)大廠中最年輕的大語言模型(LLM)「一號(hào)位」。

      2025年12月,騰訊宣布混元組織架構(gòu)調(diào)整,官宣姚順雨出任「CEO/總裁辦公室」首席AI科學(xué)家,向騰訊總裁劉熾平匯報(bào),他同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時(shí)在香港辦公室工作。另?yè)?jù)一位騰訊內(nèi)部人士稱,騰訊的CEO/總裁辦公室在列的人員名單上只有姚順雨一個(gè)人。

      這是2023年啟動(dòng)大模型研發(fā)以來,騰訊第一次把大語言模型變成一把手工程。而且,這個(gè)模型負(fù)責(zé)人對(duì)下轄的團(tuán)隊(duì)擁有直接而全面的管理權(quán)和人事權(quán)。「劉熾平是財(cái)務(wù)出身,并非技術(shù)背景。姚順雨直接向他匯報(bào),獲得資源支持的效率就更高了。」騰訊AI Lab離職員工秦瑩瑩對(duì)「新皮層」說,在此之前,騰訊的自研模型混元有著很長(zhǎng)的向上匯報(bào)鏈路,以及復(fù)雜的向下管理體系。

      混元跟著跑

      2025年從年頭沖刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領(lǐng)域開始著急。令這家大公司著急的直接原因就是,其自研模型混元的表現(xiàn)在大模型競(jìng)爭(zhēng)中不夠靠前。

      「很多公司發(fā)新模型時(shí),會(huì)被拿來在Benchmark中對(duì)比的模型基本就是GPT、Claude、Gemini、千問、Kimi和DeepSeek,你不會(huì)看到豆包,也不會(huì)看到混元。」一位大模型業(yè)內(nèi)人士對(duì)「新皮層」說,這種選擇基本代表了行業(yè)對(duì)誰在模型第一梯隊(duì)的認(rèn)知。

      馬化騰在2023年5月的股東大會(huì)稱,「對(duì)于工業(yè)革命(級(jí)的機(jī)遇)來講,早一個(gè)月(還是晚一個(gè)月)把電燈泡拿出來,在長(zhǎng)的時(shí)間跨度上來看是不那么重要的。」但大模型如今已經(jīng)變成了一門「實(shí)驗(yàn)科學(xué)」,「從基礎(chǔ)架構(gòu)到注意力機(jī)制,從參數(shù)量到優(yōu)化算法……每個(gè)環(huán)節(jié)都有多種方案,你需要做實(shí)驗(yàn)才知道能不能行得通、在多大規(guī)模的參數(shù)量上行得通。」上述大模型業(yè)內(nèi)人士說。這種實(shí)驗(yàn)性意味著,晚起步雖然有成熟方案可以借鑒,但也會(huì)比其他選手缺少?gòu)膶?shí)驗(yàn)中積累的經(jīng)驗(yàn),行動(dòng)越慢差距越大、越難追趕。

      騰訊是國(guó)內(nèi)大廠中最晚推出自研大模型的公司。2022年11月的最后一天,OpenAI發(fā)布ChatGPT。4個(gè)月后,2023年3月,百度發(fā)布了第一代大模型文心一言;同年4月,阿里巴巴發(fā)布通義千問大模型;同年8月,字節(jié)跳動(dòng)也發(fā)布了首代大模型云雀(注:后更名為豆包大模型)。

      騰訊的起跑速度就慢于這3家公司。2023年2月,騰訊才開始組建一個(gè)叫「混元助手」的團(tuán)隊(duì),從各事業(yè)群集結(jié)人才,由時(shí)任騰訊AI Lab主任張正友擔(dān)任項(xiàng)目總負(fù)責(zé)人。

      多位騰訊離職員工對(duì)「新皮層」稱,騰訊在大模型領(lǐng)域的緩慢起跑與公司內(nèi)部節(jié)奏有相當(dāng)大關(guān)系。在ChatGPT發(fā)布的2022年,騰訊正在經(jīng)歷多重低谷。

      低谷之一是游戲業(yè)務(wù)。2022年,中國(guó)游戲行業(yè)版號(hào)獲批通過的總量同比減少了32%,是過往年份中數(shù)量最少的一年。另一位騰訊離職員工告訴「新皮層」,游戲是騰訊最賺錢的業(yè)務(wù)之一,受版號(hào)銳減影響,游戲營(yíng)收不確定性變高,公司當(dāng)年就進(jìn)行了「降本增效」,就連騰訊TEG(技術(shù)工程事業(yè)群)這樣的技術(shù)中臺(tái)也要自負(fù)盈虧。后來主導(dǎo)混元模型研發(fā)的張正友所領(lǐng)導(dǎo)的AI Lab就隸屬于TEG。「那時(shí)AI Lab并不鼓勵(lì)研究員發(fā)論文,員工若要參加學(xué)術(shù)會(huì)議,還要蹭高校的預(yù)算才能去開會(huì)。」他對(duì)「新皮層」說。

      騰訊AI Lab離職員工秦瑩瑩稱,AI Lab在2016年成立時(shí)主要任務(wù)還是做基礎(chǔ)研究。但2018年左右,AI Lab就拆分成了兩個(gè)部分,只有少部分人繼續(xù)留做AI基礎(chǔ)研究,其他大部分成員都要開始服務(wù)于公司的游戲與廣告業(yè)務(wù)。

      而且,這位AI Lab離職員工稱,在游戲業(yè)務(wù)陷入危機(jī)之前,騰訊在2020年左右面臨過一個(gè)更大的危機(jī):QQ的「孵化器魔法」失效了。


      2020年之前,騰訊的很多新業(yè)務(wù)、新產(chǎn)品——比如QQ音樂、騰訊視頻——都是通過QQ孵化成功的。那時(shí)QQ扮演了一個(gè)分發(fā)渠道和入口的角色——就像今天抖音在豆包的分發(fā)中所扮演的角色一樣。但在2020年左右,騰訊的很多新業(yè)務(wù)都難以復(fù)制過去的成功路徑,比如騰訊電商、對(duì)標(biāo)今日頭條的天天快報(bào),以及對(duì)標(biāo)抖音和快手的騰訊微視,都沒有獲得預(yù)期的成功。2020年,騰訊的另一大分發(fā)渠道——微信——的月活用戶已經(jīng)達(dá)到12.25億,成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的超級(jí)入口,但它至今沒有施展比肩當(dāng)年QQ孵化新產(chǎn)品的魔法。

      眾多新業(yè)務(wù)中,唯一一個(gè)被騰訊高層認(rèn)為有潛力的是視頻號(hào)。上述騰訊離職員工稱,2022年,騰訊創(chuàng)始人、董事長(zhǎng)兼CEO馬化騰在內(nèi)部員工大會(huì)上稱「微信事業(yè)群最亮眼的業(yè)務(wù)是視頻號(hào),基本上是全場(chǎng)的希望」。到了2023年,馬化騰又在股東大會(huì)上表示「AI是類似工業(yè)革命一樣幾百年不遇的機(jī)會(huì)」,但整個(gè)2023年和2024年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰(zhàn)略上多么強(qiáng)調(diào)過大模型,不斷被強(qiáng)調(diào)的依然是視頻號(hào)。

      根據(jù)上述騰訊AI Lab離職員工的說法,2023年時(shí)騰訊內(nèi)部不同事業(yè)部如果想要訓(xùn)練模型,需要向公司總辦申請(qǐng)預(yù)算和立項(xiàng),「當(dāng)時(shí)訓(xùn)練模型的成本還很高,一次試錯(cuò)動(dòng)輒幾百萬美元。就算訓(xùn)練成功,模型的用途是什么?那時(shí)候還沒人能說清楚。」這位騰訊AI Lab離職員工稱。

      一號(hào)位難當(dāng)

      3年的大模型軍備競(jìng)賽已經(jīng)讓業(yè)界發(fā)現(xiàn),大模型不僅是門實(shí)驗(yàn)科學(xué),還開創(chuàng)了前所未有的開發(fā)范式:它無法通過工業(yè)時(shí)代那樣主要依靠自上而下的明確規(guī)劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個(gè)技術(shù)骨干的開發(fā)模式不同,大模型開發(fā)是一種系統(tǒng)工程,如果沒有一號(hào)位頭腦中對(duì)模型從預(yù)訓(xùn)練數(shù)據(jù)到預(yù)訓(xùn)練架構(gòu)和算法、后訓(xùn)練路徑以及基礎(chǔ)設(shè)施層面的整體實(shí)驗(yàn)構(gòu)想,一個(gè)模型無法從多個(gè)技術(shù)骨干的暴力開發(fā)中產(chǎn)生。

      上述騰訊AI Lab離職員工告訴「新皮層」,啟動(dòng)大模型研發(fā)后的3年中,騰訊很長(zhǎng)時(shí)間里沒有為混元團(tuán)隊(duì)匹配到一位合適的技術(shù)領(lǐng)導(dǎo)者。微信團(tuán)隊(duì)也曾訓(xùn)練過一個(gè)模型,后來放棄了。

      上述騰訊AI Lab離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負(fù)責(zé)人:張正友與蔣杰。張正友的研究方向是計(jì)算機(jī)視覺,他發(fā)明的平板攝像機(jī)標(biāo)定法在全球被普遍采用,被稱為「張氏方法」。但大模型中最核心的模型是LLM,LLM的核心是自然語言處理,而非圖像處理。

      「張正友管理了近半年后,并沒有交出夠好的成果。蔣杰之后主動(dòng)接手了混元項(xiàng)目,因?yàn)樗J(rèn)為大模型可以服務(wù)于廣告投放。」秦瑩瑩說。

      蔣杰2012年加入騰訊,是騰訊企業(yè)發(fā)展事業(yè)群(CDG)與技術(shù)工程事業(yè)群(TEG)副總裁,負(fù)責(zé)騰訊廣告平臺(tái)產(chǎn)品技術(shù)管理工作。

      在蔣杰的總負(fù)責(zé)下,劉威和王迪都曾短暫地直接管理過混元一段時(shí)間,「劉威類似于統(tǒng)籌者,王迪類似于執(zhí)行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術(shù)背景也都與自然語言處理關(guān)聯(lián)不深,其中劉威的核心工作方向是計(jì)算機(jī)視覺,他在2024年年底從騰訊離職后,創(chuàng)辦了一家叫ReBirth的公司,主要方向是視頻生成。王迪2008年通過校招加入騰訊,主導(dǎo)混元LLM模型前主要在TEG負(fù)責(zé)數(shù)據(jù)與搜廣推算法方面的工作。

      2024年11月,蔣杰也開始不再實(shí)際管理混元項(xiàng)目下的LLM部分了,只實(shí)際負(fù)責(zé)混元多模態(tài)模型。前述騰訊AI Lab離職員工稱,當(dāng)時(shí)整個(gè)LLM團(tuán)隊(duì)都在等待一位據(jù)說是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到2025年9月,姚順雨來了。

      在姚順雨負(fù)責(zé)混元LLM模型并直接向騰訊總裁劉熾平匯報(bào)之前,混元的LLM負(fù)責(zé)人是個(gè)向上、向下都很難推動(dòng)工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣杰帶隊(duì)期間,混元LLM模型曾有一個(gè)小組長(zhǎng),但他的職級(jí)并不高,距離觸達(dá)劉熾平至少存在大模型技術(shù)負(fù)責(zé)人王迪、混元大模型負(fù)責(zé)人蔣杰、TEG總裁盧山三個(gè)層級(jí)。這種架構(gòu)使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。

      對(duì)下管理方面,這位組長(zhǎng)也需要橫跨TEG的多個(gè)部門,才能接觸到他的項(xiàng)目相關(guān)成員。2023年成立的混元是一個(gè)虛擬團(tuán)隊(duì),其成員來自AI Lab,甚至是TEG的多個(gè)部門。

      秦瑩瑩對(duì)「新皮層」說,機(jī)器學(xué)習(xí)部、數(shù)據(jù)平臺(tái)部等部門均隸屬于TEG舊的組織架構(gòu),而非混元團(tuán)隊(duì)。抽調(diào)去參與混元項(xiàng)目的員工們還要額外服務(wù)于騰訊不同部門、不同業(yè)務(wù)的AI需求。「混元有小半年的時(shí)間比較混亂,職責(zé)與權(quán)限沒有梳理清楚。無論是張正友還是蔣杰,都沒能把團(tuán)隊(duì)真正整合起來。」她說。


      直到2025年4月,騰訊才從組織上配備了一個(gè)類似字節(jié)Seed那樣的獨(dú)立團(tuán)隊(duì),在TEG體系內(nèi)成立大語言模型部與多模態(tài)模型部。12月官宣姚順雨入職后,騰訊進(jìn)一步調(diào)整組織架構(gòu),新成立了AI Infra部、AI Data部與數(shù)據(jù)計(jì)算平臺(tái)部,第一次從組織架構(gòu)上匹配大模式時(shí)代的研發(fā)需求。

      多位招聘方人士及騰訊員工對(duì)「新皮層」稱,騰訊AI Lab目前已被逐漸弱化,多位成員已經(jīng)離職,AI Lab副主任俞棟也將于1月底離開。許嵐告訴「新皮層」,AI Lab現(xiàn)在的工作重點(diǎn)就是做探索性研究、對(duì)外發(fā)表論文。這意味著騰訊2016年成立的AI Lab實(shí)際上已經(jīng)反過來成為混元的一個(gè)下屬部門,而不再是它的上層管理機(jī)構(gòu)。

      「新皮層」獲得的消息稱,隨著俞棟離職,AI Lab的語音與自然語言處理研究方向也將被裁撤。剩下的兩個(gè)方向是胡瀚負(fù)責(zé)的多模態(tài)理解方向,以及一位來自字節(jié)Seed前成員負(fù)責(zé)的多模態(tài)理解和生成統(tǒng)一方向。

      直到2025年年底,混元才變成一個(gè)更接近于字節(jié)Seed的架構(gòu),而類似的組織架構(gòu)調(diào)整,字節(jié)在2023年下半年就動(dòng)手了。這個(gè)遲來但大手筆的調(diào)整意味著,擺在姚順雨這位27歲大語言模型一號(hào)位面前的障礙,騰訊已基本為其掃清。

      加速理論與甜蜜期

      進(jìn)入大模型軍備競(jìng)賽的第三年,落后者趕上先發(fā)者的最優(yōu)路徑已經(jīng)非常清晰:要想快速交出符合市場(chǎng)預(yù)期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想著如何創(chuàng)新、彎道超車。

      最能說明這一成功法則的例子就是Google。2025年之前,「起個(gè)大早趕個(gè)晚集」在國(guó)內(nèi)形容的是百度,在硅谷形容的則是Google——它發(fā)明了大模型的基礎(chǔ)架構(gòu)Transformer,但在自ChatGPT發(fā)布以來的全球模型競(jìng)賽中,Google的Gemini始終被認(rèn)為落后于OpenAI的GPT和Anthropic的Claude。

      上述大模型業(yè)內(nèi)人士告訴「新皮層」,Gemini 2.0發(fā)布之前,Google一直堅(jiān)持Encoder+Decoder(注:編碼器+解碼器,Google在2017年發(fā)明 Transformer 架構(gòu)時(shí)的原始形態(tài))架構(gòu)。2024年2月發(fā)布Gemini 1.5時(shí),其模型論文中還在強(qiáng)調(diào)該架構(gòu)為什么更優(yōu),但到了2024年年底發(fā)布Gemini 2.0時(shí),Google不再宣傳Encoder+Decoder的架構(gòu)如何富有潛力,而是開始和OpenAI一樣采取Decoder only(注:純解碼器)架構(gòu)。

      不再偏執(zhí)地堅(jiān)持自研架構(gòu)后,Google很快就帶著2025年3月發(fā)布的Gemini 2.5重回業(yè)界視野,11月發(fā)布的Gemini 3.0直接讓OpenAI拉響「紅色警報(bào)」,以應(yīng)對(duì)Gemini帶來的流量壓力。根據(jù)SimilarWeb統(tǒng)計(jì)的11月數(shù)據(jù),用戶在Gemini上的平均停留時(shí)間已超越了ChatGPT。

      這位業(yè)內(nèi)人士告訴「新皮層」,DeepSeek 2024年12月和2025年2月先后發(fā)布并開源的V3和R1模型,也分別扮演了GPT的Decoder only架構(gòu)曾經(jīng)扮演的角色——告訴大家一個(gè)類GPT-4和OpenAI o1效果的模型可能是怎樣的架構(gòu)。其中,V3模型為業(yè)界提供了一個(gè)可以訓(xùn)練出等效于GPT-4模型的「配方」——表明要得到類似的模型效果,模型需要是一個(gè)MoE(混和專家模型)架構(gòu),而不能是稠密模型;時(shí)隔一個(gè)多月后發(fā)布的R1模型又提供了類OpenAI o1的推理模型「配方」——表明強(qiáng)化學(xué)習(xí)可以直接通過對(duì)有推理步驟的語料的模仿學(xué)習(xí)實(shí)現(xiàn)。

      「此前,大家其實(shí)不知道GPT-4是怎么訓(xùn)練出來的,也不知道o1是怎么訓(xùn)練出來的。」這位業(yè)內(nèi)人士說,整個(gè)2024年,國(guó)內(nèi)大模型公司的主要目標(biāo)就是「趕上GPT-4」,但不知道如何趕上,OpenAI從GPT 3.5開始就不再在論文中公開其模型核心架構(gòu)和算法、甚至不發(fā)表技術(shù)報(bào)告了。

      DeepSeek V3和R1模型的發(fā)布和開源加速了全球類GPT-4和OpenAI o1模型的推出。聘任一個(gè)在OpenAI直接參與過模型后訓(xùn)練、并接觸過其預(yù)訓(xùn)練的研究者擔(dān)任LLM模型負(fù)責(zé)人,對(duì)騰訊混元來說是也是一種加速。


      姚順雨加入騰訊兩個(gè)月后,2025年12月初,騰訊發(fā)布混元2.0模型,總參數(shù)為4060億。其英文名更新為HY2.0,被視為重視全球市場(chǎng)的舉措。有人猜測(cè)該模型就是姚順雨入職后的成果。但按照業(yè)內(nèi)訓(xùn)練一代模型的周期來看,混元2.0不太會(huì)是姚順雨從零開始訓(xùn)練的模型。

      「模型參數(shù)量與模型能力之間是必要不充分關(guān)系,參數(shù)量大,模型性能不一定強(qiáng),但參數(shù)量小,模型潛力一定有限。」上述業(yè)內(nèi)人士說,姚順雨大概率會(huì)訓(xùn)練出一個(gè)參數(shù)量更大的模型,估計(jì)需要大半年時(shí)間——在有「配方」、有更多資源的條件下,時(shí)間可能會(huì)更短。這意味著,姚順雨和騰訊的甜蜜期差不多就是半年,這位27歲的年輕管理者需要交出一些實(shí)際成果,才能在騰訊這個(gè)有著11萬人的大廠坐穩(wěn)大模型一號(hào)位。

      2025年4月,姚順雨在其個(gè)人博客中寫下《The Second Half》(下半場(chǎng))一文,「宣布」大模型已經(jīng)具備足夠的推理能力,大模型競(jìng)爭(zhēng)已經(jīng)完成上半場(chǎng)的預(yù)訓(xùn)練戰(zhàn)斗,進(jìn)入以后訓(xùn)練和Agent開發(fā)為主題的下半場(chǎng)。但在騰訊,他得重新鏖戰(zhàn)上半場(chǎng)。

      一位接近騰訊混元的人士對(duì)「新皮層」稱,混元下一個(gè)版本將是一個(gè)Agent模型,主要由姚順雨主導(dǎo)訓(xùn)練。

      (應(yīng)采訪對(duì)象要求,文中林楓、許嵐、陳立峰、秦瑩瑩為化名,記者王杰夫、實(shí)習(xí)記者李昂、肖赫對(duì)本文亦有貢獻(xiàn))

      微信編輯| 七三

      第一財(cái)經(jīng)持續(xù)追蹤財(cái)經(jīng)熱點(diǎn)。若您掌握公司動(dòng)態(tài)、行業(yè)趨勢(shì)、金融事件等有價(jià)值的線索,歡迎提供。專用郵箱:bianjibu@yicai.com

      (注:我們會(huì)對(duì)線索進(jìn)行核實(shí)。您的隱私將嚴(yán)格保密。)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      我連夜啃完馬斯克這173分鐘視頻,很震撼

      我連夜啃完馬斯克這173分鐘視頻,很震撼

      販財(cái)局
      2026-01-11 18:19:53
      極智嘉解禁日逆勢(shì)走強(qiáng):基石惜售,北水將至

      極智嘉解禁日逆勢(shì)走強(qiáng):基石惜售,北水將至

      市值Observation
      2026-01-09 21:33:54
      300多守衛(wèi)被20多美軍特種兵全殲!委內(nèi)瑞拉總統(tǒng)衛(wèi)隊(duì)幸存者崩潰講述當(dāng)晚可怕經(jīng)歷

      300多守衛(wèi)被20多美軍特種兵全殲!委內(nèi)瑞拉總統(tǒng)衛(wèi)隊(duì)幸存者崩潰講述當(dāng)晚可怕經(jīng)歷

      大洛杉磯LA
      2026-01-11 07:08:16
      杜蘭特23分火箭爆冷輸7連敗國(guó)王 阿門31+13申京復(fù)出遭隔扣

      杜蘭特23分火箭爆冷輸7連敗國(guó)王 阿門31+13申京復(fù)出遭隔扣

      醉臥浮生
      2026-01-12 12:30:05
      申花腸子都悔青了吧?2000萬猶豫不決錯(cuò)過李昊,如今5000萬都不夠

      申花腸子都悔青了吧?2000萬猶豫不決錯(cuò)過李昊,如今5000萬都不夠

      羅掌柜體育
      2026-01-12 09:37:45
      以色列最新涉華表態(tài)

      以色列最新涉華表態(tài)

      第一財(cái)經(jīng)資訊
      2026-01-11 18:39:00
      老鄉(xiāng)也墊?戈貝爾墊腳文班被吹罰一級(jí)惡意犯規(guī)+技術(shù)犯規(guī)

      老鄉(xiāng)也墊?戈貝爾墊腳文班被吹罰一級(jí)惡意犯規(guī)+技術(shù)犯規(guī)

      懂球帝
      2026-01-12 10:58:31
      方媛現(xiàn)身沙田馬場(chǎng)!3胎后陪郭富城賽馬,教兩個(gè)女兒比耶拍照

      方媛現(xiàn)身沙田馬場(chǎng)!3胎后陪郭富城賽馬,教兩個(gè)女兒比耶拍照

      素素娛樂
      2026-01-12 07:10:33
      特朗普話音剛落,鄭麗文向全臺(tái)2300萬人做保證,賴清德已走投無路

      特朗普話音剛落,鄭麗文向全臺(tái)2300萬人做保證,賴清德已走投無路

      時(shí)時(shí)有聊
      2026-01-11 19:47:05
      明搶5000萬桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了

      明搶5000萬桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了

      奇思妙想生活家
      2026-01-11 15:03:30
      反制開始!星鏈兩次威脅中國(guó)空間站后,我國(guó)新增20萬顆衛(wèi)星申請(qǐng)!

      反制開始!星鏈兩次威脅中國(guó)空間站后,我國(guó)新增20萬顆衛(wèi)星申請(qǐng)!

      科普100克克
      2026-01-11 14:19:45
      萬萬沒想到!躲開了王楚欽林詩(shī)棟,最后淘汰張本智和的還是中國(guó)人

      萬萬沒想到!躲開了王楚欽林詩(shī)棟,最后淘汰張本智和的還是中國(guó)人

      十點(diǎn)街球體育
      2026-01-12 00:55:03
      中紀(jì)委反腐大片曝光!原中央委員唐仁健賣90件“古董”斂財(cái)數(shù)千萬,過生日由不同老板大操大辦

      中紀(jì)委反腐大片曝光!原中央委員唐仁健賣90件“古董”斂財(cái)數(shù)千萬,過生日由不同老板大操大辦

      上觀新聞
      2026-01-11 22:25:05
      2026年新成語:惡意尋子!該警惕了,細(xì)節(jié)越挖越心寒!

      2026年新成語:惡意尋子!該警惕了,細(xì)節(jié)越挖越心寒!

      你食不食油餅
      2026-01-11 06:41:42
      網(wǎng)格員深夜入戶檢查引居民投訴,深圳一街道回應(yīng):將加強(qiáng)培訓(xùn)

      網(wǎng)格員深夜入戶檢查引居民投訴,深圳一街道回應(yīng):將加強(qiáng)培訓(xùn)

      南方都市報(bào)
      2026-01-12 07:33:11
      網(wǎng)傳某“降糖”中藥摻入西藥二甲雙胍,央視20年前就曝過類似案例

      網(wǎng)傳某“降糖”中藥摻入西藥二甲雙胍,央視20年前就曝過類似案例

      爆角追蹤
      2026-01-12 11:00:49
      “世界真奇妙,退休才知道”,副部級(jí)徐憲平1月12日晚將在中紀(jì)委專題片出鏡

      “世界真奇妙,退休才知道”,副部級(jí)徐憲平1月12日晚將在中紀(jì)委專題片出鏡

      澎湃新聞
      2026-01-12 08:02:28
      軍事 | 北約要打北約!

      軍事 | 北約要打北約!

      新民周刊
      2026-01-12 09:10:14
      庫(kù)里31+5勇士不敵老鷹結(jié)束連勝,巴特勒30+7+6約翰遜23+11

      庫(kù)里31+5勇士不敵老鷹結(jié)束連勝,巴特勒30+7+6約翰遜23+11

      湖人崛起
      2026-01-12 11:58:38
      外媒:英國(guó)正為烏克蘭研發(fā)可深入打擊俄境內(nèi)目標(biāo)的新型彈道導(dǎo)彈

      外媒:英國(guó)正為烏克蘭研發(fā)可深入打擊俄境內(nèi)目標(biāo)的新型彈道導(dǎo)彈

      環(huán)球網(wǎng)資訊
      2026-01-12 12:50:37
      2026-01-12 13:16:49
      第一財(cái)經(jīng)資訊 incentive-icons
      第一財(cái)經(jīng)資訊
      第一財(cái)經(jīng)官方賬號(hào)
      241075文章數(shù) 621171關(guān)注度
      往期回顧 全部

      科技要聞

      小米二手車價(jià)大跳水:SU7半年跌5萬元

      頭條要聞

      12歲小學(xué)生自殺遺書稱寫不會(huì)英語單詞 英語老師:委屈

      頭條要聞

      12歲小學(xué)生自殺遺書稱寫不會(huì)英語單詞 英語老師:委屈

      體育要聞

      聰明的球員,不是教練教出來的

      娛樂要聞

      閆學(xué)晶:脫離群眾太久 忘了自己的根

      財(cái)經(jīng)要聞

      揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

      汽車要聞

      "家轎之王"變帥了 東風(fēng)日產(chǎn)全新軒逸量產(chǎn)下線

      態(tài)度原創(chuàng)

      旅游
      健康
      數(shù)碼
      公開課
      軍事航空

      旅游要聞

      德州文旅再傳好消息!三個(gè)案例入選省級(jí)名單!

      血常規(guī)3項(xiàng)異常,是身體警報(bào)!

      數(shù)碼要聞

      英特爾升級(jí)8核"Panther Lake" LPDDR5x內(nèi)存支持至7467MT/s

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄大使:馬杜羅夫婦被控制時(shí)身邊沒人

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产亚洲精品成人无码精品网站 | 欧美老熟妇精品| 日本a级护士潮喷一区| 国产精品一区二区 尿失禁| 九一AV| www亚洲无码| 精品久久一区| 中文字幕av高清片| 国产99视频精品免费观看9| www夜插内射视频网站| 国产裸拍裸体视频在线观看| 沛县| 国产精品三级在线观看无码| 制服丝袜亚洲无码| 亚洲成人日韩| 亚洲综合91社区精品福利| 亚洲线精品一区二区三区八戒| 丰满熟女人妻一区二区三| 国产成人久久精品二区三区| 欧美性猛交xxxx乱大交极品| 岫岩| 欧美日韩精品一区二区三区在线 | 欧美成人午夜无码A片秀色直播 | 久久久精品波多野结衣AV| 亚洲精品国产一区黑色丝袜| 国产成人久久精品二区三区| 亚洲色av性色在线观无码| 欧美激情综合| 熟女视频一区二区在线观看| 岛国无码AV| 亚洲精品国产自在久久| 亚洲自拍制服| 国内成人自拍| 成人三级久久久久视频| 中文字幕乱码人妻无码偷偷| 色偷偷女人的天堂亚洲网| 成全在线电影在线观看| 国产极品粉嫩福利姬萌白酱| 中文字幕乱码一区av久久| 越南毛茸茸的少妇| 在线观看人成视频免费|