聞樂 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
現(xiàn)在給鵝廠投簡(jiǎn)歷,還來不來得及?(老板別看)
這趟來蹲騰訊廣告算法大賽的現(xiàn)場(chǎng),我坐在臺(tái)下直拍大腿——
冠軍直接揣走200萬獎(jiǎng)金,亞軍季軍的獎(jiǎng)勵(lì)也都是六位數(shù)起步,哪怕只是站上答辯臺(tái),每個(gè)選手都能抱一臺(tái)嶄新的iPad走……
![]()
于是我坐在觀眾席上反復(fù)確認(rèn)一件事:我當(dāng)年學(xué)計(jì)算機(jī)的時(shí)候,怎么沒參加這種活動(dòng)??
![]()
講真,作為一個(gè)曾經(jīng)也在實(shí)驗(yàn)室里敲代碼的計(jì)算機(jī)學(xué)生,真正讓我動(dòng)了“求職”心思的,并不只是這些看得見的獎(jiǎng)勵(lì)。
更重要的,其實(shí)是通過大賽啃實(shí)戰(zhàn)級(jí)賽題的機(jī)會(huì)、獲得實(shí)習(xí)或者直通offer的通道,還有大廠提供的算力和平臺(tái)等資源的誘惑。
用最前沿的問題練手
這場(chǎng)算法大賽的賽題是「全模態(tài)生成式推薦」,名字聽起來有點(diǎn)長(zhǎng),但它指向的,其實(shí)是當(dāng)下廣告和推薦系統(tǒng)里最前沿、也最接近真實(shí)業(yè)務(wù)的一類問題。
簡(jiǎn)單說,以前做廣告推薦,更多是盯著用戶點(diǎn)過什么、看過什么,再配合一些文本特征來判斷“你可能還想看點(diǎn)啥”。
但現(xiàn)在這套邏輯不太夠用了,用戶面對(duì)的早就不只是文字列表,而是大量圖像、視頻、音頻混在一起的內(nèi)容流。
全模態(tài)生成式推薦要做的,就是把這些來自不同模態(tài)的信息統(tǒng)一建模,再用生成式模型的方式,直接生成推薦結(jié)果。
這也是為什么賽題會(huì)涉及大模型、生成對(duì)抗網(wǎng)絡(luò)、擴(kuò)散模型等AI方法。
![]()
全模態(tài)生成式推薦真正進(jìn)入工業(yè)實(shí)踐,也就是近兩年的事情,可以說這次的賽題就是騰訊廣告目前最重視的技術(shù)
而且這類問題不僅貼近真實(shí)業(yè)務(wù),挑戰(zhàn)也非常具體。
大賽提供的數(shù)據(jù)集是脫敏后的騰訊廣告用戶的全模態(tài)序列,序列中的每個(gè)行為包含豐富的ID信息,以及文本和視覺等多模態(tài)信息。
多模態(tài)數(shù)據(jù)引入后,噪聲會(huì)顯著增加,不同模態(tài)之間的對(duì)齊問題更難處理;數(shù)據(jù)分布高度不均,長(zhǎng)尾樣本和冷啟動(dòng)問題會(huì)被明顯放大;序列一旦拉長(zhǎng),顯存占用、訓(xùn)練效率和推理時(shí)延,都會(huì)成為繞不開的工程約束。
雖然挑戰(zhàn)多多,但別以為比賽過程中只有無窮無盡的“卷”,實(shí)際上比賽全程氛圍非常之友好。
尤其體現(xiàn)在選手們?cè)谛∧硶倪@場(chǎng)跑分團(tuán)建上,大家互相交流思路、分享踩坑經(jīng)驗(yàn):
“大佬這個(gè)參數(shù)怎么調(diào)?”“佬,用你的方法優(yōu)化完速度飛快!”……
![]()
從初賽開始算,這場(chǎng)比賽持續(xù)了四個(gè)多月,我也在決賽答辯階段來到了現(xiàn)場(chǎng)。
最主要的當(dāng)然就是聽一聽選手們的方案。
冠軍隊(duì)Echoch的方案核心在于大規(guī)模序列建模與工程可落地性。他們圍繞用戶全模態(tài)行為序列進(jìn)行建模,通過對(duì)高維ID特征進(jìn)行壓縮處理,降低顯存和計(jì)算開銷,從而支持更長(zhǎng)序列、更大batch的訓(xùn)練規(guī)模。
在建模上,方案強(qiáng)調(diào)對(duì)用戶長(zhǎng)期興趣演化的刻畫,并在曝光、點(diǎn)擊等多目標(biāo)約束下進(jìn)行統(tǒng)一優(yōu)化,最終在大規(guī)模測(cè)試集上取得最優(yōu)整體指標(biāo)表現(xiàn)。
亞軍隊(duì)leejt的重點(diǎn)放在數(shù)據(jù)質(zhì)量與結(jié)構(gòu)建模上。面對(duì)多模態(tài)特征缺失率高、噪聲大的問題,方案先對(duì)視覺與內(nèi)容特征進(jìn)行篩選和聚合,再基于Transformer的時(shí)序結(jié)構(gòu)建模用戶行為。
同時(shí)引入圖結(jié)構(gòu)刻畫用戶、廣告與語義特征之間的關(guān)系,以緩解樣本稀疏和冷啟動(dòng)場(chǎng)景下的信息不足問題,在穩(wěn)定性和泛化能力上表現(xiàn)突出。
季軍隊(duì)也許明天則從任務(wù)拆解入手,對(duì)曝光、點(diǎn)擊和轉(zhuǎn)化進(jìn)行顯式區(qū)分建模,并采用條件生成方式預(yù)測(cè)用戶后續(xù)行為。
該方案強(qiáng)調(diào)結(jié)果與真實(shí)廣告投放邏輯的一致性,在推理階段對(duì)低價(jià)值曝光進(jìn)行過濾,使模型輸出更貼近實(shí)際業(yè)務(wù)決策需求。
對(duì)于這些方案,騰訊公司副總裁蔣杰直言:
- 算法大賽讓我看到了這些年輕人做的方案不比現(xiàn)在工業(yè)界自己做的事情差。
- 讓我非常驚喜的是學(xué)生們對(duì)大模型的理解能夠跟上工業(yè)界的潮流,甚至方案更有創(chuàng)新性。
聽完兩天的答辯,我不僅被這些五花八門的方案卷到了,還觀察到一個(gè)很有意思的事情。
選手們不單單是奔著獎(jiǎng)金來,其實(shí)也想得到一個(gè)進(jìn)入大廠的機(jī)會(huì)。畢竟有同學(xué)“夾帶私貨”,都把「正在找工作」這樣的明示暗示大寫加粗搬上了答辯PPT的首頁(doge)。
沒錯(cuò),臺(tái)下評(píng)委席坐著的就是包括招聘部門在內(nèi)的各種負(fù)責(zé)人以及……騰訊公司副總裁蔣杰。
![]()
好好好,這是“真·boss直聘”。
比賽就是一條通往大廠的快速通道
這時(shí)候我也反應(yīng)過來,騰訊廣告這波一方面是想辦一場(chǎng)標(biāo)桿級(jí)別的算法比賽不假,另一方面也是在給學(xué)生們搭一條通往大廠的快速通道
先說辦比賽這件事本身。
其實(shí)不難理解騰訊廣告為什么敢把賽題出到這個(gè)難度,無論是全模態(tài)生成式推薦,還是廣告鏈路中對(duì)效率、穩(wěn)定性和規(guī)模的要求,這些都不是臨時(shí)拼湊出來的命題,而是已經(jīng)在真實(shí)業(yè)務(wù)中被反復(fù)驗(yàn)證、持續(xù)演進(jìn)的方向。
從已有實(shí)踐來看,騰訊廣告在投放、創(chuàng)意和度量等核心環(huán)節(jié),已經(jīng)形成了較為完整的AI技術(shù)體系,而且這套能力都是在日常業(yè)務(wù)中,經(jīng)過長(zhǎng)期反復(fù)檢驗(yàn)、試錯(cuò)、打磨出來的。
在這樣的背景下,把接近業(yè)務(wù)真實(shí)形態(tài)的問題拆解出來,交給學(xué)生去做,更像是一種順勢(shì)而為。
賽題之所以敢貼近實(shí)戰(zhàn),并不是因?yàn)殡y度設(shè)計(jì)得激進(jìn),而是因?yàn)楸澈笠呀?jīng)有成熟系統(tǒng)在跑,況且,騰訊有非常龐大的用戶盤,有足夠多的工程經(jīng)驗(yàn)和數(shù)據(jù)基礎(chǔ)兜底。
但想做一個(gè)有持續(xù)影響力的大賽IP,投入的資源就得有誠意、有吸引力。
這些在大賽提供的380萬元總獎(jiǎng)金池配套的算力支持中足以見得。
順便提一下,大賽原設(shè)定的獎(jiǎng)金池是360萬元,由于決賽答辯當(dāng)天一支隊(duì)伍的方案非常亮眼,于是現(xiàn)場(chǎng)臨時(shí)增設(shè)了20萬元的創(chuàng)新獎(jiǎng)(鵝廠大氣)。
不過,其實(shí)很容易被忽略的一點(diǎn)是,包括數(shù)據(jù)集、算力等在內(nèi)的這些賽題資源并不只是集中在少數(shù)決賽隊(duì)伍身上,而是貫穿整個(gè)賽程,對(duì)所有參賽者開放。
那就可以理解成,這次大賽就是對(duì)整個(gè)學(xué)生群體開放的技術(shù)練兵場(chǎng)
最終,比賽吸引了全球8400余名學(xué)生、2800多支隊(duì)伍參與,覆蓋近30個(gè)國家。
最前沿的問題+頂尖資源+廣泛的影響力+全面練兵的社會(huì)價(jià)值=一場(chǎng)標(biāo)桿級(jí)技術(shù)賽事。
![]()
比賽辦完,那就到了另一個(gè)環(huán)節(jié)——攬人
無論是給現(xiàn)金獎(jiǎng)勵(lì)、實(shí)習(xí)機(jī)會(huì)還是offer直通資格,其實(shí)都是鵝廠在向選手拋橄欖枝。
換個(gè)角度看,搞算法大賽這事兒也很高明。
與其校招季在各大高校的招聘會(huì)上支起攤位,不如用差不多的人力、物力成本辦一場(chǎng)貼近真實(shí)的工業(yè)級(jí)賽事,把最合適的人聚集到一起,集中觀察、集中交流。
而且比賽本身就帶著篩選邏輯辦的。
初賽階段,數(shù)據(jù)規(guī)模和目標(biāo)相對(duì)收斂;進(jìn)入復(fù)賽后,訓(xùn)練和測(cè)試數(shù)據(jù)被整體升級(jí),序列規(guī)模從1M擴(kuò)展到10M,同時(shí)建模目標(biāo)從偏點(diǎn)擊,擴(kuò)展到覆蓋曝光、點(diǎn)擊與轉(zhuǎn)化的完整鏈路。
這一步升級(jí),對(duì)選手來說并不友好,卻非常真實(shí)。
作為一個(gè)曾經(jīng)學(xué)計(jì)算機(jī)的人,我很清楚這種變化意味著什么——原本還能勉強(qiáng)跑通的方案,可能一夜之間就會(huì)因?yàn)轱@存、訓(xùn)練效率或工程結(jié)構(gòu)被淘汰。
所以,到了決賽階段,留下來的已經(jīng)不是“某一次跑分跑得巧”的隊(duì)伍,而是能在數(shù)據(jù)規(guī)模和目標(biāo)復(fù)雜度持續(xù)升級(jí)的情況下,方案依然成立的那一批人。
這套過程,本質(zhì)上已經(jīng)完成了一輪相當(dāng)接近真實(shí)業(yè)務(wù)環(huán)境的能力驗(yàn)證。
這樣一來,看著排行榜里明明白白的分?jǐn)?shù),既避免了在海量簡(jiǎn)歷里大海撈針,錯(cuò)過真正的技術(shù)好苗子,又能跳出“紙上談兵”的局限,直觀檢驗(yàn)學(xué)生的真實(shí)技術(shù)能力和落地實(shí)操水平,最終找到貼合需求的硬核人才。
![]()
這場(chǎng)算法大賽,對(duì)主辦方來說是在挑好苗子;對(duì)于學(xué)生們來說,又何嘗不是一條進(jìn)入大廠的快速通道呢?
資源之外,大廠搶人更比細(xì)節(jié)
比較關(guān)注AI圈動(dòng)態(tài)的朋友可能有所感知,不管是硅谷還是國內(nèi)大廠,今年的人才爭(zhēng)奪戰(zhàn)都打得極為激烈。
高薪挖角、定制化福利、快速晉升通道……各家紛紛亮出各種優(yōu)厚條件。
騰訊自然也不遑多讓,先不說薪資上不封頂?shù)那嘣朴?jì)劃,就在今年4月,公司宣布啟動(dòng)史上最大的就業(yè)支持計(jì)劃。
該計(jì)劃聚焦青年群體的就業(yè)需求,讓更多人有機(jī)會(huì)走進(jìn)大廠、鍛煉技能、積累經(jīng)驗(yàn),為職業(yè)起步加速。
在這一計(jì)劃的推進(jìn)節(jié)奏中,2025年騰訊就面向全國吸納了10000名校招實(shí)習(xí)生,而這里面有六成崗位是面向技術(shù)人才開放的。
研究人員的隊(duì)伍在不斷壯大,也就說明,公司對(duì)開發(fā)的投入也在不斷加大。
不只是想辦法要把人才招進(jìn)來,鵝廠在學(xué)生關(guān)懷這件事上,也確實(shí)是下了功夫
![]()
不管是這次的算法大賽還是之前把招聘會(huì)直接開進(jìn)ICCV 2025,在聊技術(shù)、聊求職意向之余,騰訊都額外為參加活動(dòng)的同學(xué)們?cè)O(shè)置了午餐會(huì)、交流晚宴等“面基”局。
這活動(dòng)可讓不少同學(xué)都開出了“驚喜盲盒”,見到了久仰大名的網(wǎng)友。這樣一來,同學(xué)們?cè)诩夹g(shù)氛圍之外,體驗(yàn)感也拉滿了。
實(shí)際上這種種操作都在釋放一個(gè)清晰且強(qiáng)烈的信號(hào):我們要人,要年輕人
在今年算法大賽的現(xiàn)場(chǎng),很明顯能感受到被年輕人“包圍了”。和幾位選手聊了聊,甚至發(fā)現(xiàn)其中不少都是00后。
青睞年輕人這一點(diǎn),通過最近一個(gè)重大的人事變動(dòng)——被放在騰訊AI重要位置上的28歲年輕人姚順雨的身上也窺見一斑。
這里小聲說一句:鵝廠你還蠻挺吸引頂尖人才的目光嘛(doge)。
BTW,今年肯定有像我一樣錯(cuò)過這波機(jī)會(huì)的朋友,所以,在此期待明年還有大賽,還要大辦特辦!
搞AI的年輕人們快來和本·量子位一起催催~
其實(shí)看完今年決賽走出騰訊大樓的時(shí)候,我想投簡(jiǎn)歷的想法更強(qiáng)烈了——
因?yàn)轾Z廠附近的晚霞,好美啊……
![]()
— 完 —
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.