網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

我嘞個(gè)豆！中國企業(yè)牽頭，ICLR這場Workshop被擠爆了

2026-04-28 19:13:15　來源: 量子位

北京舉報(bào)

分享至

瓜多到一度吃不下的ICLR 2026，這幾天終于在巴西開線下了！！

沒去不要緊，最熱鬧最好玩的，咱都已經(jīng)總結(jié)好了：

隨機(jī)一個(gè)場景都有可能“掉落”LeCun這位巨佬NPC，學(xué)術(shù)追星人紛紛帶著合照意滿離；
熱情桑巴給學(xué)術(shù)人帶來億點(diǎn)小小的震撼，本屆開幕式被不少博士生評為“最嗨的一次”；
華人依舊是會(huì)場最活躍的群體之一，一天幾場Oral展示環(huán)節(jié)，基本都是華人的主場。

不過當(dāng)你以為這就完了的時(shí)候，一場主會(huì)之外的Workshop，才剛剛登場。

沒錯(cuò)，現(xiàn)場直接被圍到水泄不通。

而這群人聊的，不是多模態(tài)、具身智能或AGI這些熱門方向，而是一個(gè)更底層的硬核問題：

機(jī)制設(shè)計(jì)與決策智能。

名字聽起來有點(diǎn)“打腦殼”，但它做的事其實(shí)很實(shí)在——

直接決定推薦、廣告、電商系統(tǒng)的頂層架構(gòu)設(shè)計(jì)，是平臺商業(yè)價(jià)值的核心驅(qū)動(dòng)。

而且技術(shù)門檻也不低，需要打通經(jīng)濟(jì)學(xué)、博弈論和機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域知識。

更關(guān)鍵的是，這還是ICLR歷史上首個(gè)聚焦該方向的Workshop。除了阿里媽媽這個(gè)牽頭發(fā)起者，還集結(jié)了北京大學(xué)、MIT等一眾頂尖高校。

這就很值得玩味了，一個(gè)能在頂會(huì)“開專場”、還把產(chǎn)業(yè)界和學(xué)術(shù)界的人全拽到一個(gè)房間里討論到“上頭”的方向，背后顯然不簡單。

這不得趕緊扒一扒咋回事（doge）。

一場被擠爆的Workshop，到底有什么魔力

Workshop可以簡單理解成專題討論會(huì)，通常不會(huì)是最擠的地方。但這次顯然是個(gè)例外。

細(xì)究之下，離不開這三點(diǎn)。

No.1：話題足夠前沿

機(jī)制設(shè)計(jì)和決策智能，這倆詞，老實(shí)說第一次聽基本都一臉問號，但它其實(shí)一點(diǎn)都不“小眾”。

考古了一下，這是一個(gè)多次斬獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的領(lǐng)域——從1996年的維克瑞（William Vickrey），憑借在拍賣理論和機(jī)制設(shè)計(jì)領(lǐng)域的奠基性貢獻(xiàn)，拿下諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，再到2007年、2020年的得主，都在解決現(xiàn)實(shí)世界最核心的決策問題。

△諾貝爾官網(wǎng)

你刷到的廣告為什么是這條而不是那條？短視頻平臺憑什么決定把10萬的現(xiàn)金獎(jiǎng)勵(lì)發(fā)給哪個(gè)創(chuàng)作者？

這些看起來再日常不過的小事，背后其實(shí)全是機(jī)制設(shè)計(jì)和決策智能在跑。

簡單說，機(jī)制設(shè)計(jì)就是定規(guī)則（游戲怎么玩），而決策智能是做選擇（在規(guī)則下怎么贏）。

放在廣告這個(gè)經(jīng)典場景里：

機(jī)制設(shè)計(jì)是平臺的活，決定排序怎么排、錢怎么收、廣告怎么展示；

決策智能則是廣告主的事，關(guān)心每次出多少、預(yù)算怎么花、什么時(shí)候加價(jià)。

兩件事合起來，即為一個(gè)完整的博弈系統(tǒng)。

而這套系統(tǒng)，從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)，一直在驅(qū)動(dòng)最核心的商業(yè)引擎。

重要嗎？當(dāng)然重要。

但如果只是因?yàn)椤爸匾保赡茉诮裉爝€不足以把ICLR的會(huì)議室擠爆。

放在當(dāng)下，真正讓全球頂尖學(xué)者坐不住的，其實(shí)還是AI：

機(jī)制設(shè)計(jì)和決策智能，正在被AI重寫。諾獎(jiǎng)級的老問題，正撞上AI時(shí)代的新解法。

△圖片由AI生成

而這次Workshop所做的，就是把全世界正在重寫這套游戲規(guī)則的人，湊到一個(gè)房間里。

No.2：嘉賓足夠重磅

能擔(dān)起“重寫游戲規(guī)則”這一重任，想必你也猜到嘉賓們來頭都不小。

掃一眼還真是，差點(diǎn)沒忍住喊出聲：我嘞個(gè)全明星陣容啊！

理論這頭，兩位坐鎮(zhèn)者基本可以說是“祖師爺級別”。

首先登場的CMU教授Tuomas Sandholm，機(jī)制設(shè)計(jì)與博弈論領(lǐng)域無可爭議的權(quán)威。

早年他帶隊(duì)打造的Libratus系統(tǒng)曾在德?lián)渲袚魯№敿饴殬I(yè)玩家，而這次他又帶著新系統(tǒng)Obscuro挑戰(zhàn)比德?lián)涓鼜?fù)雜的“Fog of War Chess”棋類游戲。

此游戲狀態(tài)空間高達(dá)1018，但Obscuro不依賴離線訓(xùn)練，純靠實(shí)時(shí)搜索，并刻意模仿人類“有限推理”（只保留8層認(rèn)知深度），最終卻以16:4戰(zhàn)勝世界冠軍，成為該領(lǐng)域首個(gè)超越人類的AI。

另一位是來自加州大學(xué)爾灣分校的Vijay V. Vazirani，做理論計(jì)算機(jī)的人繞不開的名字。CS博士大概率都翻過他那本《近似算法》。

他這次講的是“基數(shù)效用匹配市場”，說白了就是一群人和一堆資源要互相分配（比如學(xué)生選宿舍、用戶匹配商品），到底該用什么規(guī)則，才能既公平又有效率，還能真正跑得起來。

過去經(jīng)濟(jì)學(xué)家給出過一套很漂亮的方法（Hylland-Zeckhauser機(jī)制），理論上各種性質(zhì)都說得通，但規(guī)模一大就開始“算不動(dòng)”。

所以Vijay這次帶來了一種基于納什談判（Nash bargaining）的新思路，既保留原本“好看”的理論性質(zhì)，也保證在實(shí)際計(jì)算里能跑得動(dòng)。

把這兩位巨佬放在一起，能看出一個(gè)明顯的趨勢：理論這邊，越來越關(guān)注“怎么在現(xiàn)實(shí)里跑得起來”。

順著這一思路，上海交通大學(xué)的鄭臻哲教授直接把問題推向了更復(fù)雜的AI戰(zhàn)場：

當(dāng)創(chuàng)作者開始博弈，創(chuàng)作者經(jīng)濟(jì)中機(jī)制設(shè)計(jì)的新問題。

以前推薦算法用的是“用戶-內(nèi)容”這套邏輯，但現(xiàn)在有了創(chuàng)作者這個(gè)新變量。

為了迎合平臺規(guī)則，創(chuàng)作者往往會(huì)追熱點(diǎn)、蹭標(biāo)簽、卡發(fā)布時(shí)間、復(fù)刻爆款。平臺原本試圖優(yōu)化內(nèi)容質(zhì)量，結(jié)果卻在不經(jīng)意間，把問題變成了“創(chuàng)作者如何迎合規(guī)則”。

更麻煩的是，生成式AI又加了一層。

一個(gè)人可以用AI批量生產(chǎn)內(nèi)容來參與競爭，這時(shí)候你甚至很難說：

平臺是在和人打交道，還是在和一群AI打交道？原來那套算法邏輯是不是從根上就需要重寫？

如果說鄭臻哲拋出的是AI時(shí)代的“新問題”，那谷歌研究院的Song Zuo則給出了一個(gè)具體的“新解法”。

他關(guān)心的問題是：當(dāng)廣告創(chuàng)意都開始由AI生成，誰來決定哪個(gè)版本被你看到？

和傳統(tǒng)廣告拍賣不同，AI生成的內(nèi)容是現(xiàn)產(chǎn)的，每次還不一樣——東西都沒出來，怎么拍賣？

Song給出的思路是：把出價(jià)的權(quán)力前置到生成過程里。

每個(gè)廣告主只需要給出一個(gè)數(shù)字代表自己愿意出多少，模型在每個(gè)token往外吐的時(shí)候，根據(jù)所有出價(jià)綜合考慮，決定下一個(gè)token怎么寫、整篇?jiǎng)?chuàng)意往哪個(gè)方向走。

最后再用“維克里拍賣”這種博弈論中的經(jīng)典防作弊機(jī)制來收錢——誰出價(jià)最高誰贏，但只需按第二高的價(jià)格付款，因此對廣告主來說最劃算的就是報(bào)真實(shí)心理價(jià)。

本質(zhì)上來說，在AI生成內(nèi)容的時(shí)代，拍賣的對象從“成品”變成了“生成過程”本身。

而更聚焦在產(chǎn)業(yè)側(cè)的亞馬遜廣告高級首席研究科學(xué)家Niklas Karlsson，則是把業(yè)界真實(shí)痛點(diǎn)擺了出來：

如何在數(shù)十億次決策規(guī)模的戰(zhàn)略市場中，部署AI？

亞馬遜每秒要做幾百萬次廣告競價(jià)決策，每個(gè)廣告主又有自己的預(yù)算紅線。怎么讓AI在這個(gè)前提下既搶得到流量、又不花超預(yù)算、還能穩(wěn)住模型——聽起來像是不可能三角。

但Niklas說，有解，而且解法相當(dāng)easy——分工。

一個(gè)負(fù)責(zé)猜：機(jī)器學(xué)習(xí)估出每次曝光值多少錢；
一個(gè)負(fù)責(zé)守：經(jīng)典控制理論盯著預(yù)算紅線，動(dòng)態(tài)調(diào)出價(jià)。

如此一來，機(jī)器學(xué)習(xí)不需要把市場摸透，控制系統(tǒng)也不需要懂細(xì)節(jié)，各干各的反而最穩(wěn)。

Anyway，雖然很多問題暫無答案，但至少這群頂尖大腦正在從不同方向找解法。

理論在補(bǔ)可計(jì)算性，AI在引入全新的變量，工業(yè)在解規(guī)模問題。

一幅關(guān)于機(jī)制設(shè)計(jì)與決策智能的未來圖景，正慢慢浮現(xiàn)出來。

No.3：收錄遠(yuǎn)超預(yù)期

而同樣參與現(xiàn)場熱烈討論的，還有本次Oral Talk的5個(gè)論文團(tuán)隊(duì)（其實(shí)一共6個(gè)被評選為Oral論文，但來了5個(gè)）。

說實(shí)話，估計(jì)連主辦方阿里媽媽都沒想到投稿會(huì)這么火——

總共收到118篇，在頂會(huì)Workshop里算高產(chǎn)了，并且邀請了127位專家學(xué)者參與審稿。

別的不說，咱先看下Long Papers和Short Papers兩個(gè)賽道各自誕生的最佳論文。

Long Papers最佳論文：

研究的是：當(dāng)多家AI廠商同時(shí)爭用戶、用戶偏好又五花八門時(shí)，怎么讓模型真正對齊到每個(gè)人的真實(shí)利益？

結(jié)論很反直覺：不用靠強(qiáng)行監(jiān)管或統(tǒng)一標(biāo)準(zhǔn)，市場競爭本身就會(huì)逼著AI越做越貼合每個(gè)用戶——個(gè)性化本身就是一種對齊機(jī)制。

Short Papers最佳論文：

研究的是：讓多個(gè)大模型一起參與“競爭”（比如定價(jià)、出價(jià)），它們真的會(huì)老老實(shí)實(shí)各玩各的嗎？

結(jié)論也挺讓人后背發(fā)涼：僅靠優(yōu)化提示詞，LLM智能體就會(huì)自發(fā)“達(dá)成默契”，在不顯式通信的情況下默契抬高價(jià)格、不打價(jià)格戰(zhàn)——AI市場的“算法合謀”風(fēng)險(xiǎn)，第一次被實(shí)打?qū)嵉刈C實(shí)了。

而除了拿下Long Papers最佳論文的那篇，其余5篇Oral論文也都各有亮點(diǎn)。

第一篇：《Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All》

一句話總結(jié)：通過提出機(jī)器學(xué)習(xí)混合組合拍賣機(jī)制MLHCA，讓組合拍賣效率損失最多降到1/10，查詢次數(shù)最多減少58%。

第二篇：《Decision Making under Imperfect Recall: Algorithms and Benchmarks》

一句話總結(jié)：智能體“記不住自己做過啥”的決策難題，第一次有了算法解法和評測基準(zhǔn)。

第三篇：《AI Realtor: Towards Grounded Persuasive Language Generation for Automated Copywriting》

一句話總結(jié)：通過設(shè)計(jì)一套三模塊系統(tǒng)（先挖賣點(diǎn)，再對齊買家偏好，最后做事實(shí)核查），成功讓大模型給房子寫銷售文案既能吸引人，又不亂編。

第四篇：《On the Edge of Core (Non-)Emptiness: An Automated Reasoning Approach to Approval-Based Multi-Winner Voting》

一句話總結(jié)：投票理論里的一個(gè)老坑，被自動(dòng)化推理工具撬開了。

第五篇：《Post-Training LLMs as Better Decision-Making Agents:
A Regret-Minimization Approach》

一句話總結(jié)：通過提出用“后悔最小化”做后訓(xùn)練，補(bǔ)齊了大模型在需要反復(fù)決策的場景中容易短視的短板。

而看完整場Workshop，想必你和我一樣好奇——

能像橋梁一樣連接工業(yè)界和學(xué)術(shù)界，并把專場開進(jìn)ICLR，阿里媽媽憑什么？

答案，其實(shí)并不意外。

只需翻一遍它在機(jī)制設(shè)計(jì)、出價(jià)決策智能等方向的“奮斗史”，你就知道，這背后離不開它多年的技術(shù)深耕。

阿里媽媽技術(shù)深耕

如何準(zhǔn)確形容阿里媽媽這幾年技術(shù)升級的主線呢？

我想關(guān)鍵詞一定少不了：AI化、智能化。

機(jī)制設(shè)計(jì)方面，從Neural Auction到CGA，阿里媽媽把廣告拍賣這件事：

從“學(xué)會(huì)怎么排個(gè)序”，進(jìn)化到了“直接生成整張最優(yōu)廣告頁”。

傳統(tǒng)的廣告拍賣機(jī)制，比如GSP，本質(zhì)上是給廣告排序——出價(jià)高、質(zhì)量好的排在前面。

但“排序”在數(shù)學(xué)上不可微（1就是1、2就是2，沒有1.1這種中間態(tài)），所以AI無法通過梯度學(xué)習(xí)直接優(yōu)化它。

因此很長一段時(shí)間里，這塊主要靠經(jīng)驗(yàn)規(guī)則撐著，學(xué)術(shù)界走得謹(jǐn)慎，工業(yè)界更是不敢讓模型端到端地去學(xué)。

但阿里媽媽接住了這一棒。

通過提出Neural Auction，阿里媽媽率先給出了“可微的排序計(jì)算形式”，這項(xiàng)被學(xué)界評為“開創(chuàng)性嘗試”的工作，正式打開了端到端學(xué)習(xí)拍賣機(jī)制的大門。

△圖源：阿里媽媽公開技術(shù)博客

但問題并沒有結(jié)束。

Neural Auction默認(rèn)每個(gè)廣告是獨(dú)立的，但現(xiàn)實(shí)并非如此——

一條廣告放在哪個(gè)位置、周圍是什么廣告、同頁結(jié)構(gòu)如何，都會(huì)影響點(diǎn)擊與轉(zhuǎn)化。

這種“排列之間的相互影響”，傳統(tǒng)排序模型無法刻畫。

于是阿里媽媽進(jìn)一步換了一個(gè)更徹底的思路，做了生成式拍賣（CGA）：

不再一條一條地排廣告，而是讓模型一次性生成整一頁廣告的最優(yōu)排布方案，把“怎么排+怎么定價(jià)”一起學(xué)掉，用一個(gè)生成模型去直接擬合整個(gè)頁面的最優(yōu)解。

在大規(guī)模A/B實(shí)驗(yàn)中，CGA不僅顯著提升平臺收入，也在效果上逼近理論最優(yōu)拍賣。

后來這項(xiàng)工作還直接被KDD 2025 Research Track接收了。

而這種“用生成式模型一次性搞定全局最優(yōu)”的思路，也延伸到了智能決策領(lǐng)域。

△圖源：阿里媽媽公開技術(shù)博客

智能決策核心解決的是廣告主怎么出價(jià)、怎么賺錢。

過去十年，這件事大致走了三步：從簡單規(guī)則控制（PID），到用強(qiáng)化學(xué)習(xí)試著自動(dòng)調(diào)，再到引入更復(fù)雜的模型，但結(jié)果始終不理想。

這背后核心卡點(diǎn)只有一個(gè)——反饋太慢。

廣告投放不是下棋，走一步馬上知道輸贏。廣告主投一筆錢，要等幾個(gè)小時(shí)甚至幾天才知道ROI是多少。標(biāo)準(zhǔn)RL在這種環(huán)境下，學(xué)得慢、波動(dòng)大，所以上線就翻車成了常態(tài)。

因此在2023年，阿里媽媽做了一件學(xué)術(shù)界沒人做、工業(yè)界更沒人敢做的事：

通過提出AIGB（AI-Generated Bidding），把“出價(jià)”這件事，重新理解成“生成最優(yōu)策略”。

以前模型靠反復(fù)試，而AIGB是根據(jù)廣告主的預(yù)算和ROI目標(biāo)，一步一步“生成”一整條出價(jià)曲線。

后來在AIGB的框架下，阿里媽媽研發(fā)了基于擴(kuò)散模型的DiffBid，讓出價(jià)過程變得更平滑穩(wěn)定。

在自家廣告平臺實(shí)測中，DiffBid能把GMV提升3.6%–5.0%，而且出價(jià)曲線更平滑，不會(huì)出現(xiàn)“上半場把錢花光、下半場干瞪眼”的情況。

而沿著AIGB這條線，阿里最新的工作AIGB-Pearl，又在“生成”之外加了一只眼睛：

讓模型不僅能生成出價(jià)策略，還能反過來評估自己生成的策略好不好，再迭代優(yōu)化。

（這篇論文也被ICLR 2026接收了）

不過還是那句話，如果只是悶頭做技術(shù)，是開不出ICLR專場的。

技術(shù)之外，阿里媽媽這兩年在做一件更費(fèi)勁但更關(guān)鍵的事：把自己做出來的東西逐步開放出去。

我們目前看到的，阿里媽媽舉辦的各種比賽以及開源，本質(zhì)上都是它為了開放而做出的努力。

比如在2024年，他們成了唯一一個(gè)擁有NeurIPS比賽主辦權(quán)的國內(nèi)工業(yè)團(tuán)隊(duì)，還專門設(shè)了AIGB相關(guān)賽道，讓全球研究者在同一個(gè)問題上做對比和競爭。

同時(shí)也開源了AuctionNet這類大規(guī)模模擬競價(jià)數(shù)據(jù)和系統(tǒng)，解決了一個(gè)長期問題：以前做拍賣機(jī)制研究，大家手里基本沒有真實(shí)工業(yè)數(shù)據(jù)，只能靠模擬和假設(shè)。現(xiàn)在至少有了一套相對標(biāo)準(zhǔn)的“練習(xí)場”。

再加上這次在ICLR開Workshop。

到這里，阿里媽媽的角色，已經(jīng)從“悶聲做技術(shù)”的應(yīng)用方，變成了這個(gè)領(lǐng)域的基礎(chǔ)設(shè)施提供者。

學(xué)術(shù)圈拿到的是數(shù)據(jù)集、比賽、Workshop；工業(yè)界拿到的是真實(shí)的業(yè)務(wù)收益、可復(fù)用的范式、能上線的方案。

而把兩邊連起來的，是阿里媽媽自己。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.