這場對話發生在MLOps.community的播客錄制現場。兩位嘉賓分別是Prosus集團全球AI與數據科學負責人Euro Beinat,以及Just Eat Takeaway.com首席技術官Mert ?ztekin。
![]()
就在幾天前,Prosus剛剛宣布已在其全球生態系統中部署了37,000個AI智能體—這個數字在2025年7月時的目標還是30,000個,而當時他們只有18個。與此同時,Just Eat在2026年1月推出了AI語音助手,并在英國開始試點配送機器人。兩家公司都在用不同的方式,探索同一個問題:當AI工具從少數技術團隊的專屬,變成全員標配時,如何治理?
模型的能力遠遠超出了人們的使用方式
三年前,CTO的工作還相對簡單。Mert回憶說:"你的核心職責就是為公司提供功能性需求——來自產品部門、市場部門或其他任何部門。同時你要負責平臺的穩定性和可擴展性。"
ChatGPT的出現改變了一切。"你突然意識到,這不只是為業務提供某個功能或特性了。你還需要幫助整個業務完成一次巨大的轉型——思維方式、工作流程、工作方法都需要改變。"
他在公司全員大會上的表態很直接:"你們必須使用這些工具。這沒有選擇余地。因為不是AI會取代你,而是會用AI的人會取代你。如果你不使用這些東西,你失去的不只是工作,而是整個職業。"
這種推動見效了。Just Eat目前有超過95%的工程師每天都在使用AI編碼工具。六個月前他們做過一次統計,估算有30-40%的生產代碼是AI生成的——盡管這個數字很難精確測量,因為有建議、復制粘貼、還有其他工具的使用。
但Mert坦誠地說:"現實是,我們并沒有看到30%的速度提升。因為軟件開發不只是寫代碼,還有很多其他環節。"
瓶頸在對齊,不在鍵盤
"我有個笑話,我總是說瓶頸通常在對齊環節,而不是真正動手敲鍵盤的環節。對齊花的時間要長得多。"
Euro補充道:"代碼編寫只是公司工作流程中的一個環節。如果你看整個公司,工程部門做很多事情,包括編碼。有一群人是代碼的貢獻者,但這種自動化——或者說智能體式的改進——可以應用到組織的每個角落。"
他指出,編碼之所以是相對容易推進AI的領域,是因為"軟件開發是一個被充分理解的學科。有學校、培訓、編碼工具,有最佳實踐,人們大致知道怎么做,別人也能判斷做得好不好。"
但組織中還有極長的長尾場景——Euro稱之為"微小的總可尋址市場"。"編碼是一個大的總可尋址市場,而在一個組織內部,你有成千上萬個微小的總可尋址市場,每個市場可能只有1個或10個人。他們可以用這些工具讓工作更有影響力,可以更快、更好,或者符合任何你想要的指標。"
他舉例說:"市場部門可能有三個人在某個問題上掙扎,他們一遍又一遍地重復同樣的事情。現在他們可以做得更快,然后去做別的事。如果我不在那里,我怎么發現這個問題?沒辦法。這不像編碼,我們知道好的標準是什么。在這里我不知道什么是好的,只有他們知道。他們是唯一能夠把某些東西組合起來,讓自己工作變得更好的人。"
30,000個智能體不是技術目標,是文化變革
2025年7月,當Prosus宣布要在年底前達到30,000個AI智能體的目標時,很多人覺得這個數字很瘋狂。那時候他們只有18個。
Euro解釋說:"讓我們回過頭來想想,為什么這是個好主意,即使它看起來有點傻。我認為這是個非常好的主意,因為它與變革管理有關。它與智能體本身的關系不大,更多的是關于讓每個人都能移除他們對智能體的心理障礙。"
問題的根源在于:盡管他們早在2024年3月就推出了智能體構建工具Toqan,這個平臺具備所有功能——可以連接MCP、可以連接幾十個內部系統——但使用量在一段時間后停滯了。"只有技術人員在用。所有其他人都認為這是工程師的工具,工程師才能創建智能體。所以我們得等他們來幫忙。"
他們必須打破這個認知障礙。方法就是坐在市場部門、人力資源部門的人旁邊,在30分鐘、15分鐘內創建智能體——不是一周。"一旦你經歷了這個過程,你就會說,'哇,就這樣?創建一個能帶來改變的自動化就需要這么點?'是的,就這么點。在這個時間點上就是這么簡單。"
一旦有人創建了對自己有幫助的自動化,他們會告訴其他人。這種機制形成了知識的滲透,讓每個人都能創建智能體。
"我們不知道這些智能體有多有用,有多好。我們之后會關注這個。首先,我們要確保每個人都感到自在,在非常具體的邊界內——你可以做你想做的事。有非常強的安全條款,但在這些條款內,每個人都被鼓勵盡可能多地實驗,這樣他們就能成為這些工具的主人。這不是工程工具,是每個人的工具。"
一旦達到那個狀態,就可以開始關注哪些是好的智能體,如何讓它們更好,然后如何改變最初產生低效的流程,如何改變組織。"如果你沒有讓每個人參與進來,很難做到這一點。所以,30,000個智能體實際上意味著這是一個變革管理過程,是一個文化過程,是一個組織的事情,與技術本身無關。"
大膽的目標制造好奇心
Mert對這個策略表示認同:"我非常喜歡這個方法。有兩件事。第一,你提出了一個大膽的想法,沒人能忽視,這在人們心中制造了一個問號——那是什么?為什么是30,000?我該擔心嗎?我該去培訓嗎?你創造了需求,創造了期待,你可以在人們心中制造一個問號。"
"如果你不夠大膽,不夠有挑戰性,人們很容易就繼續往前走,忽略它,專注于自己的工作。"
他用自己8歲女兒學習閱讀來類比:"我的KPI是她每天讀多少頁。我實際上不在乎她讀的是不是我想讓她讀的故事,但在這個階段,我想讓她閱讀,想讓她理解,想讓她變得更好、更舒服。然后當她變得更舒服時,我們再討論她應該從中獲得哪些故事、哪些價值觀。"
"但現在,類似于Euro做的事情,你需要創造對正在發生的事情的第一層理解,每個人都需要強迫自己跳上那條船。如何從中獲得最大價值是下一個階段。"
工具必須立即有用,否則就不該做
但這種全員推進會不會給員工造成負擔?畢竟每個人都很忙,要在已經很滿的日程中抽時間學習新工具,即使知道以后可能會讓生活更輕松,但前期的痛苦還是很難接受的。
Euro對此有截然不同的看法:"我認為這是完全錯誤的思考方式。這些工具只有在對你立即有幫助時才會被使用。沒有辦法把這些工具強塞到人們喉嚨里。順便說一句,這些是聰明的同事,他們知道如何工作,已經在優化自己的工作,一直在處理低效問題。它必須對你有益,而且你必須是認識到這一點的人。如果不是這樣,你一開始就不應該做。做對自己沒幫助的事情沒有意義。"
那么組織能做什么?"我們能做的是確保達到那個點的障礙盡可能低。這意味著工具有效。它們能訪問你擁有的所有知識庫。防止你犯大錯誤——所以你有邊界條件。提供例子——其他人做了什么。所以障礙應該非常非常低。但一旦障礙低了,唯一有意義的是,如果你創建的東西對你有幫助。如果沒有幫助,你就不應該做。"
"是的,可以這里那里測試一下,但這就是為什么我們甚至不考慮為此分配特殊時間。這不應該是必要的。它應該是立即有用的。否則你實際上會制造摩擦,然后你就得處理摩擦,然后你就有了所有其他的討論。所以我認為這不是個好主意。"
他們還通過游戲化來認可優秀的工作。"我們有這個項目,叫做Prous Talent——我想是這個名字——是圍繞《創智贏家》設計的,是一場競賽。現在在整個集團開始,每個人都創建智能體,每個月會有一個委員會選出最好的智能體,在整個集團發布,讓每個人都知道。然后會有一個高潮,到3月會有一個大活動,會有一個獲勝智能體的大選拔,獲勝者將在硅谷待一周,還有很多其他的。"
"這樣做是有原因的,因為它對你有影響,但也是你知道會被其他人認可的事情。所以你需要很多這樣的東西,但把這變成一個單獨的創新項目的想法,我認為這不是個好主意。"
治理必須實用,不能只是官僚主義
對于30,000個智能體(現在已經是37,000個),治理是個不可避免的話題。
Mert的觀點是:"治理通常在人們感覺不到,但它在某種程度上保護他們,而不會給人們帶來太多痛苦或麻煩的時候才有效。顯然這取決于領域。"
對于軟件工程師,如果是生成代碼或審查代碼,就需要有技術或工具集來治理你的智能體在做什么。"應該有其他智能體或人來治理正在發生的事情,這樣才能讓軟件工程師更靈活、更自信。所以你需要構建這些東西。"
"你不能只是把治理當作一個谷歌表單,每個人在做事之前都需要提交,或者數據保護官需要批準用例。那是官僚主義,當然也是需要的,別誤會我的意思,在需要的情況下也是需要的。想法是我們如何構建治理,讓人們感覺不到有治理在發生,或者讓人們很實際地理解,好吧,他們問這些問題或有這些邊界或限制是為了保護我或保護業務不受這些情況影響。"
在AI炒作的早期,他們在工具選擇上幾乎沒有治理,"因為有太多工具可用于市場、銷售和其他東西。用不了6個月就意識到每個人都在不互相溝通的情況下購買工具,甚至不同部門以不同的合同、不同的價格購買同一個工具。"
但他們也不想減慢人們采用或嘗試這些東西的速度。"肯定是有成本的,通常技術部門要承擔成本,確保這些東西是安全的,或者有適當的采購。但你只是想讓他們嘗試,6個月、8個月后,我們開始對如何采購AI工具、如何啟動、如何訪問這些東西施加更多治理。"
"但你也要嘗試在這些方面保持實用,你不想讓人們覺得,好吧,你在扼殺業務的創新,你只是在拖慢我的腳步,你只是讓我更難做,只是因為你沒有預算,我們不想那樣。"
他們從幾乎沒有治理開始,現在正在建立更多。"我不知道我們是否會隨著時間推移走向更嚴格的治理。我認為我們的方法應該更多地是自動化這些治理工具,這樣你就不會感覺有人在治理或有東西在治理。"
"我們為業務構建了框架內的自治解決方案,這又取決于領域。軟件工程不同,采購不同,啟動銷售AI智能體完全不同,或者客戶服務用例完全不同。所以只要你務實,我認為你就能找到解決方案。"
影子IT不是新問題,但規模變大了
一位朋友曾告訴主持人,他在數據治理崗位上的任務是檢查所有正在使用的AI工具。他以為作為一家不算很大的公司,大概有10到12個工具。結果走訪每個團隊后發現有90個——而且這還不是全部,因為肯定有人在把數據扔進他們個人的Gemini賬戶或其他什么東西里。
Mert的回應很直接:"實際上,這個問題不是從AI開始的。我們過去也有這個問題。自從技術開始以來,幾乎每個部門都可以自己購買工具。他們會買,然后他們就買了。"
"兩三年前,當企業IT團隊給我看我們從不同工具那里擁有的許可證數量,通過部門主管的信用卡支付時,簡直令人震驚——而且它們的標簽或域名中沒有任何AI。所以這個問題一直存在。"
作為技術部門,他們構建的是:"第一,我們如何保護自己,因為關注點是,你理解人們想讓他們的組織更有生產力,盡快解決問題。那是企業家心態,完全沒問題。但我們也有責任保護業務、客戶和合作伙伴。"
"所以為此你需要有實用的政策,讓人們可以遵循,至少即使他們買了什么東西,他們也可以說,好吧,我正在買這個,嘿,你想整合到我們的Okta系統或我們的安全系統嗎,它在Zscaler后面還是別的什么地方。你需要教育人們,好吧,我們知道你時不時在構建影子IT,但至少讓我們幫助你,這樣我們作為企業就不會有更大的問題。"
"這就是我們一直在努力做的,我認為我們更成功,因為技術也在幫助理解正在使用哪些工具。財務報告告訴我們正在發生什么。網絡日志說,好吧,有這么多流量流向這個方向。我們盡量不從一開始就阻止它,但我們試圖教育他們來幫助我們保護他們和業務。"
他坦誠地說:"我通常對技術部門或我或我的人有一個擔憂,就是我們有時會高估我們解決他們問題的能力,比如,哦,我可以解決他們的問題,我只需要再多5個工程師,或者我也可以解決市場問題。但那不是你那5個工程師的最佳用途。外面已經有解決方案了。讓他們把這個問題外包給別人。我們有核心業務問題——食品配送、雜貨配送——我們需要用那5個工程師來解決我們的問題。"
"如果是10萬美元的花費,那就作為業務花掉。所以這就是為什么我們需要賦予人們在給定框架內運作的能力,幫助我們幫助他們如何治理或采購或維護這些東西。"
Euro補充說:"教育有很多不同的形式。但你已經說過的一點是,這些工具會犯新的錯誤,但它們也可以犯我們以前犯過的大部分錯誤,只是在犯錯方面更擅長了,因為有更多的方法可以犯錯。所以你需要確保人們意識到這一點。"
"但你也可以在不同層面采取行動。比如,你可以在某個點上說,這種類型的數據——有一個非常具體的數據類型列表——不應該與這些工具一起使用。就這樣。你不能去那里。"
"然后你還可以在不同的地方引入一定程度的摩擦。比如,如果你有一個發送電子郵件的智能體,它不允許發送批量電子郵件,一次只能發送一封,而且你不允許循環它。這樣你就減少了它開始向世界發送垃圾郵件的機會。所以有各種各樣的措施可以實施。"
"如果你把它們全部實施,你就消除了所有錯誤,然后你實際上就沒有多少這些工具的用處了。但然后你開始剝離它們,看看什么是可接受的,什么是不可接受的。你會達到某個點,在那里你找到了創新需求和保護組織需求之間的某種平衡。"
AI預算:單位成本在下降,但總量在暴漲
主持人提出了一個敏感但重要的問題:如何為AI分配預算?
"這是一個超級有趣和重要的點,因為我們看到兩個現象。一方面,智能的單位成本下降得非常快。一年前做同樣的事情,現在是一半、一半、一半、一半——每百萬token的成本也在下降。所以有一個對我們有利的趨勢,所有這些成本隨著時間推移會下降。"
"同時我們看到另一個現象,就是我們做的每件事都需要更多token,成本更高。所以這兩件事是相互對立的,總的來說,它變得更貴了。額外的token使用過度補償了成本的降低。"
"在那個點上,你有很多事情可以做。一件事是優化。到目前為止開發的許多用例都非常低效。提示詞非常大。上下文非常啰嗦,諸如此類。所以你需要回去重新設計事情的做法,因為否則成本會很高。有很多技巧和啟發式方法可以減少輸出的token數量。"
"你開始達到這樣一個點,即開源模型與更大的商業模型競爭,不是對所有事情,但對許多實際用例。然后在那個點上,你最好自己托管整個基礎設施,這是覆蓋它的另一種方式。"
"但總的來說,去年不是問題,因為量很小,用例也不復雜。現在是個問題。"
Mert同意:"我的意思是,我同意。我認為在內心深處,你相信這個投資回報總是以某種方式積極的——也許不是在一開始,因為構建了錯誤的智能體或購買了工具的學習曲線,但隨著時間推移,隨著人們學習,隨著技術變得更好,采用率提高,你知道業務的投資回報會更高。"
"每個企業都想增長,我認為我們都相信AI將是企業能增長多快或能失敗多快的游戲規則改變者。所以你真的想嘗試優化這些成本嗎,還是確保這家公司在5年內會大兩倍,或者在5年內會縮小一半?這就是擔憂。"
"顯然,你會隨著時間優化這些東西,但我認為我們真正相信,如果人們在使用它,他們就在從中找到價值。沒有人天生就想浪費公司的錢。他們從這些東西中得到的東西,比公司花費的要多。顯然,可能他們中的一些人沒有最優化的提示詞或正確的模型,但我認為這些都是非常小的單位成本。那不是我目前最大的擔憂。"
"我的擔憂是,我們如何在5年內讓公司增長兩到三倍,以及AI將如何實現這一點。"
核心問答
Q1:為什么Prosus要設定30,000個AI智能體這么激進的目標?
這不是技術指標,而是變革管理策略。核心問題是打破"AI智能體是工程師專屬工具"的認知障礙。當市場部門、人力資源部門的人也能在15-30分鐘內創建自己的智能體時,他們會意識到"就這么簡單?"這種認知突破會形成知識滲透,讓每個人都成為工具的主人。大膽的目標制造好奇心和問號,防止人們忽視這場變革。
Q2:影子IT問題如何解決?是嚴格管控還是放任自流?
影子IT不是AI帶來的新問題,過去就存在。關鍵是在創新自由和風險控制之間找到平衡。實用的方法包括:教育而非禁止,讓人們理解治理是在保護他們;通過技術手段自動治理(如限制智能體權限、檢測異常行為),而不是官僚流程;接受6-8個月的試錯期,然后根據實際問題收緊政策。核心原則是"框架內的自治"——邊界清晰,邊界內充分自由。
Q3:AI工具的成本在暴漲,預算應該怎么規劃?
存在兩個相反的趨勢:單位成本(每百萬token價格)在快速下降,但使用量激增導致總成本上升。短期應對包括優化提示詞、使用開源模型、自建基礎設施。但更重要的是長期視角:如果相信AI是未來5年公司增長2-3倍的關鍵,就不應該過度糾結短期成本優化,而應該關注投資回報率。員工不會無故浪費公司的錢——如果他們在用,說明有價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.