昨天,馬斯克旗下 xAI 宣布裁員 500 名數(shù)據(jù)標(biāo)注員,已經(jīng)占到該團(tuán)隊(duì)的 1/3,這個(gè)團(tuán)隊(duì)主要負(fù)責(zé) Grok 標(biāo)注與整理訓(xùn)練數(shù)據(jù)的核心部分。
此次裁員的背后原因,是行業(yè)整體的需求已經(jīng)從通用 Generalist AI Tutors 轉(zhuǎn)向?qū)I(yè) Specialist AI Turtors,涵蓋 STEM、金融、醫(yī)學(xué)、安全等。
這種需求也反映在 Mercor 的快速增長中,3 月份的時(shí)候 Mercor 的年化收入剛突破 1 億美金《》。
今天,Mercor CEO Brendan 說,Mercor 的年化收入(Revenue Run Rate)已經(jīng)突破 5 億美金了,從 100 萬美金到 5 億美金只用了 17 個(gè)月時(shí)間。而且增長速度仍然在加速,7 月份,其平均周環(huán)比增長 11%,8 月份周環(huán)比增長 18%,9 月份周環(huán)比增長 19%。
Brendan 說,推動這一迅猛增長的趨勢在于:經(jīng)濟(jì)正在變成一個(gè)強(qiáng)化學(xué)習(xí)(RL)的環(huán)境模擬器(the Economy is Becoming an RL Environment Machine)。而強(qiáng)化學(xué)習(xí)變得如此高效,以至于智能體(Agent)能攻克任何基準(zhǔn)測試,但前提仍需人類來定義獎勵函數(shù),以期實(shí)現(xiàn)萬物自動化。
當(dāng)每個(gè)人都擔(dān)心失業(yè)時(shí),我們正在以前所未有的速度創(chuàng)造一種新的知識型工作,未來的工作將集中在培訓(xùn) Agent 上。Mercor 現(xiàn)在每天向平臺上的人們支付超過 100 萬美金,并迅速招聘幾乎所有領(lǐng)域的專家:軟件工程師、醫(yī)生、律師、顧問、銀行家等等。
![]()
他專門寫了一篇文章談這個(gè)趨勢,Brendan 說,每次技術(shù)革命都引發(fā)了人們對失業(yè)的恐懼。工業(yè)革命用機(jī)器取代了家庭手生產(chǎn)者,計(jì)算機(jī)革命用電子表格和數(shù)據(jù)庫取代了手工文書工作。
然而,如今的失業(yè)率卻低于這些革命發(fā)生前后——而它們都催生了全新的工作類別。關(guān)于 AI 對就業(yè)市場的討論中,一種新的工作類別正在出現(xiàn),那就是訓(xùn)練 AI Agent。
技術(shù)發(fā)展的歷史是一部普及 access 的史詩:印刷機(jī)傳播思想,工業(yè)規(guī)模化勞動力,計(jì)算機(jī)數(shù)字化知識。每次革命都催生了整個(gè)新興產(chǎn)業(yè)。如今,AI 正在讓人類能力本身變得可共享。
人類工作的價(jià)值將發(fā)生轉(zhuǎn)變。嘗試試比較一下自己報(bào)一次稅,與教會 AI 模型如何永遠(yuǎn)替你報(bào)稅的區(qū)別。前者是變動成本,由個(gè)人和企業(yè)反復(fù)支付;后者是固定成本,一旦知識被編碼,就能無限次應(yīng)用。
公司規(guī)模化的關(guān)鍵不是靠一人包攬一切,而是建立流程并培訓(xùn)他人執(zhí)行。同樣,隨著人類教會 AI 智能體自動化每個(gè)工作流,經(jīng)濟(jì)也將實(shí)現(xiàn)規(guī)模化。
強(qiáng)化學(xué)習(xí)(RL)已變得如此高效,足以攻克任何評測基準(zhǔn),但學(xué)術(shù)指標(biāo)并不能反映消費(fèi)者和企業(yè)關(guān)心的真實(shí)結(jié)果。我們的基準(zhǔn)存在“模擬-現(xiàn)實(shí)差距”:報(bào)稅是否最小化了稅負(fù)?醫(yī)療建議是否改善了患者結(jié)局?教案是否真正幫助學(xué)生學(xué)到東西?
![]()
真實(shí)世界擁有更豐富的數(shù)據(jù)室、更復(fù)雜的應(yīng)用與工具環(huán)境,以及來自程序員和會計(jì)師的雙重要求。模型評估的前沿在于構(gòu)建更豐富的環(huán)境:模擬 Google Drive 工作空間的數(shù)據(jù)室,復(fù)刻你筆記本電腦或手機(jī)上的多種應(yīng)用的腳手架,以及能評估你在現(xiàn)實(shí)世界中近乎無限行動可能性的獎勵函數(shù)。
模型還需接受更長周期任務(wù)和協(xié)作環(huán)境的評估:由醫(yī)師委員會評審的縱向患者案例、并購交易中的多方談判、市場周期波動中的風(fēng)險(xiǎn)對沖。
我們需要為經(jīng)濟(jì)中的每項(xiàng)工作、工具和任務(wù)創(chuàng)建環(huán)境,而這無一不需要人類勞動來構(gòu)建、驗(yàn)證和完善——這才是工作的真正未來。
人類訓(xùn)練模型的市場規(guī)模,取決于人類能做而智能體尚不能完成的任務(wù)量。許多相信 ASI 必然實(shí)現(xiàn)的研究者輕視人類數(shù)據(jù)的作用,認(rèn)為一旦 AI 在所有任務(wù)上超越人類,人類數(shù)據(jù)就將失去價(jià)值,能貢獻(xiàn)于模型改進(jìn)的人群將會大幅縮減。
他說他們曾開展過一個(gè)項(xiàng)目,讓 100 人團(tuán)隊(duì)尋找前沿智能體使用工具時(shí)犯的錯(cuò)誤,并制定評估模型錯(cuò)誤的準(zhǔn)則。起初,人人都能輕易難倒頻繁出錯(cuò)的模型;六個(gè)月后,只有 20 人還能找出它的漏洞——這似乎印證了人類數(shù)據(jù)懷疑論的觀點(diǎn)。
但當(dāng)他們?yōu)橹悄荏w增加更多可訪問工具,并開始推送需人類耗時(shí)十小時(shí)以上的長周期任務(wù)時(shí),模型突然在這些挑戰(zhàn)中頻頻失敗,100 名參與者再次全部為項(xiàng)目做出了有意義貢獻(xiàn)。因此,只要經(jīng)濟(jì)中還存在人類能完成而智能體無法勝任的任務(wù),我們就將繼續(xù)需要人類創(chuàng)建評估體系和訓(xùn)練智能體。
長遠(yuǎn)來看,Brandan 認(rèn)為,所有人都聚焦于 AI 可能淘汰的工作(如文案撰寫、律師助理、醫(yī)療記賬),卻極少關(guān)注它將創(chuàng)造的產(chǎn)業(yè)——由那些塑造 AI 判斷、設(shè)計(jì)訓(xùn)練環(huán)境、確保輸出符合人類標(biāo)準(zhǔn)的人群推動。
我們正進(jìn)入“經(jīng)驗(yàn)時(shí)代”,模型學(xué)習(xí)在真實(shí)世界中優(yōu)化獎勵。正如人類通過他人指導(dǎo)學(xué)習(xí),AI 也需要強(qiáng)大反饋。教授設(shè)計(jì)考試和評分標(biāo)準(zhǔn)以幫助我們進(jìn)步,經(jīng)理通過績效評估跟蹤我們的工作表現(xiàn)。下一代 AI 模型同樣需要這類腳手架。
工業(yè)革命創(chuàng)造了設(shè)計(jì)機(jī)器并保持其運(yùn)行的新階層;AI 革命也將創(chuàng)造新階層,其任務(wù)是引導(dǎo)機(jī)器并普及其能力。這是一個(gè)巨大的悖論:AI 的未來,終將歸于人類。
雖然核心已經(jīng)聚焦到 RL 訓(xùn)練這塊,但 Mercor 目前對自己的定位還是一個(gè) AI 招聘平臺。
華人團(tuán)隊(duì)做的 AI 招聘這塊,之前我介紹過主要聚焦于匹配的產(chǎn)品已經(jīng)做到了 100 萬美金 ARR《》,而由另一個(gè)由華人團(tuán)隊(duì)做的 AI 面試工具,不到 2 年時(shí)間已經(jīng)做到了超過 1000 萬美金的 ARR。
與 Mercor 專注于為 AI 企業(yè)提供 RL 人才不同,它解決的是一個(gè)比較通用、簡單但也很剛需的點(diǎn),也就是當(dāng)你做線上面試時(shí),AI 可以給你……
全 文 共3473 字
后續(xù)內(nèi)容為付費(fèi)會員專屬,會員掃碼登錄直接閱讀
Memo: Signal, not noise!
訂閱 Memo Pro
Memo(vcsmemo.com)是一個(gè)基于付費(fèi)訂閱模式的創(chuàng)投內(nèi)容平臺,已得到大量 VC、企業(yè) CEO 以及高管的支持,我們希望幫助你捕捉最具價(jià)值的行業(yè)信號、過濾噪音(Signal,Not Noise)。
訂閱 Memo Pro
你將獲得:
1.解鎖未來一年以及之前的所有會員專屬內(nèi)容
2.郵件訂閱功能:付費(fèi)內(nèi)容+最新行業(yè)快訊+...
3.優(yōu)先體驗(yàn) Memo 新產(chǎn)品和新功能
限時(shí) 799 元/年(原價(jià) 999 元/年),掃碼立即訂閱
1.
2.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.