<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      糟糕!最強智能體搶走了1.2%人類遠程工作報酬

      0
      分享至

      人類為AI到底會不會搶走工作操碎了心。被AI取代,與投入巨資卻無法提升生產力同樣糟糕。各類大模型與智能體的評估,正從紙面上的智商競賽,轉向對的直接測驗。這有助于人類面對“生存還是毀滅”時,盡可能地端正自己的位置。

      從數據標注巨頭 Scale AI 的最新報告來看,那些可以居家完成、端到端交付的遠程任務,即便由當下最強大的智能體執行,也只有2.5%能達到客戶可接受的標準;它們的經濟價值更低,智能體從中獲得的報酬至多占1.2%。但是,按照智庫METR的“”,到了明年底,也許最強智能體就有望完成一半的遠程工作了。

      AI被人為地賦予了提升生產力的使命。但“AI能干什么”,并不完整對應著“AI能被市場承認的勞動”。Scale AI想研究的正是,客戶究竟愿不愿意為智能體的勞動付費。

      該研究提出了智能體(或具備智能體能力的大模型)遠程工作指數(RLI)的評估標準。所謂遠程工作,往往是某些可以獨立完成的任務,可以委托、交付、驗證的知識勞動單元,而不是抽象的工作崗位職責。這對于圍繞業務的真實指標(準確率、延遲、幻覺率、客戶滿意度等)展開具備現實意義。

      盡管如此,這些遠程工作本身,也可以是從人類員工或團隊的完整工作流程中拆分出來的——這又為智能體持續地嵌入生產系統和反饋循環創造了條件——這時候為此“買單”的就是智能體的人類合作伙伴了。

      智能體的遠程工作指數,核心就在于它的“自動化率”(automation rate)。它指的是,智能體提交的任務,最終被客戶認可付費的任務數量,在所有選定任務中的占比。這些智能體完成的任務,可以是超越對照組的人類員工提交的結果,也可以是符合客戶心理預期的結果。滿足上述任意一項,即可視為完成任務。

      Scale AI選定的任務,來自全球最大遠程自由職業平臺Upwork。研究團隊從64個二級分類(subcategories) 中篩選出23個“可端到端獨立完成”類別,涵蓋了設計、運營、營銷、行政、數據/商業智能、音頻/視頻制作以及其他類別,共240個項目。

      這些項目還附有人工交付成果的“黃金標準”,以及人類完成上述任務花費的時間與獲得的報酬。人類完成所有這些任務,需要約6000個小時,獲得14.4萬美元的報酬;其中,單個任務中位勞動時間11個小時,中位勞動報酬200美元。

      結果,在所有這些任務中,即使最領先的智能體,能夠讓客戶心甘情愿付費的,也就其中的2.5%。它就是今年出盡風頭的“通用智能體”Manus。其他前沿模型GPT-5、Sonnet 4.5與Grok 4還沒它能打。


      失敗的任務,各有各的難處。約45%是因為“質量差”,還有35%是因為“不完整”,以及15%因為“不一致”。而那些成功的任務,往往集中在更為“寬松”的創意類項目,尤其是音頻(例如為復古游戲創建音效、分離人聲和伴奏、為旁白添加背景音樂)和圖像(例如廣告和Logo設計)相關的工作,以及寫作和數據檢索/網絡抓取。

      如果用“經濟價值”來衡量,智能體的表現就更差了。最強的Manus,完成這2.5%的任務,總共獲得了1720美元的報酬,占所有潛在總報酬的1.2%;剩下的幾個模型或智能體,甚至都離1%都還遠著。

      這倒側面證明了最新披露的一組token數據。

      這家每月消耗1300萬億token的硅谷巨頭,自有模型Gemini通過API每分鐘消耗約70億個token,折合每月約300億,相當于企業調用僅占不到25%,絕大多數token都被谷歌自身龐大的搜索、視頻與廣告等業務消耗了。目前能高效、規模兌現token價值的,仍然是硅谷巨頭主導的消費者市場。

      目前,全年消耗萬億token的“需求大戶”,也僅150家,差不多每家每年在token上花費百萬美元左右。這意味著“企業AI”為谷歌云貢獻了0.3%的收入。它們也許已經通過了技術驗證,正在不斷嘗試與大模型與智能體磨合,驗證工作流程與商業模式。


      可見,AI應用在企業服務領域的爆發,尚需時日。盡管OpenAI最早分析了人類工作的GPT暴露風險,今年又發布了經濟價值評估框架GDPval;Anthropic多次更新了自己的經濟指數(AEI)。但從這兩家AI巨頭最近的用戶使用報告來看,企業AI滲透率的擴展,確實仍然存在“鴻溝”。

      OpenAI發現,ChatGPT用戶超過70%的對話與工作無關。而在與工作有關的活動中,獲取信息(19.3%)、解釋信息含義(13.1%)、記錄信息(12.8%)占比最高,其次是提供咨詢與建議(9.2%)、創造性思考(9.1%)和決策解決問題(8.5%)。

      就連更擅長企業服務的Anthropic也遇到了問題。它發現,旗下Claude API任務的使用分布(usage distribution),呈現了非常明顯的“冪律分布”。即,將近50%的API使用量,映射到了計算機和數學任務,而靠后80%的任務,只占了10%的使用量。

      也就是說,在面對現實工作任務時,AI與智能體還不夠“通用”。OpenAI和Anthropic,采用的工作分類都是傳統的O*NET分類(美國勞工部的職業數據庫),這也意味著它們所謂的“使用”,往往并不意味著讓智能體端到端地替代人類員工。

      它當然仍然有用,但無法真實反映生產力層面的提升。事實上,美國METR研究所分析開發者的實際工作產出時,發現使用AI的開發者完成任務的速度,竟比不使用AI時慢了20%。

      Claude Sonnet 4.5剛出來的時候,Anthropic就宣稱它能連續專注工作超30小時。但是,很快就被智庫METR打了臉。該機構測評發現,它實際能以50%成功率完成的任務,相當于1小時53分鐘的人類任務的水平,不及今年8月發布的GPT-5的2小時15分鐘。


      這也解釋了為什么在Scale AI的遠程任務指數中,大模型的表現往往不佳;因為有經濟價值的獨立任務,即使中位時間也達到了11個小時。

      不過,按每7個月翻一番的“智能體摩爾定律”,那一天不會太久。理論上,差不多16個月后,也就是明年底,最強大的智能體,就可以搶走一半不需要互動與協作的人類遠程工作了。

      參考:

      https://scale.com/research/rli

      https://www.anthropic.com/economic-index

      https://openai.com/index/how-people-are-using-chatgpt/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      被震撼到了!哈梅內伊一死普京馬上下令,俄羅斯全體高層緊急到場

      被震撼到了!哈梅內伊一死普京馬上下令,俄羅斯全體高層緊急到場

      知鑒明史
      2026-03-02 17:31:25
      阿爾茨海默病者逐漸增多,醫生提醒:55歲后,盡量改掉6個壞習慣

      阿爾茨海默病者逐漸增多,醫生提醒:55歲后,盡量改掉6個壞習慣

      39健康網
      2026-02-17 18:31:37
      湖北夫妻檔小吃攤年入超100萬,已買房買車:每天炸500多根年糕、1100多根淀粉腸

      湖北夫妻檔小吃攤年入超100萬,已買房買車:每天炸500多根年糕、1100多根淀粉腸

      臺州交通廣播
      2026-01-08 07:18:03
      金價一夜變天!2026年3月3日黃金價格實時更新,國內黃金基礎價格一覽

      金價一夜變天!2026年3月3日黃金價格實時更新,國內黃金基礎價格一覽

      說故事的阿襲
      2026-03-03 12:28:21
      “91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

      “91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

      挪威森林
      2026-03-02 14:18:46
      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      深度報
      2026-02-11 23:35:03
      報價1億歐元?利物浦欲簽國米中衛巴斯托尼

      報價1億歐元?利物浦欲簽國米中衛巴斯托尼

      樂道足球
      2026-03-03 15:45:59
      馬斯坦托諾辱罵裁判“無恥”染紅,皇馬連敗之夜添陰影

      馬斯坦托諾辱罵裁判“無恥”染紅,皇馬連敗之夜添陰影

      樂道足球
      2026-03-03 16:46:08
      2026款路虎攬勝及路虎衛士上市,售68.99萬元起

      2026款路虎攬勝及路虎衛士上市,售68.99萬元起

      IT之家
      2026-03-03 15:38:17
      霍爾木茲若被封,日本成為最大“冤大頭”!

      霍爾木茲若被封,日本成為最大“冤大頭”!

      金投網
      2026-03-03 16:15:12
      6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

      6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

      小熊侃史
      2025-12-25 11:24:12
      內娛“頂流”地位大洗牌:楊穎受冷落,倪妮邊緣化,他卻殺出重圍

      內娛“頂流”地位大洗牌:楊穎受冷落,倪妮邊緣化,他卻殺出重圍

      洲洲影視娛評
      2026-03-02 15:13:19
      開拓者官宣下放楊瀚森!與揚布拉德簽下雙向合同 將裁掉庫克

      開拓者官宣下放楊瀚森!與揚布拉德簽下雙向合同 將裁掉庫克

      羅說NBA
      2026-03-03 06:17:25
      19+10+6+2!他才是火箭隊的最大驚喜!

      19+10+6+2!他才是火箭隊的最大驚喜!

      Haviven聊球
      2026-03-03 15:50:32
      征服中年女人,無需套路:兩顆真心,一生相守

      征服中年女人,無需套路:兩顆真心,一生相守

      青蘋果sht
      2025-11-04 06:10:40
      新娘全家都是演員!這場“完美婚禮”全是戲!

      新娘全家都是演員!這場“完美婚禮”全是戲!

      看看新聞Knews
      2026-03-02 17:55:03
      猶太財團又要開始賣國了,大規模資產轉移后,貝萊德:美國沒救了

      猶太財團又要開始賣國了,大規模資產轉移后,貝萊德:美國沒救了

      老范談史
      2026-01-13 20:15:38
      你見過最清閑的事業編是啥?網友:還有一個供銷社,閑出病來

      你見過最清閑的事業編是啥?網友:還有一個供銷社,閑出病來

      帶你感受人間冷暖
      2025-12-16 00:20:09
      南京Lily姐火了。
?38歲陪讀媽媽,牽著70歲德國工程師的手

      南京Lily姐火了。 ?38歲陪讀媽媽,牽著70歲德國工程師的手

      歲月有情1314
      2026-02-05 11:13:16
      “仿佛是僵尸”!浙江兩家人接連中招,大人小孩皮膚“報廢”!元兇找到了

      “仿佛是僵尸”!浙江兩家人接連中招,大人小孩皮膚“報廢”!元兇找到了

      上觀新聞
      2026-01-29 22:59:13
      2026-03-03 17:35:00
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      319文章數 62關注度
      往期回顧 全部

      科技要聞

      擁抱AI的"牛馬":邊提效邊自嘲"自費"上班

      頭條要聞

      53歲獨身女租客突發腦梗昏迷 得知其沒有親人多方犯難

      頭條要聞

      53歲獨身女租客突發腦梗昏迷 得知其沒有親人多方犯難

      體育要聞

      35輪后積分-7,他們遭遇史上最早的降級

      娛樂要聞

      謝娜霸氣護夫:喊話薛之謙給張杰道歉

      財經要聞

      特朗普“不惜一切”!全球股債齊崩

      汽車要聞

      長安汽車2月銷量151922輛 環比逆勢增長12.8%

      態度原創

      本地
      藝術
      數碼
      房產
      公開課

      本地新聞

      食味印象|一口入魂!康樂烤肉串起千年絲路香

      藝術要聞

      Nihad Aghazada:當代阿塞拜疆畫家

      數碼要聞

      9.6萬臺!春節泛運動相機「破圈」熱銷,大疆橫掃三大細分賽道

      房產要聞

      突發!綠城接手海南440畝閑置大盤!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版