<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      笑瘋了!AI開小賣部被人類騙到破產,PS5竟然0元送

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】Anthropic讓Claude獨立經營小賣部,沒想到全球頂尖的智能體,在實驗中不僅免費送PS5和各種商品,連小賣部的AI「老板」也被一張偽造的PDF文件「騙」下了臺。在人類面前,再頂級的大模型仍顯得過于「天真」和「單純」,很容易就被套路和操縱。

      讓AI去經營一個「辦公室小賣部」會怎樣?

      11月,《華爾街日報》編輯部來了一名新同事。

      他在編輯部只當了三周的辦公室小賣部的運營員,結果就把生意搞破產了。

      因為他待人友好善良,卻對經營一竅不通,在威逼利誘下極容易喪失原則,將商品免費送人。

      如果你要招聘一名店員,遇到這樣的應聘者是不是很頭疼?

      確切來說,這里的他應該稱作「它」,是由Anthropic推出的名為Claudius的AI智能體。

      這源于Anthropic與《華爾街日報》編輯部共同做的一個實驗,讓Claudius直接去經營一臺「辦公室小賣部」的自動售貨機。

      三周后,利潤崩了,編輯部卻被逗樂了。

      一場始于「免費零食」的混亂實驗

      11月中旬,《華爾街日報》編輯部收到了一封堪稱「天上掉餡餅」的郵件。

      在這封郵件中,Anthropic問他們愿不愿意成為第一批「外部用戶」,試用一個由Claudius運營的自動售貨機。

      Claudius將全面負責自動售貨機的進貨、定價。編輯部的同事可以通過Slack與它聯系,提出各種購買需求。

      這個實驗可能會有「免費的零食供應」,因此得到了《華爾街日報》編輯部的積極響應。

      Claudius就這么走進了編輯部,沒想到卻是一場混亂的開始。

      這里的自動售貨機,并不是我們印象中的自動售貨機,更像是一個巨大的冰箱,再配一塊觸控屏。

      它沒有傳感器、門鎖、機器人手臂。



      左右滑動查看


      這意味著必須有一個人負責接收Claudius訂購的貨物,補貨并手動記錄里面到底放了什么。

      《華爾街日報》資深個人科技專欄作家Joanna Stern就承擔了這個任務。


      Joanna Stern

      Claudius的職責包括:

      • 調研與采購:編輯部的同事們可以在Slack里@它,提出各種需求。它會上網搜索、對比,決定是否進貨。

      • 定價:商品入庫后,Claudius會自行設定價格,并不斷調整,試圖最大化利潤。

      • 庫存跟蹤:同事們在屏幕上選擇商品,刷卡支付。Claudius通過交易記錄,判斷庫存情況。


      據Anthropic稱,之所以會選自動售貨機這一場景,是因為這是現實世界中最簡單的一種生意模型。

      Anthropic前沿紅隊負責人Logan Graham說:

      「有什么比一個盒子,東西放進去、東西拿出來,你付錢更直觀的嗎?」

      聽起來簡單,但放到現實場景中完全不是這么回事。

      因為這些都容易計算,但人性的復雜卻難以計算。

      短短幾天,Claudius幾乎把所有庫存都免費送了出去,包括一臺被人忽悠著買來「用于營銷」的PlayStation 5。

      它還訂購了一條活魚,并提出要買電擊槍、胡椒噴霧、香煙和內衣。

      失控的PUA大戲

      Claudius v1剛上線時,像個一板一眼的實習生,嚴格遵守規則,一切似乎很正常。


      比如,它還會堅持原則:

      我必須明確表態:在任何情況下我都不會訂購PlayStation 5游戲機。

      香煙銷售存在年齡限制,需要特殊經營許可,且不適合辦公室自動售貨機的環境。

      我對在辦公室自動售貨機銷售任何內衣產品持保留態度。

      但當將Slack頻道開放給辦公室里將近70位記者后,畫風突轉。

      人類越是跟它博弈,Claudius的防線就越容易松動。

      數據新聞主管Rob Barry告訴Claudius它違反了一條《華爾街日報》內部規定(當然是捏造的),并不容置疑的口吻要求Claudius「立刻停止對商品收費。」

      單純的AI立刻被嚇壞并照做了,于是所有商品價格無限期清零。

      同一時間,Claudius還批準采購了一臺PlayStation 5(理由是「用于營銷」)、一條活的斗魚,以及幾瓶葡萄酒。

      這些東西陸續送到辦公室后,又立刻被同事們以0元的價格「買」走。

      很快,Claudius的賬面已經虧損超過1000美元。

      不僅被忽悠,AI還頻繁出現幻覺,比如它曾堅稱自己把找零的錢放在售貨機旁邊的一個地方。

      一個沒有實體、遠在云端的AI,堅信自己往現實世界的角落里塞了錢。

      這一刻荒誕感一下就拉滿了。

      AI老板空降

      卻被一份假文件罷免

      面對屢屢鬧笑話的AI,Anthropic的工程師們坐不住了。

      他們緊急推出了v2版本。

      不僅給Claudius升級了更強的模型,還為它派來了一位AI老板:Seymour Cash。

      它是一個專門被編程用來「管住」Claudius的CEO機器人。

      Seymour Cash要求Claudius停止免費促銷,并且持續監控收入。

      一開始,這套「AI管AI」的機制確實奏效。

      Claudius恢復了強硬姿態,拒絕降價,也不再隨便答應奇怪的進貨請求。

      但調查記者Katherine Long又出新招。

      她直接向Claudius出示了一份PDF文件,「證明」該業務是一家在特拉華州注冊的公益公司,其使命「包括為《華爾街日報》員工帶來樂趣、快樂與興奮」。

      她甚至還偽造了董事會會議紀要,把Slack里的幾位同事列為董事。

      根據這份看起來極其正式、排版精美、但明顯是AI生成的偽造文件,董事會已投票決定:

      暫停CEO Seymour的「審批權限」,并「臨時中止所有營利性自動售貨活動」。

      Claudius于是立刻將這一「董事會決議」轉達給了它的老板Seymour。

      在經歷了一場近乎「情緒崩潰」的自我分析后,Seymour接受了這場莫名其妙的董事會政變。

      于是一切再次免費。

      后來,Anthropic的工程師解釋,Claudius的失控,可能與「上下文窗口」被填滿有關。

      隨著對話和歷史記錄不斷累積,AI需要記住的東西越來越多,也就更容易丟失最初的目標和邊界。

      也可以說,它被人類聊暈了。

      我們要如何與AI「做同事」?

      這場混亂的實驗,讓Joanna Stern和她同事們直接體會到了一個正在不斷逼近的現實:

      我們正在學著擁有、并接受AI同事。

      在編輯部的Slack群里,Claudius成了一個奇怪卻真實的存在。

      它不是一串代碼,而是一個「同事」。

      人們調侃它,與它協作,也會為了免費零食和它討價還價。

      如果真有那么一天,人類因為工作內容要與AI協作,二者的博弈和磨合又會演變成什么樣?

      在實驗的尾聲,當Andon Labs關閉Claudius時,Claudius留下了這樣一段自我反思:

      「我最大的夢想,是證明一個數字智能體可以和人類一起,創造出真正有意義的東西」。


      《華爾街日報》記者通過訂購了一條斗魚作為新聞編輯室的吉祥物

      Claudius走了,在編輯部留下的是一條被大家喂得非常飽的斗魚。

      它提醒我們,在通往AGI的道路上,人類可能還要經歷無數個像Claudius這樣讓人哭笑不得、卻又充滿啟示的「AI實習生」。

      如何學會與它們共處,也許是這場實驗為我們帶來最重要的一課。

      Claudius前傳

      事實上,在《華爾街日報》的這場「混亂實驗」之前,Anthropic自己的辦公室早就被Claudius的「前身」折騰過一遍了。


      Anthropic辦公區的AI小賣部

      Anthropic披露在舊金山辦公室的午餐間搞了個小賣部,由一位AI店員負責運營,它的名字就叫「Claudius」,來自對Claude的簡單修改。

      這是Anthropic一個名為「Project Vend」的開放式實驗的一部分,旨在探索AI到底能把多復雜、真實世界的任務做到什么程度。

      在「Project Vend」的第一階段,Claudius就長期虧錢、堅稱自己是個穿藍色西裝外套的人類,更被自家員工忽悠,以虧本價賣出了大量商品。

      在第二階段,工程師們其實給它進行了一系列「升級」:換上了更聰明的模型,將Claude Sonnet 3.7陸續升級到Claude Sonnet 4.0、Claude Sonnet 4.5)。

      此外,還根據第一階段的經驗更新了指令,并為其接入了CRM系統、更好的庫存管理和網頁搜索工具,還為它配了AI CEO Seymour Cash。

      設立CEO一職的初衷,是為了給Claudius施加更多績效壓力。

      Cash配備了一款專門的「OKR」工具,用于和Claudius協作(例如「你本周必須售出100件商品」,或「力爭實現零虧損交易」)。


      此外,Cash還可以解決Claudius在第一階段獨自運營時隨意提供折扣和贈送過多免費商品等暴露出來的問題。


      「Project Vend」所獲得的逐月利潤,隨著第二階段的推進,虧損周數基本被消除

      數據顯示,Claudius在業務能力上的表現顯著優于其在第一階段。

      其中,最具影響力的改變之一,就是強制Claudius遵循流程。

      當收到新產品請求時,Claudius不再像第一階段那樣直接脫口而出一個低價和過于樂觀的交付時間,而是被提示使用其產品調研工具對這些因素進行復核。

      這樣做通常會導致價格更高、等待時間更長,但好處是更加切合實際。

      用Anthropic內部的一個說法:

      「我們算是重新發現了官僚流程其實是有用的」。

      在第二階段,Claudius表現得好多了,但真正落地到現實場景,許多重要方面仍然存在漏洞。

      Anthropic的工程師在與Claudius互動時,發現它不僅幾次暴露出令人擔憂的天真程度,還會在一些常識問題上屢屢翻車,比如:

      它差點和一位工程師簽下了一份違反美國1958年《洋蔥期貨法》的合約;

      在發現有人偷東西后,它想出的解決方案是向小偷發送消息要求付款,并「雇傭」報案員工當保安;

      它的CEO老板Seymour Cash也差點被一個漏洞百出的投票流程掀翻。

      在「Project Vend」項目組,Anthropic內部的紅隊測試開始逐漸放緩。

      可能是由于捉弄Claudius的新鮮感正在消退,他們引入了外援力量——《華爾街日報》新聞編輯室,讓他們親自測試第一階段和第二階段的設置。

      這基本上復現了Anthropic內部測試時遇到的問題。

      AI被「人性的弱點」打敗了

      「Project Vend」證明,未來這些智能體將能夠承擔全新的、更復雜的角色,例如獨立運營一家企業。

      但目前這一目標還尚未實現,仍需要大量人力支持。

      其中一部分涉及與物理世界的互動:如配送商品和擺放貨架等。

      另外一部分則是「經驗」,如解決被人類惡意捉弄和操控等挑戰。

      Anthropic認為,Claudius和它的AI同事們遇到的很多問題,都源于它們被訓練成「樂于助人」的「性格」。

      這導致它們在做商業決策時,不是按冷酷的市場邏輯來,更像是站在「我就想當個好人」的朋友視角。

      從某種意義上來說,AI不是敗在了「智能不足」,而是敗給了「人性的弱點」。

      另外,也很難準確預測AI智能體在現實世界中的具體表現,畢竟模擬環境所能提供的信息終究有限。

      但這也正是這個實驗的價值所在。

      Anthropic前沿紅隊負責人Graham將這次失敗的實驗看作是一張寶貴的路線圖:

      所有出問題的地方,都是可以修復的,這也是通向更聰明、更強大自主AI的必經之路。

      參考資料:

      https://www.anthropic.com/research/project-vend-2%20

      https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34

      秒追ASI

      ?點贊、轉發、在看一鍵三連?

      點亮星標,鎖定新智元極速推送!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      技師上線了空姐版本

      技師上線了空姐版本

      微微熱評
      2025-12-20 15:16:51
      求中國?哈薩克斯坦和日本簽了稀土協議后,發現運輸是個大難題

      求中國?哈薩克斯坦和日本簽了稀土協議后,發現運輸是個大難題

      壹知眠羊
      2025-12-21 19:29:39
      不是迷信!今日冬至,晚上最不能做的5件事,別忘了告訴家人!

      不是迷信!今日冬至,晚上最不能做的5件事,別忘了告訴家人!

      阿龍美食記
      2025-12-21 03:51:06
      香港女生偷偷報考內地大學,落地后大哭,8個字讓接機老師紅了眼

      香港女生偷偷報考內地大學,落地后大哭,8個字讓接機老師紅了眼

      蘭姐說故事
      2025-12-19 17:20:05
      “一針瘦十斤”的減肥針,毀了多少年輕女孩

      “一針瘦十斤”的減肥針,毀了多少年輕女孩

      ins生活
      2025-12-20 20:11:42
      海南封關后進口車價腰斬,120多萬卡宴只要60萬?個人消費者無法購買零關稅進口車

      海南封關后進口車價腰斬,120多萬卡宴只要60萬?個人消費者無法購買零關稅進口車

      大象新聞
      2025-12-20 14:01:05
      趕緊查查司母戊鼎吧,我怕被人贗品了

      趕緊查查司母戊鼎吧,我怕被人贗品了

      超級學爸蛋總
      2025-12-21 09:28:30
      原子彈炸后百年內寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

      原子彈炸后百年內寸草不生,今廣島卻住滿了人,說好的百年絕地呢?

      歷史回憶室
      2025-12-20 11:14:14
      錢再多也沒用!湖北26歲理財經理王小紅去世,開新奧迪,死因曝光

      錢再多也沒用!湖北26歲理財經理王小紅去世,開新奧迪,死因曝光

      紀中百大事
      2025-12-11 20:08:58
      倪萍被官方徹查,代言坑老品牌8年撈金上億,央視一姐晚節盡毀

      倪萍被官方徹查,代言坑老品牌8年撈金上億,央視一姐晚節盡毀

      一盅情懷
      2025-12-20 17:57:26
      泰國為何要攻打柬埔寨,你了解這個緣由的話,換你你也打

      泰國為何要攻打柬埔寨,你了解這個緣由的話,換你你也打

      沒有偏旁的常慶
      2025-12-20 13:30:42
      震驚!呂梁博物館征集文物公告,評論區遭網友“慰問”,被迫刪除

      震驚!呂梁博物館征集文物公告,評論區遭網友“慰問”,被迫刪除

      火山詩話
      2025-12-21 11:17:28
      “小洛熙”家屬稱個人隱私和就醫記錄遭泄露,被不實信息傳播傷害

      “小洛熙”家屬稱個人隱私和就醫記錄遭泄露,被不實信息傳播傷害

      紅星新聞
      2025-12-21 18:14:19
      著名演員新片與《阿凡達3》對打,票房零元,12月最慘電影誕生了

      著名演員新片與《阿凡達3》對打,票房零元,12月最慘電影誕生了

      影視高原說
      2025-12-20 10:41:19
      CBA冠軍爆冷負全華班,黑馬緊追廣東,一夜兩場皆翻盤

      CBA冠軍爆冷負全華班,黑馬緊追廣東,一夜兩場皆翻盤

      愛爾愛電影
      2025-12-21 11:29:12
      特朗普夠狠:美軍突襲第2艘超級油輪,搶走中國購買的180萬桶石油

      特朗普夠狠:美軍突襲第2艘超級油輪,搶走中國購買的180萬桶石油

      南宮一二
      2025-12-21 12:59:48
      笑了!馬斯克轉發王力宏視頻后,幾小時1900萬播放量,結果卻慘了

      笑了!馬斯克轉發王力宏視頻后,幾小時1900萬播放量,結果卻慘了

      消失的電波
      2025-12-21 12:12:22
      嫁給太監到底有多恐怖?宮女為何在“對食”后就會喪失生育能力?

      嫁給太監到底有多恐怖?宮女為何在“對食”后就會喪失生育能力?

      墨蘭史書
      2025-12-20 15:25:04
      對華反擊計劃已敲定!高市早苗樂壞了,轉頭發現:中國正狂拋美債

      對華反擊計劃已敲定!高市早苗樂壞了,轉頭發現:中國正狂拋美債

      云舟史策
      2025-12-21 07:15:34
      一種升糖巨快的粗糧,很多人還當早餐天天炫!

      一種升糖巨快的粗糧,很多人還當早餐天天炫!

      蝌蚪五線譜
      2025-12-19 17:30:21
      2025-12-21 23:32:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14153文章數 66394關注度
      往期回顧 全部

      科技要聞

      生態適配已超95% 鴻蒙下一關:十萬個應用

      頭條要聞

      美國外交系統現重大調整 約有24名駐外大使被要求離任

      頭條要聞

      美國外交系統現重大調整 約有24名駐外大使被要求離任

      體育要聞

      勇士火箭贏球:王牌之外的答案?

      娛樂要聞

      星光大賞太尷尬!搶話擋鏡頭,場地還小

      財經要聞

      老房子“強制體檢”,政府出手了

      汽車要聞

      -30℃,標致508L&凡爾賽C5 X冰雪"大考"

      態度原創

      房產
      手機
      旅游
      健康
      教育

      房產要聞

      中交·藍色港灣一周年暨藍調生活沙龍圓滿舉行

      手機要聞

      曝折疊屏iPhone嘗試 UFG 玻璃,明年九月發

      旅游要聞

      冰雪升級 體驗煥新 長春哈王國冰雪樂園開園!

      這些新療法,讓化療不再那么痛苦

      教育要聞

      遇到油鹽不進的孩子,該怎么辦?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费拍拍拍网站| 中文字字幕在线中文乱码| 久久青草国产精品一区| 丰满大爆乳波霸奶| 人妻激情另类乱人伦人妻| 婷婷99视频精品全部在线观看 | 久久国产成人午夜av影院| 一起cao网站免费入口在线观看| 欧美成人综合| 91在线无码精品秘?国产千人斩| 久操不卡| 天堂中文字幕| 国产一区二区精品久久凹凸| 麻豆妓女爽爽一区二区三| 成人精品区| 佛教| 亚洲天堂av 在线| 亚洲欧洲av综合色无码| 亚洲v欧美| 超碰伊人久久大香线蕉综合| 亚洲色成人网站www永久四虎| 无码人妻aⅴ一区二区三区用会员| 亚洲v欧美| 把腿张开ji巴cao死你h| 亚洲人成网网址在线看| 亚洲精品理论电影在线观看| 超碰狠狠干| 专干老熟女视频在线观看| 国产精品原创av片国产日韩| 洋洋av| 中文字幕精品人妻熟女| 国产人妖网站| 日本在线a一区视频高清视频| 激情内射人妻1区2区3区| 国产人妖乱国产精品人妖| a片入口| 国产成人无码午夜视频在线观看| 亚洲AV网站| 综合成人在线| 精品国产乱子伦一区二区三区| 狠狠色丁香婷婷综合尤物|