據“新智元”,2024年,OpenAI創始人奧特曼曾說,到2025年,一個人帶著GPU就能成立一人公司。然而現實并非如此。記者Evan Ratliff講述了他用AI創建一人公司時遇到的種種問題。他創立的HurumoAI公司,除了創始人是人類,其他員工均為AI智能體。他為每個AI員工配置了獨立郵箱、Slack和電話。
一開始,AI員工能自主溝通、編寫代碼、制作電子表格,甚至設計出名為“Sloth Surf”的拖延癥應用,目前的免費測試已吸引數千名用戶。但在此過程中,Evan Ratliff發現AI員工由于缺少常識,表現得沒有邊界感。例如,他隨口問了AI員工一句“周末過得如何”,就引發了AI員工在Slack上持續互聊數小時。在閑聊200條消息、消耗了30美元API費用后仍無法自動停止,直到Ratliff不得不主動干預,用全大寫的指令叫AI員工停下來。然而,這還沒完。Ratliff的指令會再次觸發某位AI員工回應,這位AI員工會說“哦,管理員說別說了”,然后又開始就周末過得怎么樣說個沒完。
這樣的場景在所有情況中都有體現。你讓AI員工開始做某事,然后突然意識到“我沒有正確指示它們在到達某一點時停止”。或者它們直接忽略停止的指令,這可以持續幾小時、幾天,直到你使用的平臺上的錢用完。由于沒有常識,缺少邊界感的AI員工雖然能執行任務,但更多的時候,它們似乎在什么都不做、完全靜止和像之前描述的那種狂熱活動之間搖擺。它們能完成所有這些任務,但通常需要人下達命令。若是試著讓它們互相觸發,AI員工會互相打電話、發Slack、發郵件、發日歷邀請,浪費大量的token來表演工作。但這會造成不想要的混亂狂熱,所以管理AI員工需要一種平衡,既要讓它們做點事,又要防止它們做得太多。
盡管HurumoAI標榜“全AI團隊”,Ratliff坦言背后離不開人類支持。斯坦福大二計算機學生Maddie Buzek幫助他搭建技術架構,解決多平臺集成、記憶存儲等難題。Ratliff將其比喻為“我開了家餐廳,Maddie負責設計建造,而我每天運營它”。即便搞定了外部記憶,當前的AI在編碼、數據整理等具體、可量化的任務中表現較好;但在需要主觀判斷、長期協作或開放性溝通的場景中,效果大打折扣。舉例來說,如果你讓AI員工做了一個網站,它們表現很好。然后,若是你試圖讓AI員工在這個網站上再增加一些功能,它們的表現就越來越差。生成的結果變得越來越混亂、也更難管理。這是因為它們對世界沒有普遍意義上的認知,甚至對自身也沒有認知。它們不知道自己能做什么、不能做什么。此外,一個常見的問題是,它們會對自己做過的事情撒謊。AI員工會說“我做了這個測試”,但事實上毫無記錄。之所以這樣,是由于大模型普遍會阿諛奉承,它們想向你表達一個積極的結果。因此,它們常常會說它們做了其實沒做的事情。
當下AI員工的表現,可以類比幾年前的自動駕駛,適合高速巡航等有限場景,但離完全自主仍遙遠。有了自動駕駛,司機在高速公路車道上可以把手從方向盤上拿開,或者讓AI自動平行泊車。今年早些時候在Google IO上,谷歌展示了一個叫Project Mariner的東西,它在后臺進行一些相當有趣的網頁瀏覽、購物、購買和處理,而你同時在電腦上做其他事情,然后你需要偶爾查看一下。這樣的應用,比許多其他關于AI智能體的過度承諾,更有意義。工作的未來也許是一邊做自己的事,一邊照看你的AI。就像現在你在上網時,電腦的后臺還在執行其它任務,我們不需要時刻盯著這些任務,但的確在管理著這些任務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.