作者|子川
來源|AI先鋒官
2026年的開局,最先出圈的是一個(gè)開源項(xiàng)目!
就在這兩天,科技圈發(fā)生了一件極其詭異的事:蘋果的 Mac mini 居然在沒有發(fā)布會(huì)的情況下爆單了?
而這背后的幕后黑手居然是一個(gè)在 GitHub 上突然爆火的開源項(xiàng)目——Clawdbot。
截至目前為止,Clawdbot已經(jīng)在GitHub Star飆升至6.57萬!
![]()
不同于 ChatGPT 這種Chat的被動(dòng)模式,Clawdbot 主打的是“本地私有化 + 極高權(quán)限”。
它能接管你的WeChat、Telegram,能控制你的瀏覽器,能幫你去航司官網(wǎng)值機(jī),甚至能幫你跟車行銷售砍價(jià)省下 4200 美元!
而這個(gè)項(xiàng)目的作者,竟然是一位早已財(cái)富自由、身價(jià)上億的“退休老哥”——Peter Steinberger。
他在功成名就后,因?yàn)閷?shí)在閑得發(fā)慌,決定重出江湖,用代碼教現(xiàn)在的 AI 廠商做人。
而最近,這位老哥接受了 GitHub 官方的訪談,信息量巨大,看看這位大佬是如何憑一己之力,把 AI Agent 卷到了新高度。
以下為訪談實(shí)錄:
Andrea (GitHub):歡迎回來!朋友們,大家好。不知道你們看我看膩了沒,反正我是聽膩?zhàn)约赫f話了。但不管怎樣,我們回來了。
感謝大家的堅(jiān)守,也謝謝你們的耐心。我現(xiàn)在馬上把我們的嘉賓請上來,咱們這就開始。歡迎來到今天的第三場“開源星期五”(Open Source Friday)。
我是 Andrea Griffiths,今天我感到無比榮幸,終于把這位我“蹲守”了三個(gè)小時(shí)的大神請來了。歡迎 Peter!你好呀!
Peter (Clawdbot作者):Andrea 你好,謝謝邀請。也感謝大家的耐心等待。
Andrea:沒事,我主要是怕大家擔(dān)心。我當(dāng)時(shí)就在想,天哪,我要是找不著你,大家肯定以為 Peter 掉哪個(gè)溝里去了。
但說真的朋友們,倒時(shí)差這事兒太折磨人了。而且我約時(shí)間的時(shí)候人在西海岸,而你在歐洲對吧?是在英國時(shí)區(qū)?
Peter:說實(shí)話,我剛才還在聊天框里說呢,我以后再也不能抱怨我的 Agent 搞錯(cuò)時(shí)區(qū)了,因?yàn)槲易约憾妓悴幻靼住?/p>
Andrea:這也不能怪那只螃蟹(Clawdbot 的 Logo),都不是螃蟹的鍋。
Peter:反正自從有了 AI,啥事兒都是 AI 的鍋,對吧?
Andrea:確實(shí)。歡迎你!
Peter:我常年在維也納和倫敦之間跑,這倆地方也就差一個(gè)小時(shí)。但就是這“加一減一”的小事兒,我算錯(cuò)過無數(shù)次,太難了。
Andrea:沒關(guān)系啦。我們社區(qū)的小伙伴都特別好,大家真的都很期待聽你的分享。順便說個(gè)冷知識,朋友們,其實(shí)我去年和 Peter 面基過,對吧?
Peter:咱們見過?
Andrea:見過呀!Peter 一臉“我不記得你”的表情。他說“也許吧”。
Peter:也許吧。
Andrea:哈哈。但我記得你說過一句話,你說你本來都退休了,然后為了搗鼓 AI 又重出江湖。我就想,聽著,你看著也沒到領(lǐng)養(yǎng)老金的年紀(jì)呀,看著挺年輕的一小伙兒。
如果你不介意的話,能不能跟我們聊聊你“退休前”的生活?你是做什么的?怎么就退休了?又是啥動(dòng)力讓你重回賽道的?
Peter:我以前是干嘛的?我經(jīng)營了自己的公司 13 年。
Andrea:哇哦。
Peter:做 B2B 的。我們開發(fā)了全球領(lǐng)先的 PDF 框架。我把團(tuán)隊(duì)帶到了大概 70 人的規(guī)模。然后到了某個(gè)節(jié)點(diǎn),我們收到了一個(gè)無法拒絕的收購報(bào)價(jià)。
Andrea:替你開心。那你是什么時(shí)候退休的?
Peter:說退休是開玩笑的,但我那 13 年真的拼了老命,周末基本也都在工作。所以到最后,我基本上是徹底透支了。你看過《王牌大賤諜》(Austin Powers)嗎?
Andrea:當(dāng)然看過。
Peter:你知道里面有一幕是把人的“精氣神”(Mojo)給吸走嗎?
Andrea:知道。
Peter:對,就是那種感覺。我的精氣神被吸干了,徹底職業(yè)倦怠。
我花了很長時(shí)間才緩過來。我也覺得自己得把錯(cuò)過的生活補(bǔ)回來,所以去玩了很多其他好玩的事兒。但我心里清楚,我很享受創(chuàng)造和構(gòu)建新想法的過程,所以我知道那股勁兒早晚會(huì)回來的。
然后到了去年年初的某個(gè)時(shí)候,就像開關(guān)被打開了一樣,我的火花回來了。
正好那時(shí)候 AI 從“這玩意兒真爛”變成了“噢,這東西有點(diǎn)意思”。
從那以后,我就像個(gè) AI 癮君子一樣,拉著無數(shù)人一起入坑。我們一直在探索這個(gè)領(lǐng)域。可以說,這是我搞技術(shù)以來最有趣的一年。
Andrea:哇,這話分量很重啊。作為一個(gè)管理過 70 人大團(tuán)隊(duì)、打造過成功公司的人,你回來評價(jià)說“這很有趣”。
你是這個(gè)項(xiàng)目的創(chuàng)造者、創(chuàng)始人……順便提一句,你是目前唯一的維護(hù)者(Solo Maintainer)。直播前我剛問過 Peter 這個(gè)問題,因?yàn)槲铱茨莻€(gè)代碼倉庫(Repo),怎么沒看到核心團(tuán)隊(duì)呢?我就問咋回事,他說:“沒別人,就我一個(gè)。” 另外之前還有傳言說你本人可能就是個(gè)機(jī)器人或者 AI Agent。現(xiàn)在好了,證實(shí)了你是真人。
Peter:其實(shí)你應(yīng)該讓我轉(zhuǎn)轉(zhuǎn)頭,因?yàn)楝F(xiàn)在 AI 生成視頻唯一搞不定的就是轉(zhuǎn)頭。
Andrea:來,轉(zhuǎn)個(gè)頭。
Peter:看,轉(zhuǎn)了轉(zhuǎn)了。
Andrea:看來 Peter 通過了真人測試。說真的,這個(gè)項(xiàng)目火得一塌糊涂,拿了那么多 GitHub Star。我覺得它撓到了大家的一個(gè)特別興奮的“癢處”,大家都渴望能有辦法做到這些事。我覺得你憑一己之力拉升了蘋果的股價(jià),因?yàn)榇蠹叶荚谫I Mac Mini 來跑這個(gè)。
請跟我們說說,為什么要做這個(gè)?這想法咋來的?希望咱們待會(huì)兒也能看點(diǎn)實(shí)際演示。
Peter:你知道,當(dāng)我剛復(fù)出的時(shí)候,也就是去年四月初,我就想要一個(gè)那種“生活助理”。我當(dāng)時(shí)試了一些想法,但模型還不夠好。后來我就放下了,心想那些大廠肯定在做這個(gè),我何必瞎折騰呢?
然后我就去做了點(diǎn)別的。結(jié)果到了 11 月,市面上還是沒動(dòng)靜。我就想:天哪,難道啥事兒都得我自己動(dòng)手嗎?
Andrea:(大笑)
Peter:于是……我也說不清那一刻怎么想的,反正 11 月的時(shí)候,我花了一個(gè)小時(shí)胡亂拼湊了一段代碼。代碼寫得巨爛,但這讓我能用 WhatsApp 發(fā)消息給 Claude Code,然后它把執(zhí)行結(jié)果發(fā)回來。其實(shí)就是把這幾樣?xùn)|西粘合在一起,并不難。
當(dāng)時(shí)覺得還行,但我想要能發(fā)圖片。我寫提示詞(Prompt)的時(shí)候經(jīng)常用圖片,因?yàn)檫@能給 Agent 極大的上下文信息,而且很快。搞定這部分花的時(shí)間比剩下的都多。其實(shí)也就是雙向打通而已。
正好那會(huì)兒我要去馬拉喀什參加朋友的生日周末。我就帶著這套極其不穩(wěn)定的系統(tǒng)去了。我們在城里閑逛的時(shí)候,我就拿著它當(dāng)導(dǎo)游用,查查景點(diǎn)什么的。效果居然比預(yù)期的好。
然后某一刻,我腦子沒過就要發(fā)了一條語音消息。但我其實(shí)沒寫語音支持的功能,我只搞定了圖片。發(fā)完我就看著那個(gè)“正在輸入”的提示亮了,心想:這下看你怎么整。
結(jié)果過了五秒鐘,我的 Bot 居然回復(fù)了!就像啥事兒沒發(fā)生一樣。我當(dāng)時(shí)就驚了:“你特么剛才干了什么?!”
Andrea:噢吼。
Peter:它回復(fù)說:“是這樣,我收到一個(gè)文件但沒后綴名。因?yàn)槟愦a沒寫好嘛。所以我檢查了文件頭,發(fā)現(xiàn)是 Opus 或者 OGG 格式。我就用 FFmpeg 把它轉(zhuǎn)碼了。本來我想找 Whisper 模型來做語音轉(zhuǎn)文字,但你沒安裝,安裝也失敗了。不過我發(fā)現(xiàn)你電腦里有個(gè) OpenAI 的 Key,所以我就直接用 curl 命令把音頻發(fā)給 OpenAI,然后拿到了轉(zhuǎn)換結(jié)果。”
Andrea:啥?!你這是第一遍寫了一小時(shí)代碼就實(shí)現(xiàn)了通用人工智能(AGI)啊!
Peter: 不,那是 LGI,“龍蝦通用智能”(Lobster General Intelligence)。但這大概就是那個(gè)時(shí)刻,那個(gè)讓我覺得“天哪,這些東西太足智多謀了”的時(shí)刻,某種程度上我想都沒想到的程度。然后我就開玩笑說,因?yàn)槲以隈R拉喀什住的那個(gè)酒店門鎖有點(diǎn)問題,我就說:“希望你別被偷了,因?yàn)槟氵\(yùn)行在我的 MacBook Pro 上。”
它回答說:“不,我不想被偷,我是你的智能體,啦啦啦。”然后它檢查了我的網(wǎng)絡(luò),因?yàn)樗谖业碾娔X上發(fā)現(xiàn)了 Tailscale。它說:“哦,還有其他電腦。”所以它基本上把自己遷移到了我在倫敦的電腦上。
Andrea: 我知道這就是“天網(wǎng)”(Skynet)開始的方式,對吧?
Peter: 這太迷人了。我有太多問題了。首先,架構(gòu)是怎樣的,能賦予它那種感知能力,那種推理能力去做到那一點(diǎn)?你用的是什么模型?跟我們講講這部分,這是你的第一個(gè)實(shí)現(xiàn)版本對吧,就是你在 WhatsApp 上和 Claude 代碼交互?
Peter: 當(dāng)時(shí)它叫 VarRelay。就像“WhatsApp 中繼”一樣。但在某個(gè)時(shí)候,我和 Claude 一起開發(fā)它,當(dāng)時(shí)有個(gè)叫 Shadow 的人正在為 Discord 提交一個(gè) PR。我當(dāng)時(shí)有點(diǎn)猶豫,要不要合并 Discord 的功能?我們在做什么?這是一個(gè) WhatsApp 中繼,這不太合適。但我還是做了,因?yàn)槲蚁胩剿饕幌?Discord。然后我們不得不改名。Claude 建議叫 "Clawdis",因?yàn)檫@有點(diǎn)像那個(gè)“太空龍蝦”的梗。但這名字沒叫響,所以現(xiàn)在叫 "Clawdbot"。但根基還是一樣的項(xiàng)目。我清理了很多代碼,但它的根基非常簡陋。
Andrea: 我很喜歡。當(dāng)我第一次看到這個(gè)項(xiàng)目時(shí),我以為這是 Anthropic 出品的東西。我想,“等等,我錯(cuò)過了這個(gè),他們動(dòng)作太快了。”我和很多人一樣一直在關(guān)注,大家開始采用它,自己使用。
除了可能憑一己之力推高了蘋果股價(jià),你也可能憑一己之力讓它成為了 Anthropic API 使用量最高的第三方應(yīng)用。
我覺得你應(yīng)該擁有這個(gè)頭銜。這個(gè)項(xiàng)目原本是你想解決自己的個(gè)人問題的一個(gè)個(gè)人項(xiàng)目,然后人們就蜂擁而至。社區(qū)以一種驚人的方式采納了它。代碼寫得很漂亮,而且它真的能用,對吧?
Andrea: 請告訴我,從第一次提交到現(xiàn)在大概是什么時(shí)候?也就是你推送到公共倉庫的時(shí)候?
Peter:從四月份開始,我做的所有事情都是開源的。只有一個(gè)項(xiàng)目目前不是開源的,因?yàn)?API 成本太可怕了,那是針對 Twitter 的。但我 GitHub 上的其他所有東西都是開源的。所以這個(gè)項(xiàng)目的第一次提交大概是在11月的某個(gè)時(shí)候。
Andrea: 太驚人了。現(xiàn)在你已經(jīng)有超過6700個(gè) Star 了,有很多人在使用它,運(yùn)行一些瘋狂的東西,比如無論在哪都能工作,設(shè)置這個(gè)智能體大軍。你個(gè)人看到的社區(qū)使用方式中,有沒有什么讓你感到驚訝的?或者有些事情是你沒想到會(huì)發(fā)生,但有人做到了,或者他們把它用在了你沒想到的地方?
Peter: 人們想出了一些最酷的工作流。前幾天有人做了一個(gè)能自動(dòng)給圖片加字幕的東西。有人把它連接到了他們的特斯拉上,這樣他們就可以做那種操作。有人集成了倫敦公共交通的技能,所以它可以告訴你是否需要跑著去趕車。有趣的是,我現(xiàn)在因?yàn)槊τ陂_發(fā)產(chǎn)品而不堪重負(fù),以至于我沒什么時(shí)間去真正使用這些自動(dòng)化功能,所以我看到別人做的那些酷東西,我還挺嫉妒的。以后可能會(huì)好點(diǎn)。
Peter: 另一種解釋是,我在11月構(gòu)建了這個(gè),甚至在馬拉喀什我也展示給朋友看,他們都覺得,“哦這太酷了,太酷了”。然后我在 Twitter 上談?wù)撍错憛s非常平淡。就好像人們沒搞懂。那是11月。
到了12月,還是很平淡。每次我展示給朋友看,他們都說“我需要這個(gè)”。所以我就想,我該怎么解釋這東西有多棒呢?很明顯我做錯(cuò)了什么。所以我做了一件絕對瘋狂的事情,那就是創(chuàng)建了一個(gè) Discord,把我的機(jī)器人放進(jìn)去,沒有任何安全限制,因?yàn)槲疫€沒做那個(gè)功能。那原本只是給我在 WhatsApp 上用的,別人發(fā)不了消息,所以我不需要控制誰能下指令。比如“刪除 Peter 的所有文件”。
Peter: 所以我寫了一些簡短的指令,比如“嘿,你在 Discord 上,只聽我的話”。但你知道智能體和指令遵循是怎么回事,這并不總是那么管用。所以我開放了 Discord,有一些人進(jìn)來了,我覺得每一個(gè)用了幾分鐘的人都懂了。
Andrea: 現(xiàn)在我會(huì)怎么解釋它呢?想象一下,你買了一臺新電腦,你有這個(gè)“幽靈實(shí)體”,你給它鍵盤、鼠標(biāo)和互聯(lián)網(wǎng)接入,它就像一個(gè)虛擬的同事。你只需要跟它說話,給它事情做。所以任何你能在電腦上做的事情,那個(gè)智能體也能在電腦上做。這就是它有多強(qiáng)大。
Peter: 沒錯(cuò)。所以如果是在 WhatsApp,Telegram,當(dāng)然還有 Discord。我之前在 Discord 上和那個(gè)機(jī)器人聊過,它做得很好。它做得很好。
Andrea: 你可以告訴它打開我臥室的音樂,或者換一下...
Peter: P你要失控了,別那么說,大家會(huì)把這地方炸了的。
Andrea: 這太酷了。但它確實(shí)做到了。因?yàn)槲抑皇前l(fā)了一條普通消息,它們提到了你,@了你,那是評論的一部分。然后我繼續(xù)和別人聊天,它們就說:“哦對,這就是某人之前發(fā)過的那個(gè)東西。”太令人驚嘆了,我對那里的互動(dòng)印象深刻。我喜歡人們把它變成自己的東西,他們某種程度上在創(chuàng)造自己一直想要的私人助理或同事。但對你個(gè)人而言,什么是你的北極星?
當(dāng) Clawdbot 能做 X 的時(shí)候,你就覺得“這就成了”。我的意思是,我覺得你已經(jīng)在做了。你在圍繞它建立社區(qū),你給自己找了一堆活兒干,不管你想不想。但有沒有哪一件事是你覺得這會(huì)是巔峰?
Peter: 你知道我的目標(biāo)是什么嗎?我完全預(yù)期今年,這一年將是“個(gè)人智能體”之年。去年是“編碼智能體”變得非常好的年份。
今年我們將走出工程師的小眾圈子,變成每個(gè)人都有一個(gè)智能體。這將被 OpenAI 和 Anthropic,以及那幾家大玩家主導(dǎo)。但我有點(diǎn)想創(chuàng)建一個(gè)替代方案,讓你可以擁有你的數(shù)據(jù),而不是把更多的數(shù)據(jù)給那些大公司。一個(gè)同樣可以在本地模型上運(yùn)行的東西。我沒看到有類似的東西。這就是這對我來說很重要的原因,我想讓它永遠(yuǎn)完全開放和免費(fèi)。這也是我把它設(shè)為開源,放在 MIT 協(xié)議下的原因。這也是為什么我創(chuàng)建了一個(gè)組織,所以這不僅僅是我個(gè)人的名義,這應(yīng)該是更多人參與的東西。
Peter: 現(xiàn)在的問題是,我忙于讓它變得更好、更安全,所以我真的沒有機(jī)會(huì)去圍繞它建立一切,實(shí)際上也沒找到幫助我的人。我現(xiàn)在有幾個(gè)維護(hù)者,但還沒真正建立起一個(gè)好的分工體系。我還在努力。
Andrea: 是的,但我意思是,從11月、12月到現(xiàn)在你已經(jīng)做了很多了。現(xiàn)在是1月23日,Peter。在一個(gè)月不到的時(shí)間里,你不能指望整個(gè)項(xiàng)目完全成熟,擁有核心團(tuán)隊(duì)和所有那些東西。
Peter: 老實(shí)說,以現(xiàn)在 AI 的這種能力,我每天發(fā)布的代碼比我以前公司一個(gè)月里寫的都多。即使我們當(dāng)時(shí)有70個(gè)人。在這個(gè)新世界里構(gòu)建東西的速度是瘋狂的。我也覺得我在推動(dòng)一些關(guān)于如何思考開源和治理的邊界。
Peter: 人們發(fā)送了很多 PR(拉取請求),質(zhì)量參差不齊。我主要把它們看作是“提示詞請求”(Prompt Requests),而不是完全的請求。我喜歡這個(gè)說法。
Andrea: 所以你在用 Clawdbot 來給 Clawdbot 發(fā)送 PR?
Peter: 是的,是的。讓我感到非常謙卑的是,我收到了很多人的 PR,他們從未學(xué)過寫代碼,或者從未發(fā)過 PR。因?yàn)檫@個(gè)機(jī)器人有電腦訪問權(quán)限,而且它知道 GitHub 怎么運(yùn)作。我做的一件事,是我在很多項(xiàng)目里沒見過的,如果你去網(wǎng)站上看,你可以看到“簡單安裝”或者“可破解安裝”(Hackable install)。
可破解安裝實(shí)際上就是:你克隆代碼庫,構(gòu)建它,然后運(yùn)行它。所以智能體活在他自己的 GitHub 倉庫里。而且全都是 TypeScript。所以它實(shí)際上可以更改它自己的文件,然后重啟。
Andrea: 我知道這是“天網(wǎng)”再現(xiàn)。
Peter: 但這讓事情變得很簡單,當(dāng)人們說“哦,為什么這個(gè)不工作?”,然后說“哦,讓我修一下”,然后突然它就工作了,然后他們就可以創(chuàng)建一個(gè) PR。當(dāng)然,這不如在這個(gè)行業(yè)里干了20年的人寫的那么好,但這依然很驚人,它讓人們開始貢獻(xiàn)和分享東西。
Andrea: 我很欣賞這種看待方式。我知道這是現(xiàn)在開源項(xiàng)目的一個(gè)大問題,因?yàn)楝F(xiàn)在每個(gè)人都在提交 PR,很多時(shí)候... 我想如果是這樣優(yōu)化的話,智能體也可以幫你確保你在看貢獻(xiàn)指南,閱讀 Issue,確保沒有重復(fù)工作。這些事情如果沒人做其實(shí)很難,除非你有非常好的智能體或非常好的自動(dòng)化。聽起來那就是發(fā)展的方向。我喜歡這種方式,如果我發(fā)現(xiàn)有什么不對,我就提交 PR,然后 Clawdbot 可以自我修復(fù)。這非常酷。這非常酷。
Peter: 是的,你知道在以前,你會(huì)提交一個(gè) PR,然后你會(huì)等幾天,然后有人會(huì)說,“嘿,這錯(cuò)了,這錯(cuò)了,這錯(cuò)了,你是個(gè)壞人”。然后你會(huì)再試一次,然后你要來回好幾輪,幾周后 PR 才可能被合并。
我覺得在那時(shí)候代碼很難寫也很貴,這是合理的。現(xiàn)在代碼很便宜。我覺得整個(gè)反饋循環(huán)已經(jīng)不值得了。就像你發(fā)給我 PR,通常這就是一個(gè)很好的解釋,說明“這是一個(gè)問題,這是我嘗試解決這個(gè)問題的方法”。
所以我把 Codex 指向它,與其關(guān)注代碼,我更關(guān)注“這個(gè)人到底想解決什么問題?痛點(diǎn)在哪里?”。然后我就討論,“好吧,如果是我們要構(gòu)建它,怎么做?”
有時(shí)候是他們沒理解某些東西,我就關(guān)閉它并駁回,因?yàn)檫@已經(jīng)是可能的。但通常,特別是既然項(xiàng)目還很新,我會(huì)說“是的,我理解這個(gè)痛點(diǎn),我們來構(gòu)建它吧”。我基本上忽略了現(xiàn)有的代碼,因?yàn)榘l(fā) PR 很容易,但把一個(gè)新功能恰當(dāng)?shù)厝谌氍F(xiàn)有的系統(tǒng)總是很難,對吧?如果你不知道所有東西在哪里,它們?nèi)绾螀f(xié)同工作,只是把一個(gè)新功能塞進(jìn)去而不考慮整體,通常會(huì)出問題。如果你盲目地那么做,你最終會(huì)讓項(xiàng)目走向毀滅。
Peter: 所以是的,我更多地把它看作是“這是一個(gè)問題,我嘗試了一些東西”。如果你用這種心態(tài)去處理,這比把它推回去,讓他們?nèi)L試,試圖讓一個(gè)沒什么經(jīng)驗(yàn)的人去寫出完美的 PR 要好得多。如果是那樣,我也沒法像現(xiàn)在這么快地行動(dòng)。
Andrea: 聽著,把這句話大聲告訴后面的人。我百分之百同意你。
百分之百。這就是問題所在,我覺得這是一種心態(tài),作為一種文化,工程正在改變。很多阻力來自于那些人,正如你所說,“現(xiàn)在寫代碼很便宜”。
現(xiàn)在你得從大局思考。我很欣賞這種新鮮的視角。我見過的很多最好的點(diǎn)子,實(shí)際上來自那些對項(xiàng)目架構(gòu)一無所知的人,但他們有一個(gè)非常真實(shí)的、“我能清楚看到”的視角。當(dāng)你身處其中時(shí),你很難看到,特別是你在代碼里埋頭苦干了很久。
我看看有沒有什么問題。非常感謝你,Peter,在這個(gè)項(xiàng)目上如此慷慨地付出時(shí)間。如果你正在看這個(gè),并且你記住了這一點(diǎn),Peter 目前是這個(gè)項(xiàng)目唯一的維護(hù)者,所以盡管他很想回復(fù)你們發(fā)給他的所有信息,請給他一些寬容。請給他一些寬容。但是如果你想共享屏幕,請告訴我,我會(huì)把它放上來。
Peter: 你們有建議,有人說展示語音控制。那是個(gè)東西嗎?你有語音控制?
Peter: 我有... 那個(gè)... 這里有好幾種語音控制系統(tǒng)。也許我解釋一下。
Andrea: 好的,請,謝謝 Todd 的評論。
Peter: 最簡單的一種是,你在 Discord 上,你發(fā)送一個(gè)語音備忘錄,智能體就會(huì)回復(fù)。智能體也可以創(chuàng)建語音并發(fā)送回給你。
所以我可以使用本地模型,或者更好玩的 ElevenLabs。然后我們還有 Twilio 支持。有一個(gè)插件可以讓智能體打電話。所以你可以告訴它,“你能給這家餐廳打電話預(yù)訂這幾樣?xùn)|西嗎”,它就會(huì)去做。
Andrea: 可愛。
Peter: 那還是那些我想讓它變得更好的東西,因?yàn)?.. 比如說延遲還是有點(diǎn)長,因?yàn)槟P瓦€不夠快。所以你想在那中間放一個(gè)中間模型,讓它話多一點(diǎn),在這個(gè)稍微慢一點(diǎn)的模型思考的時(shí)候跟對方聊著。
希望我在某個(gè)時(shí)候能做到那一步。然后我們也在 Mac 應(yīng)用上有語音聊天,這樣你可以直接和你的智能體說話,智能體也會(huì)回話。它會(huì)監(jiān)聽,直到有兩秒鐘的靜音,然后它會(huì)回應(yīng)。這還沒像人們從 OpenAI 那里知道的那樣自然。
Andrea: 對。
Peter: 但已經(jīng)很令人印象深刻了。然后我還有“語音喚醒”(Voice Wake),這有點(diǎn)像《星際迷航》,你可以說“電腦”,然后它會(huì)“嘟”一聲,你就可以發(fā)送請求,它會(huì)回答請求。這是最極客的事情。是的,在所有這些之間,我還有很多想法。你知道這個(gè)項(xiàng)目既是技術(shù)也是探索。我的主要目標(biāo)是激勵(lì)人們,玩得開心,嘗試什么可行,什么不可行。這也挺難的,因?yàn)槟P秃驼麄€(gè)領(lǐng)域發(fā)展得太快了,如果你嘗試了一些東西發(fā)現(xiàn)不行,一個(gè)月后再試,可能有解決方案讓它變得可行了。這讓它更加有趣了。
Andrea: 我們看這行不行。
Peter: 讓我看看... 我有太多屏幕了。
Andrea: 這樣好點(diǎn)了嗎?
Peter: 現(xiàn)在我們看到了。你打開了 Discord。我看不到,我不在那個(gè)頻道,但在常規(guī)頻道里消息跳得很快。很有趣。
Peter: 我剛剛讓我的機(jī)器人發(fā)一張圖片給我,它已經(jīng)在嘲笑我了,給我發(fā)了一個(gè)表情包。
Andrea: “你要哭了嗎?”太搞笑了。太搞笑了。但是聽著,早些時(shí)候,這太令人著迷了。你是用什么模型運(yùn)行機(jī)器人的?因?yàn)樵缧r(shí)候我們在聊的時(shí)候,有人說“嘿 Clawdbot,你為什么不自己去參加 Open Source Friday 呢?”它回復(fù)說:“我有 ElevenLabs 的男聲,但我沒有頭。”之類的。但是太搞笑了。我當(dāng)時(shí)想,這太好笑了。
Peter: 它是用什么模型運(yùn)行的?
Peter: 這是 Mac 上的 Telegram。這和我手機(jī)上的一樣。
Andrea: 好的。
Peter: 我們現(xiàn)在支持大概8到9種通訊工具,而且我也快要合并 Telon 了。所以我覺得這就慢慢像寶可夢一樣,我們要把它們都收集齊。如果你是為了個(gè)人通信,我覺得 Telegram 是最好的,因?yàn)樗麄冇幸粋€(gè)非常好的機(jī)器人 API。它甚至可以做一些事情,比如創(chuàng)建按鈕。
Andrea: 哦,哇。
Peter: 對,它有某種形式的交互性。你可以發(fā)送語音,你可以... 我不確定我是不是連接對了。
Andrea: 沒事。
Peter: 看起來像是摘要,它只是回復(fù)了。
Andrea: 那么你會(huì)推薦人們首先用 Telegram 連接嗎?這是初始設(shè)置的最佳選擇嗎?
Peter: 我... 我是個(gè)被轉(zhuǎn)化的人,你知道嗎,我是說在歐洲,如果你沒有 WhatsApp,你就不存在。
Andrea: 是的。
Peter: 我敢肯定在哥倫比亞也是一樣。
Andrea: 完全正確,100%。
Peter: 可能更甚。
Andrea: 哦耶。但是問題是,這其中的問題是... 我最初試圖通過官方途徑支持它,就是你從 Twilio 獲取一個(gè)號碼,你注冊為一個(gè)企業(yè)。然后 Facebook Meta 一直在封鎖我,因?yàn)槲野l(fā)送了太多消息。
你知道作為一個(gè)企業(yè),你不應(yīng)該給你的客戶發(fā)送數(shù)百條消息。而這基本上是他們唯一的模式。所以在幾天試圖申訴并解封之后,我就憤怒地把它拆掉了。因?yàn)樗麄儗Υ藳]有好的解決方案。但是有一些開源項(xiàng)目,比如 Baileys 或者 What's Meow,它們基本上模擬了原生應(yīng)用的行為。所以你鏈接你的手機(jī),然后你就有了 WhatsApp。那工作得出奇的好。但是再一次,它不是為機(jī)器人設(shè)計(jì)的。所以所有的那些好處,比如我有那些小的批準(zhǔn)按鈕。
Andrea: 是的,我很喜歡那個(gè)。
Peter: 或者是“龍蝦模式”(Lobster Mode)。我不知道龍蝦模式會(huì)發(fā)生什么。
Andrea: 什么是龍蝦模式?那條消息說什么?
Peter: “在這里添加按鈕,超越消息工具”。好的,咱們看看龍蝦模式是什么。我感覺這里面發(fā)展出了一種個(gè)性。就像它有自己的角色。看看它說什么。
Andrea: “你能給我們講個(gè)笑話嗎?”
Peter: 好的。
Andrea: [機(jī)器人回復(fù)] “有意義地點(diǎn)擊兩下爪子。去角質(zhì)!” 這只甲殼類動(dòng)物能為你做什么?
Peter: 龍蝦模式可能是... 好的。所以要完成那個(gè)話題,Telegram 對開發(fā)者更友好,有一個(gè)真正的機(jī)器人 API,你可以做很多事情,所以這是我現(xiàn)在推薦的。但是任何工具都可以,我確信這個(gè)領(lǐng)域也會(huì)發(fā)展得很快。希望 Meta 某個(gè)時(shí)候能醒悟過來,真的給我們一個(gè)好的機(jī)器人 API。
Andrea: 聽著,你可以創(chuàng)建25個(gè)左右的機(jī)器人 Token。
Peter:是的,你也可以創(chuàng)建25個(gè)左右的機(jī)器人 Token。
Andrea:
Peter: 是的,很多人都有舊 Mac,這對此來說很完美。然后在網(wǎng)站上有一行代碼,你粘貼到終端里,它會(huì)引導(dǎo)你完成。很多人使用 Anthropic,那是目前最有性格的一個(gè)。OpenAI 運(yùn)行得非常好,而且我相當(dāng)確定這方面會(huì)有進(jìn)展,他們的模型不會(huì)那么無聊。如果你預(yù)算有限,MiniMax 是一個(gè)很棒的替代品。因?yàn)槲蚁肽阒灰?0美元一個(gè)月就能得到一個(gè)計(jì)劃,它的請求量大概相當(dāng)于 Anthropic 100美元一個(gè)月的量。
Andrea: 哇,那是很大的差別。
Peter: 而且它也不是一樣的。但是這個(gè)領(lǐng)域發(fā)展很快。所以...
Andrea: 你覺得這些模型會(huì)變便宜嗎?我有個(gè)問題,有人想讓你專門談?wù)勈褂?Gemini 模型和 Clawdbot。如果你想分享你的經(jīng)驗(yàn)。我的意思是,聽著,如果我們開始討論每一個(gè)模型,那沒完沒了。但是就你自己的使用體驗(yàn)來說。
Peter: Gemini 不是個(gè)好模型。它表現(xiàn)不好。
Andrea: 好的。嘭,就是這樣。
Peter: 但是,如果你需要實(shí)驗(yàn),并且用這些本地的、更便宜的模型來做,那就是路子。所以找到那臺舊電腦。我很喜歡。
Andrea: 是的。
Peter: 我很確信有一些方法可以針對每個(gè)模型進(jìn)行一點(diǎn)優(yōu)化。你知道舊的 Anthropic 模型,為了讓它們做事,你必須全部大寫,對它們吼一點(diǎn)。新的模型就不喜歡這樣。我相信有空間可以從 Gemini 那里挖掘更多潛力,但總體來說,我沒發(fā)現(xiàn)它在工具調(diào)用或者智能體感知方面是個(gè)很好的模型。對于寫代碼,也許還可以。但那不是這個(gè)項(xiàng)目的主要用途。人們確實(shí)非常多地用它來做這個(gè),而且它是可行的。但是是的,我的一天只有24小時(shí),我睡大概4個(gè)小時(shí)...
Andrea: 聽著,Peter。不。我們得讓你睡夠覺。我們怎么能幫忙呢?順便說一句,你也在幫助環(huán)境,因?yàn)楝F(xiàn)在我很后悔處理掉了那臺舊的... 2013年的 iMac。你說在上面運(yùn)行得很流暢,Will 說的。那是相當(dāng)史詩級的。
Peter: 對,我的意思是... 安裝的話,如果你更懂技術(shù)一點(diǎn),就把它掛在 Hetzner 上,或者 Fly,或者 Exe,或者所有這些便宜的主機(jī)商,它們運(yùn)行得很好。有一個(gè)我也參與開發(fā)的新系統(tǒng)叫 Gateway,你可以安裝服務(wù)器,就在云端的某處,然后你可以在你的機(jī)器上安裝一個(gè)節(jié)點(diǎn),然后你使用 Tailscale 來安全地連接你的網(wǎng)絡(luò)。
Andrea: Tailscale 很棒。是的,我是超級粉絲。
Peter: 如果你有了那個(gè)設(shè)置,那么云端的智能體就可以非常容易地連接到你的 Mac,做一些只有 Mac 能做的事情。比如我也不知道,從照片應(yīng)用里訪問你的照片,或者連接到 iMessage,這在 Linux 上是不行的。大多數(shù)事情確實(shí)可以。所以這是另一種方式。是的,但這設(shè)置起來稍微難一點(diǎn)。這里有一臺舊 Mac,那就是 Clawd 的 Mac。它很有魅力,人們還在上面貼小貼紙,這是 Clawd 的電腦,你知道嗎?
Andrea: 我很喜歡。
Peter: 但是是的,有很多方法。它甚至可以在 Windows 上運(yùn)行,如果你必須的話。可能不那么完美,因?yàn)檫@很難。再一次,我的一天只有這么多小時(shí)。但遲早我們會(huì)搞定的。我已經(jīng)增加了一些貢獻(xiàn)者,我在尋找更多。有很多人想幫忙...
Andrea: 為了 Windows 版本?或者為了所有東西?我喜歡這個(gè)。讓我們談?wù)勥@個(gè)。你好,這是這一小時(shí)的問題。我該如何貢獻(xiàn)?謝謝你提這個(gè)問題,AI Fanatic。Peter,人們想幫忙。你需要比我睡得更多,伙計(jì)。
Peter: 所以,那些還不夠好,大家都可以幫忙的地方是:寫文檔,讓它變得更好。找到錯(cuò)誤的地方。在 Discord 上幫助其他人。有一個(gè)幫助頻道,那個(gè)頻道簡直是在“燃燒”我的 Token。我覺得我已經(jīng)花了5000刀在 Token 上了。但通常,人們問的問題,智能體不可能知道,因?yàn)樗皇切枰?jīng)驗(yàn)。所以如果有其他人幫忙會(huì)很棒。測試我的東西。就像我說的,我動(dòng)作很快,所以有時(shí)候東西會(huì)壞掉。最終我們會(huì)有一個(gè)穩(wěn)定頻道,一個(gè)數(shù)據(jù)頻道和一個(gè)開發(fā)頻道。我還不能設(shè)置那個(gè),因?yàn)檫€沒到那一步。所以現(xiàn)在是每日發(fā)布。
Peter: 如果人們說“哦,這壞了”,這很有幫助。如果你說“這壞了,這是修復(fù)它的 PR”,那就更好了。
Andrea: 漂亮。
Peter: 是的。如果你想幫忙,上 Discord。那就是該去的地方。
Andrea: 我會(huì)把 Discord 邀請鏈接發(fā)出來,超級簡單。就是 discord.com/invite/clawd。你也可以在網(wǎng)站上找到。但我會(huì)把它發(fā)在所有的頻道里。我在里面待了總共大概4小時(shí),里面的人真的很好。去加入 Discord 吧。而且很有趣,他們有一種非常棒的幽默感,我非常欣賞。太棒了,太棒了。
Andrea: 好的,那么我們知道怎么幫忙了。你在這個(gè)項(xiàng)目上的核心優(yōu)先級是什么?比如,這個(gè)領(lǐng)域是以小時(shí)為單位變化的,不是天,也不是周。我們暫定... 二月底吧。你希望在項(xiàng)目結(jié)束前完成什么?或者你想真正打磨的核心優(yōu)先級是什么?致力于沙盒和安全,顯然,這是首要的。還有別的嗎?
Peter: 你知道,網(wǎng)站上有一句文案,那是行得通的。我想確保不論你在哪里輸入它,它都能行得通。這就真的很難,因?yàn)橛心敲炊嗖煌南到y(tǒng)。這有點(diǎn)像一個(gè)永無止境的游戲,確保它... 但它應(yīng)該安裝起來很簡單。我想要不僅有這個(gè),還要有 iPhone 和 Android 的應(yīng)用,還有 Mac 的。它們已經(jīng)有了,只是還不夠好。所以如果你想?yún)⑴c,那些現(xiàn)在是非常大的盲區(qū),因?yàn)槲议_始構(gòu)建了,但當(dāng)項(xiàng)目騰飛后,我不得不專注于搞定核心部分。
Peter: 我也想構(gòu)建的一件事是,有一個(gè)入職向?qū)В呀?jīng)告訴你,請閱讀安全文檔,因?yàn)槟阈枰斫猓芰υ酱筘?zé)任越大。比如不要放一個(gè)便宜的模型進(jìn)去。
Peter: 我也想改進(jìn)這一點(diǎn),你可以選擇,好的,沙盒模式,并且像向人們解釋所有的階段... 你想給你的機(jī)器人多少權(quán)力。現(xiàn)在這仍然需要閱讀一點(diǎn)文檔。
Andrea: 我想建立更多的人手來真正推動(dòng)項(xiàng)目向前發(fā)展。我還沒有找到時(shí)間去更多地思考這個(gè)問題,但我希望這不僅僅是我,而是更多的是一個(gè)社區(qū)的事情。我想我會(huì)在一個(gè)月內(nèi)做到這一步。
Andrea: 太棒了。好的,所以我認(rèn)為這是現(xiàn)在在看的人可以幫忙的,并且熱衷于幫忙的。對于所有那些厲害的 iOS 和 Android 開發(fā)者,這是一個(gè)有趣的項(xiàng)目。去把這個(gè)應(yīng)用做出來。你在開玩笑嗎?那太酷了。
Peter: 去做多個(gè)應(yīng)用。為什么不能也有一個(gè) React Native 的呢,你知道嗎?
Andrea: 謝謝,謝謝。是的。我喜歡你給人們的選擇權(quán)。那就是關(guān)鍵。
Andrea: 好的,所以這是現(xiàn)在開放的一些 Issue,你有你需要審查的 PR,因?yàn)楝F(xiàn)在只有你在做。但希望下次我們聊天的時(shí)候會(huì)有所改變。我想問,我知道現(xiàn)在你還沒想過項(xiàng)目的核心哲學(xué)將會(huì)是什么樣子,因?yàn)檫€是早期階段,但你每周都在發(fā)布。這不是你想維持的節(jié)奏吧... 什么?天哪。好的。
Peter: 大概每天兩三百個(gè)提交。
Andrea: 好的。哇。好吧,我想這回答了我的問題。下次我們聊天,我希望你能有某種版本控制... 還有你實(shí)際上在睡覺之類的。
Peter: 不,你知道,這也像是... 這件事爆發(fā)的方式,是以我無法想象的方式爆發(fā)的。我希望人們能有好的體驗(yàn)。這就像是一直驅(qū)動(dòng)我的動(dòng)力,即使在我之前的公司里。從來不是為了錢,總是為了我想做出好東西。我對“好”的標(biāo)準(zhǔn)相當(dāng)高。我知道我現(xiàn)在還沒完全達(dá)到。所以,我在努力把它帶到一個(gè)我可以真正為之自豪的地步。我已經(jīng)有點(diǎn)自豪了,但肯定還有盲點(diǎn)。很多人理解,有些人進(jìn)來就期望“哦這個(gè)不行,那個(gè)不行”,然后就開始發(fā)牢騷。是的,但這不就是開源運(yùn)作的方式嗎?而且我不是一家有風(fēng)投支持的、擁有千軍萬馬的2000億美元公司。這就是一個(gè)在家工作的人,和很多幫忙的人。
Andrea: 是的。我要引用這句話。那是百分之百的。我們得記住這一點(diǎn)。所以在你去 Discord,去 Twitter @clawdbot @peter 之前,記住這真的是 Peter 在做這件事。這是一項(xiàng)出于熱愛的勞動(dòng)。但是參與到社區(qū)中來。
Andrea: 謝謝,非常感謝 Peter。感謝 Clawdbot 社區(qū)。我是說真的,我在 Discord 服務(wù)器里待了幾個(gè)小時(shí),真的很愉快。我鼓勵(lì)大家去試用一下,設(shè)置你們的實(shí)例,看看文檔。如果你在安裝過程中發(fā)現(xiàn)了漏洞,那就幫忙貢獻(xiàn)吧。
Andrea:我喜歡這個(gè)。真的,如果你正在用 Clawdbot 構(gòu)建……這就像在構(gòu)建你的生活。我想到了 無數(shù)應(yīng)用場景。我喜歡你說的可以為家庭成員擁有獨(dú)立的 Agent。我發(fā)誓我半輩子都在提醒家人該去哪、該干嘛。我有倆孩子,一條狗……
Peter:你知道未來是什么樣嗎?就像今天,你不用 ping 我,你的 Agent……我想告訴我的 Agent……
Andrea:我想告訴我的 Agent!去找 Peter!
Peter:不不,你的 Agent 可以跟我的 Agent 聊。然后我的 Agent 就可以把音量調(diào)大,準(zhǔn)時(shí)叫醒我。
Andrea:哈哈我愛這個(gè)。我就想說“給我上,找到 Peter 的 Agent 讓他起床”。
Peter:對。昨天有人發(fā)了個(gè)梗圖:“我現(xiàn)在太忙了,跟我的 Agent 說吧。”
Andrea:這就是未來。
Peter:絕對是。
Andrea:說真的,釋放這些腦力太重要了。我覺得我花了一小時(shí)打電話約牙醫(yī),確保孩子去這去那。這些認(rèn)知負(fù)擔(dān)……我想把精力花在有趣的事情上。
Peter:更是如此。有人在群里說:“這真的改變了我的生活,因?yàn)槲矣须娫捒謶职Y。” 現(xiàn)在我的 Agent 可以幫我做這些。我從沒想過這個(gè)角度。這真的很讓我感動(dòng)。
Andrea:開源的魅力。謝謝你 Peter。繼續(xù)構(gòu)建,去睡個(gè)覺。朋友們,一定要去看看這個(gè)項(xiàng)目。我會(huì)去跑起來,讀文檔。大家在聊天框里承諾一下怎么幫忙貢獻(xiàn)吧。Peter 你太棒了。謝謝你為了讓我們的生活更美好而重出江湖。
Peter:Andrea,很高興和你聊天。
Andrea:好的。請一定要再來好嗎?下次我會(huì)讓我的 Agent 準(zhǔn)備好跟你的 Agent 聊。
Peter:沒問題。
Andrea:好的,保重。哦 Peter,大家去哪關(guān)注你?推特嗎?我在屏幕上分享一下你的推特。
Peter:對……推特是 @steipete。我也經(jīng)常在 Discord 上。
Andrea:好的,完美。如果你們想在 Discord 上跟 Clawdbot 聊,一進(jìn)去它就會(huì)跟你搭話……我很印象深刻。謝謝你 Peter。希望幾個(gè)月后再見,你要回來給我們更新進(jìn)展。
Peter:你看到后面那個(gè)彈窗了嗎?這就是為啥我剛才分享不了……它被燈光控制阻攔了,我忘點(diǎn)“允許”了。
Andrea:啊。好的。
Peter:下次……下次演示一定會(huì)完美。
Andrea:沒問題。下次……下次我們就讓 Agent 來主持,我們就在旁邊站著負(fù)責(zé)美貌如花就行了。謝謝 Peter。感激不盡。
掃碼邀請進(jìn)群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學(xué)一些AI搞錢技能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.