![]()
作者 | 孫芮
郵箱 | sunrui@pingwest.com
作者 | 周華香
郵箱 | zhouhuaxiang@pingwest.com
沉默一年,rabbit 把一切指向“讓 AI 去做事”。
2024 年 1 月,rabbit r1 的發布曾掀起一陣 AI 硬件熱潮,卻也很快陷入鋪天蓋地的爭議——科技博主給出負面評測,大眾也發出“有手機為何還要它”的質疑,rabbit r1 一度被貼上“雞肋”“不成熟”的標簽。
在這一波 AI 硬件創業潮中,許多同行相繼折戟,rabbit 成為少數仍在場上的玩家。
這一年里,呂騁見證了許多產品的快速迭代與分化。
去年底,呂騁專程飛回北京,只為拿到一臺豆包手機——最終還是通過朋友從閑魚上輾轉購得。拿到手當天,他得出了一個判斷:這條技術路徑尚未達到 consumer ready 的標準。就在飛機落地前,豆包手機的相關功能已經被某些第三方平臺禁用。
幾個月后,OpenClaw 上線即爆火。呂騁當即讓團隊接入,r1 成為全球首款支持小龍蝦的硬件設備——發布當周,用戶向左滑動,默認界面可以從兔子切換為龍蝦。
![]()
rabbit 的一個投資人說呂騁 always take a go big or go home approach(要么來票大的,要么完蛋)。這樣的創業者,通常都不太有妥協的氣質。
呂騁并不急于推出第二代硬件,而是用一整年時間打磨 AI agent 底層技術;他也拒絕跟風傳統 SaaS 思路,甚至設計團隊都徹底拋棄了 Figma 和 Adobe 等工具,轉向 Claude 與內部系統的協同辦公;他也堅信 GUI 終將消亡,自然語言才是人與 AI 交互的終極形態。
作為連續創業者,呂騁在做 rabbit 之初就獲得了 Khosla Ventures 、Sound Ventures 、Amazon Alexa Fund 以及 Synergist 等知名機構的融資。最近,rabbit 又獲得了來自 BAI 資本的一輪支持。
近期,硅星人在舊金山灣區與呂騁進行了一次深入對話。鏡頭前的呂騁,不避諱談論曾經的爭議,也不掩飾對未來的激進判斷;對堅持什么,為什么焦慮,他也很坦率直接。對外界對他把 r1 搞砸了的說法,他不接受,為自己辯護。
他坦言,創業本就是與不確定性為伴。而 rabbit 的每一步,都在把 AI 的能力落到實際操作中。
呂騁說,“歷史當下可能無法判斷對錯,但我們希望回頭來看,我們是 ahead of the time。”
以下是與呂騁的對話實錄,也敬請期待《硅基立場》的同題視頻播客。
rabbit 的堅守與迭代
駱軼航:你們第一波同行里,有一部分已經倒下,你們算是碩果僅存,這件事很有標志性意義。其實我有個誤解,去年跟你聊完之后,我一度覺得你們放棄了硬件,轉去做 AI agent。這一年 AI agent 的變化也很大,Claude 也給大家帶來了很多新的 inspiration。你過去這兩年基本上在干什么?是一直圍繞著 agent 這件事,還是在想什么時候再做下一步?
呂騁:外界可能會覺得我們有兩個讓人看不懂的地方。一是 r1 發布后為什么沒有推出第二代硬件,二是去年我們的方向看起來很雜亂,一會兒推進國際化、一會兒推出新東西。但從內部來講,我們從來沒有動搖過。從第一代 LAM 到現在,我們核心就是在做 agent 這件事。
硬件方面,我們去年做了理性判斷,既然大家都在吐槽,說明整個行業還沒有準備好。后來我們發現不只是我們,OpenAI Operator、ChatGPT Search、Apple Intelligence 也都沒準備好。
所以去年一整年,我們把全部精力放在推進 agents 技術上,專注做軟件,不是從零開始做新軟件,而是為現在這個節點做準備,這件事非常值得。
![]()
駱軼航:外界很多人覺得你們把硬件搞砸了,你怎么看這個說法?
呂騁:首先我不認同硬件失敗的說法。有些人可能覺得賣 10 萬臺不算什么,但要放在 AI 硬件的語境里看,還要看 r1 整個生命周期的利潤。
一般新公司做第一代硬件,很多都是貼錢銷售,大公司的硬件項目也一樣,比如 Meta 的 Ray-Ban smart glasses 也是貼錢賣的。
從商業角度來說,我們不認為做砸了。我們當時的目標很保守,以為只能賣 3000 臺,現在實際賣了十多萬臺。雖然早期有一些負面評價,但總退貨率不到 5%。
駱軼航:退貨率這么低,核心原因是什么?
呂騁:比如美國數碼博主 MKBHD 前兩天做采訪時提到,兩年前他說 r1“幾乎無法評測”但最近很多人讓他重新評測,他表示現在完全不一樣了。
連當時給出最負面評測的人,觀點都發生了反轉。而且過去一年半里,我們給 r1 推送了超過 35 個設備端更新,云端更新更是不計其數,設備一直在跟著最新技術進化,本身沒有質量問題,這就是退貨率低的關鍵。
當時我們出了貨、賣了出去,所以我們是被罵得最多的。
駱軼航: 但現在我反過來說,你今天坐在這兒,就說明這么一件事——你們還活著。
呂騁: 不光活著,我們還做了好多新的東西。
駱軼航:你們當時為什么一定要做硬件?很多人覺得做軟件更簡單,也更省心。
呂騁:不是因為我做過硬件、喜歡做硬件,這個理解太膚淺了。
真正的原因是,如果不做硬件,我們只有三種選擇,做 APP、賣 API、做網頁。網頁在移動端的體驗不好,做 APP 則有很多限制。比如要支付 App Store 的蘋果稅,還有各種規則約束,最近很多 web coding 類 APP 被蘋果下架,就是因為蘋果特別反對別人做“生成 App 的 App”。
之前也有人說,做成 WhatsApp、Telegram 上的套殼方案行不行,但后來這種方案也被禁止了。
更重要的是,話語權不在自己手里,這很危險。你做得再好,也可能變成別人的附屬,比如蘋果沒有理由允許一個比 Siri 更聰明的產品取代自己的 Siri。從商業終點來看,這樣最終只會被收購。
我們這次創業,是希望能做得更大,所以寧愿承擔額外的風險,做硬件是我們仔細思考后的最佳路徑。
駱軼航:所以堅守硬件,本質上是為了掌握行業話語權?
呂騁:對。而且現在硅谷的投資人也有一個共識變化,他們覺得軟件沒有護城河了。
很多人說,你做一個軟件沒什么大不了,我可以用 Claude Code 去反向工程。現在 AI coding agent 的效果大幅提升,軟件的可復制性越來越強。而硬件能給我們一個輸入循環,只要設備能正常運行,用戶體驗就一定會越來越好,這是軟件無法比擬的優勢。
駱軼航:總結下來,第一波 AI 硬件浪潮里,你們能活下來,不是靠運氣,而是靠正確的選擇和堅持?
呂騁:是這樣。我們在業界共識形成之前,就確定了做硬件、做 LAM 的方向,而且在關鍵問題上沒有走錯路。創業本身就是一件辛苦的事,YC 里 99.99%的創業公司都會失敗,我們能活著,本身就是一種能力。
我常跟投資人說,我們現在狀態很好,活著,而且產品還挺好用,不用擔心生存問題。但這個過程非常艱辛,堅信的路上肯定有無數個瀕臨失敗的階段。
從 “點按鈕” 到 DLAM,AI Agent 的進化之路
駱軼航:其實很多人對 rabbit 的理解,只停留在 r1 這個硬件上,但對我來說,你們一開始的核心是兩個東西,r1 和 LAM。LAM 不是具體產品,卻是你們的核心底層邏輯。
呂騁:對,LAM 就是 Large Action Model,用動作替換了傳統大模型的語言。過去一年,AI agent 進化的主要方向就是動作,我們過去一年的核心工作,就是推進 LAM 的迭代,到今天已經是第五代了。
駱軼航:能不能詳細說說 LAM 五代的進化過程,每一代的核心突破是什么?
呂騁:第一代 LAM 現在看很原始,是用特定的數據實驗室訓練的,有點像 Tesla Autopilot 的屏幕錄制方式。比如 Spotify 有個播放按鈕,我們就默認它全世界都長這樣,找到這個按鈕就能點擊操作,這也是為什么 r1 上線時只有幾個 APP 能用。
第二代 LAM,我們最早實現了更廣泛的使用場景。當時有了更成熟的推理模型,我們上線了 playground 功能,能夠操作所有網頁。我們把這個功能推送到 r1 一個月內,Anthropic 也推出了 Computer Use,不過只能在網頁里操作。
半年后,OpenAI 做了 Operator,Perplexity 推出了 Comet 瀏覽器,其實都是這個方向。但這一代的局限是,只能在無頭瀏覽器里操作網頁。
第三代 LAM,我們從去年 2 月份開始研發,核心是研究除了網頁之外,能不能跨平臺控制其他設備。去年 2 月 19 號我們官網發布的 demo,就是控制 Android 系統。
當時我們用 ADB 坐標、accessibility tree 和 Android Intent 來實現,但這種方法在今天看來,還不是面向消費者的成熟方案,所以我們沒有正式發布。我當時還專門回國拿了豆包手機測試,發現它也不是面向消費者的技術路徑,后來豆包也確實被部分第三方平臺禁用。
第四代 LAM,是我們去年下半年打造的多 Agent 架構。當時我們發現一個問題,比如用 Manus、ChatGPT Pro 做系統性調研或文檔處理時,它會把任務拆解成幾步,但每一步的上下文窗口和記憶是緊湊在一起的,就像一個老板既要統籌管理,又要做掃地、保安、廚師等基礎工作,事情一復雜,執行效果就會很差。
我們意識到,以前所有 AI 助手都是靜態問答邏輯,一條線到底。
你問今天天氣怎么樣,它就回答;你說明天加個日歷,它就執行。但在 agent 時代,這種靜態問答模式,在長期的上下文窗口和記憶挑戰面前,會越來越難滿足需求。所以我們做了并行架構,變成蜂群式 Agent,里面每個角色的權重不一樣,有的負責計劃,有的負責問答,有的負責執行。
最近 GitHub 上有個“三省六部制”的項目,其實我們去年就做過類似的方向,這一切都是為今年發布的 DLAM 做準備。
![]()
駱軼航:DLAM 是第五代 LAM 的核心,你說它是中間態產品,能不能用通俗的話解釋一下,它到底是什么,工作邏輯又是什么?
呂騁:DLAM 是我們的中間態產品,不是最終形態。我們現在認為它是當下最好用的方案,但再過一段時間,我們就會把它顛覆掉。它解決的是圖形界面的問題,是 GUI 的“最后榮光”。
如果圖形界面不存在了,DLAM 就沒有價值了。但它現在有價值,是因為還有很多“最后一公里問題”。比如讓 agent 給你轉錢,你還是會想自己確認一下,有些事不能完全交給 OpenClaw 這類工具。這個階段,自動化是可以實現的,這就是 DLAM 的核心價值。
DLAM 的工作邏輯,完全是從人類用電腦的原始邏輯出發的。人用電腦需要三個部分,大腦、眼睛、手,我們就按照這個邏輯設計 DLAM。
第一是“腦”,用任何大語言模型來理解用戶需求。
第二是“眼”,用視覺實時查看屏幕,但不是傳統的截圖方式,不是把屏幕切成格子或靜態截圖,那樣在 UI 復雜時效果不好。我們借助 LAM 1 到 4 代的訓練數據,能做到動態視覺理解。
第三是“手”,我們不做 ADB 層面的坐標控制,因為對方想封掉你就可以封掉,還需要用戶開啟權限,體驗不好。我們做了一個驅動,能模擬人手在所有鍵盤、鼠標、觸摸屏上的操作,還能執行所有軟件的快捷鍵,然后轉化成高效的二進制流,和 agent、大模型無縫銜接、實時協同。
駱軼航:所以 DLAM 的核心優勢是通用、跨平臺?
呂騁:對。今天的 DLAM,不管是 macOS、Linux、Windows、Android,還是華為鴻蒙,甚至一些研究院、航天的非通用操作系統,只要人能看懂界面,DLAM 就能使用。
比如 Salesforce 的客戶,像 Walmart、Target 這些公司,他們的系統 30 年沒換過,每個部門、每個門店的邏輯都不一樣。DLAM 在這個階段就有巨大優勢,能用人能看懂的方式,讓 agent 去改造這些老舊系統,瓦解當下的 SaaS 模式,推開最后一堵墻。
駱軼航:你剛才提到 GUI 的“最后榮光”,而最近 CLI 命令行越來越普及,DLAM 和 CLI 之間是什么關系?
呂騁:CLI 是人與機器溝通最高效的方式,也是比 GUI 更早出現的交互方式,現在它的重要性前所未有地超過了 GUI。但 CLI 也是人跟機器交互的最后一道屏障,如果以后人和機器不需要復雜交互,CLI 的重要性也會下降。
DLAM 和 CLI 的關系很簡單。DLAM 解決的是當下 GUI 還未消亡時的自動化問題,而 CLI 是未來的趨勢。因為它能打破 APP 的“殼”,打破信息孤島,讓不同軟件、服務的信息實現共享。我們內部現在也在往 CLI 方向推進,DLAM 是中間態,等 GUI 完全消亡,DLAM 的價值就會被替代,但現階段,它是最貼合實際、最實用的方案。
駱軼航:你覺得 GUI 最終會消亡嗎?
呂騁:我覺得一定會完全消亡,哪怕在硬件上也是如此。人與任何智能體的首要交流方式,應該是語言和文字。我們現在聊天,不需要跳舞、不需要畫圖,就能表達所有想法。人跟狗交流,也是用語言,因為人就是這樣的物種,習慣用自己的方式和其他事物溝通。
以前需要 GUI,是因為電腦不知道你在做什么,需要把信息可視化,讓你手動操作。比如每次視頻會議都要手動點“加入”,但電腦其實應該自己知道要做什么。
CLI 的厲害之處,就是打通了 APP 的殼,讓上下文和記憶可以共享。而 agent 的發展,就是加速去掉“中間層”。
你說“幫我叫輛出租車,晚上八點去機場”,你不需要知道它用了什么 APP、打了什么電話,只要結果是七點半車到樓下就行。以后,人真正需要的,就是和 AI 系統自然對話,把需求說清楚,剩下的都交給 agent。
駱軼航:所以 LAM 的五代迭代,本質上是一步步靠近“讓 AI 自主完成任務”這個目標?
呂騁:對。從第一代只能點擊特定 APP 的按鈕,到第二代能操作網頁,第三代能跨平臺控制 Android,第四代做多 Agent 架構,第五代推出 DLAM 解決 GUI 自動化問題,每一步都是在推進 agent 的能力,讓它從“需要人指導”,慢慢變成“能自主理解、自主執行”。而且我們每次判斷的方向,后來都被行業驗證是對的。
比如我們做廣泛控制時,后來才有了 Anthropic 的 Computer Use、OpenAI 的 Operator,只是我們沒有成為做得最大的那個,但方向沒走錯,就比什么都重要。
Cyberdeck 與人類最后的護城河
駱軼航:聊完 LAM,大家最關心的就是 rabbit 的下一代硬件。你之前提到,你們在做一個代號叫 Cyberdeck 的產品,能不能詳細說說它的定位?
呂騁:我們已經官宣要做 Cyberdeck 了,但沒說具體長什么樣。它的靈感來自索尼當年的 VAIO P,一款翻蓋小黑本,和 r1 的靈感來自寶可夢道具一樣,有自己的設計溯源。它的定位是原生 AI 動作計算機,不是給程序員用的,而是面向 AI 原生用戶,尤其是年輕人的設備。
![]()
駱軼航:它的核心特點是什么?和 r1 有什么不一樣?
呂騁:首先,它很小,比筆記本電腦小很多,非常便攜。其次,它是 CLI 界面,本質上是一臺非常干凈的 Linux 設備。第三,它配備了 40%布局的全機械鍵盤,矮軸設計,用戶還能自己換軸,確保長時間打字的舒適度。因為你不可能隨時都方便說話,做認真的項目、整理 Markdown 文檔時,還是需要好用的鍵盤。
和 r1 不一樣,r1 是概念產品,發布時我們就知道出手太早,用戶會疑惑“這東西能用來干嘛”。
但 Cyberdeck 不一樣,用戶拿到手就能想明白它的用途,即開即用,不會再拿它跟手機對比。它的邏輯和手機、傳統筆記本完全不同,不需要裝 Windows、macOS、Chrome OS,開機就能和 AI agent 對話,用上所有 CLI 工具、運行所有 agent 項目。
駱軼航:它解決的核心痛點是什么?
呂騁:最核心的痛點是多設備同步和便攜性。我自己就有這個困擾,家里有游戲電腦,公司有工作電腦,在電腦上用 Claude 做的工作,到公司還要重新配置,普通消費者沒人愿意花半天時間做這件事。
Cyberdeck 就能解決這個問題,它能把你所有設備的文件、任務統一起來,你拿著它,就能遠程控制所有設備,隨時和 AI agent 交流。
還有一個痛點,就是現在沒有一款消費級設備,能兼顧便攜性、CLI 交互,還能兼容所有 CLI 工具和 Agent 項目。手機不行,因為 iOS 跑不了 uv、Python 這些第三方庫,安卓也只能實現遠程控制。傳統筆記本太大,而且很多不兼容,閑置率很高。Cyberdeck 就是要做這樣一款設備,填補這個市場空白。
駱軼航:價格方面,有什么規劃嗎?目前市場反饋怎么樣?
呂騁:我們希望能做到和 Mac mini 差不多的價格,還能留一些利潤。內存價格這段時間漲得很厲害,但我們還是想盡量壓低價格,讓更多年輕人能買得起。
我們在 Twitter 上公布了早期訪問的注冊鏈接,兩三周時間,已經有 7000 多人注冊了。按照這個價格,我們已經能回本,甚至能實現盈利翻倍。這說明大家看懂了這個產品,知道它能解決自己的問題,和 r1 相比,這款產品的市場風險小了很多。
駱軼航:你覺得它會成為 AI 原生時代年輕人的第一臺電腦嗎?
呂騁:我覺得會。我們公司有個 16、17 歲的暑期實習生,他的電腦屏幕一打開,就只有 Claude Code。對他來說,用電腦就是跟 AI 講話,這是很自然的事。現在的年輕人,已經被迫成為 AI 原生用戶了,他們對“軟件”“瀏覽器”這些概念,可能都沒有我們這一代深刻。
我們問公司的年輕同事,想要什么型號的工作電腦,他們說“我們不在乎,只要能跑 Claude 就行”。
對年輕人來說,Cyberdeck 就是他們需要的第一臺電腦。便攜、能和 AI 順暢交互、能解決多設備同步的問題,不需要復雜的配置,開機就能用。而且它足夠開放,本質是 Linux 設備,用戶可以做任何自己想做的事,這也符合年輕人的需求。
駱軼航:聊到 AI 原生時代,我有個問題。未來是 Agent 驅動的世界,人和人之間的差距,會體現在哪里?你之前提到“沒有文化,Agent 就是廢的”,能不能展開說說?
呂騁:對,這是最核心的差距。知識是靜態的,可以被索引,但文化是活的,可以被構建。
最近流行什么、什么東西代表什么意義,這些都是被建構出來的,很難被索引。美國有句話叫“know your memes”,這就是文化的一部分,很復雜,AI 沒法輕易復制。
舉個簡單的例子,我特別喜歡《新世紀福音戰士》,連電子煙都是 EVA 主題的。如果一個沒看過 EVA 的人,讓 Claude 做一個 EVA 風格的界面,他只會說“幫我做一個符合《新世紀福音戰士》審美的網站”。Claude 能做出來,但肯定做不出我想要的效果。因為我作為資深粉絲,對 EVA 視覺語言的理解,不是一句“像它一樣”就能說清楚的,這就是文化和審美帶來的差距。
我們內部做過一個測試,讓工程師只寫提示詞,不直接寫代碼,在自己的代碼庫里測試,結果發現人和人之間的差距非常大。這個差距,不是編碼能力的差距,而是知識體系、思維建構的差距。
你的知識體系越完善,每天攝入的知識越多,這些知識在你的記憶宮殿里形成的結構越清晰,你給 Agent 的提示詞就越精準,Agent 的表現就越好。
駱軼航:我突然發現,AI 時代,這件事是沒法教的。你的 Agent 長什么樣,你給它什么樣的提示詞,取決于你的算力、參數、預訓練方式、上下文記憶、RAG,每個人都不一樣。
呂騁:確實沒法教。這就跟帶小孩一樣,父母能做的就是身體力行示范、孜孜不倦溝通,不能打罵,只能慢慢引導。Agent 也一樣,你說一遍它不一定聽,有時候記不住、明知故犯,甚至反著來。
你需要每天對它進行強化學習,就像養小孩、養狗一樣。狗前兩到四個月就定型了,后面很難糾正,Agent 也一樣,你對它的約束能力越高,要求它“別干什么”就越難。
駱軼航:我前兩天和 Claude 探討,為什么給它的上下文一多,結果反而更糟。我問能不能用技能約束上下文,它說“你的技能本身就是上下文”,我當時就懵了。
我也做過一個實驗,覺得自己提示詞寫得不好,就用所有模型,從最快最小的開始,一路用到最頂層的模型,設計了一個游戲。讓最頂層的模型產出一個大師級提示詞,讓 Codex 一看就能執行,結果和我要求的完全一樣。中間經過很多層,每一層模型的知識水平都比下一層高。
我用最簡單的自然語言描述需求,第一層模型翻譯成 Markdown 提示詞,再轉給更好的模型,一路篩上去。最后 GPT-4.5 輸出的 prompt,和我當初說的“人話”相比,差距大到讓人振奮。這個差距,就是文化和知識積累帶來的。
駱軼航:所以 AI 時代,人類最后的護城河,就是文化和審美?
呂騁:對。三年以后,AI 可能不再需要人類的指導性輸入,每個模型都能解決普通人 99.99%的問題。到那個時候,用戶真正會為什么買單?就是審美。就像服裝,所有人穿不暖的時候,只強調功能性。等大家都穿暖吃飽了,核心就是舒服和審美。AI 能解決功能問題,但沒法替代你對世界的理解,沒法替代你的文化積累和審美判斷。
我之前有個激進的觀點,AI 市場可能未來三年就打完了,就是 AI 不再需要人類給予指導性輸入的節點。到那個時候,人和人的差距,就全在文化和審美上。哪怕知識層面打平了,誰能在文化上有更有創造力的指導,形成有效的約束落在 Agent 上,最終產生的差距就會很大。沒有文化,你的 Agent 就是廢的。
駱軼航:我最近有個很惶恐的經歷,用 AI 寫了一篇五六千字的文章,從和 Claude 討論到發稿,只用了五十分鐘,結果文章爆了。很多人說我想得很深,但其實我想得很草。觀點框架是我的,但細節不是,我甚至不知道礦機技術發展到哪個階段。
那些讓文章“火”的點,到底歸我還是歸 AI,我分不清楚。我唯一覺得自己還有用的,就是建構敘事的能力,找到不同事物之間的強關聯,這個能力目前還沒被 AI 取代。
呂騁:這就是最核心的東西,建構敘事、文化審美,這些都是 AI 沒法替代的。以后,AI 能幫你做所有執行層面的事,但“你想做什么”“你想要什么樣的結果”,還是取決于你自己的文化和審美。
我們這一代很幸運,站在從模擬時代到數智時代的轉折點,承前啟后。而我們能做的,就是堅守方向,給 AI-native 的一代,做出他們想要的計算設備,同時守住人類最后的護城河。
駱軼航:今年是電子計算機誕生 80 年,也可能是新的“Macintosh 時刻”,你覺得 rabbit 能抓住這個機會嗎?
呂騁:我們希望能。歷史當下可能無法判斷對錯,但我們希望回頭來看,我們是走在時代前面的。我們接受創業的風險,也堅信自己的方向,繼續努力,給大家奉獻更好的產品,給 AI-native 的一代做出他們想要的計算設備。
駱軼航:好,非常感謝 Jesse 今天的分享,也期待 Cyberdeck 的正式發布,期待 rabbit 能在 AI 硬件的賽道上,走出一條不一樣的路。
呂騁:謝謝,也期待之后和大家再分享更多新進展。
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.