網易首頁 > 網易號 > 正文申請入駐

對話 rabbit 呂騁：活下來的 AI 硬件先行者，熬出人機交互的下一個時代

2026-03-23 10:00:05　來源: 硅星人

北京舉報

分享至

作者｜孫芮
郵箱｜ sunrui@pingwest.com

作者｜周華香
郵箱｜ zhouhuaxiang@pingwest.com

沉默一年，rabbit 把一切指向“讓 AI 去做事”。

2024 年 1 月，rabbit r1 的發布曾掀起一陣 AI 硬件熱潮，卻也很快陷入鋪天蓋地的爭議——科技博主給出負面評測，大眾也發出“有手機為何還要它”的質疑，rabbit r1 一度被貼上“雞肋”“不成熟”的標簽。

在這一波 AI 硬件創業潮中，許多同行相繼折戟，rabbit 成為少數仍在場上的玩家。

這一年里，呂騁見證了許多產品的快速迭代與分化。

去年底，呂騁專程飛回北京，只為拿到一臺豆包手機——最終還是通過朋友從閑魚上輾轉購得。拿到手當天，他得出了一個判斷：這條技術路徑尚未達到 consumer ready 的標準。就在飛機落地前，豆包手機的相關功能已經被某些第三方平臺禁用。

幾個月后，OpenClaw 上線即爆火。呂騁當即讓團隊接入，r1 成為全球首款支持小龍蝦的硬件設備——發布當周，用戶向左滑動，默認界面可以從兔子切換為龍蝦。

rabbit 的一個投資人說呂騁 always take a go big or go home approach（要么來票大的，要么完蛋）。這樣的創業者，通常都不太有妥協的氣質。

呂騁并不急于推出第二代硬件，而是用一整年時間打磨 AI agent 底層技術；他也拒絕跟風傳統 SaaS 思路，甚至設計團隊都徹底拋棄了 Figma 和 Adobe 等工具，轉向 Claude 與內部系統的協同辦公；他也堅信 GUI 終將消亡，自然語言才是人與 AI 交互的終極形態。

作為連續創業者，呂騁在做 rabbit 之初就獲得了 Khosla Ventures 、Sound Ventures 、Amazon Alexa Fund 以及 Synergist 等知名機構的融資。最近，rabbit 又獲得了來自 BAI 資本的一輪支持。

近期，硅星人在舊金山灣區與呂騁進行了一次深入對話。鏡頭前的呂騁，不避諱談論曾經的爭議，也不掩飾對未來的激進判斷；對堅持什么，為什么焦慮，他也很坦率直接。對外界對他把 r1 搞砸了的說法，他不接受，為自己辯護。

他坦言，創業本就是與不確定性為伴。而 rabbit 的每一步，都在把 AI 的能力落到實際操作中。

呂騁說，“歷史當下可能無法判斷對錯，但我們希望回頭來看，我們是 ahead of the time。”

以下是與呂騁的對話實錄，也敬請期待《硅基立場》的同題視頻播客。

rabbit 的堅守與迭代

駱軼航：你們第一波同行里，有一部分已經倒下，你們算是碩果僅存，這件事很有標志性意義。其實我有個誤解，去年跟你聊完之后，我一度覺得你們放棄了硬件，轉去做 AI agent。這一年 AI agent 的變化也很大，Claude 也給大家帶來了很多新的 inspiration。你過去這兩年基本上在干什么？是一直圍繞著 agent 這件事，還是在想什么時候再做下一步？

呂騁：外界可能會覺得我們有兩個讓人看不懂的地方。一是 r1 發布后為什么沒有推出第二代硬件，二是去年我們的方向看起來很雜亂，一會兒推進國際化、一會兒推出新東西。但從內部來講，我們從來沒有動搖過。從第一代 LAM 到現在，我們核心就是在做 agent 這件事。

硬件方面，我們去年做了理性判斷，既然大家都在吐槽，說明整個行業還沒有準備好。后來我們發現不只是我們，OpenAI Operator、ChatGPT Search、Apple Intelligence 也都沒準備好。

所以去年一整年，我們把全部精力放在推進 agents 技術上，專注做軟件，不是從零開始做新軟件，而是為現在這個節點做準備，這件事非常值得。

駱軼航：外界很多人覺得你們把硬件搞砸了，你怎么看這個說法？

呂騁：首先我不認同硬件失敗的說法。有些人可能覺得賣 10 萬臺不算什么，但要放在 AI 硬件的語境里看，還要看 r1 整個生命周期的利潤。

一般新公司做第一代硬件，很多都是貼錢銷售，大公司的硬件項目也一樣，比如 Meta 的 Ray-Ban smart glasses 也是貼錢賣的。

從商業角度來說，我們不認為做砸了。我們當時的目標很保守，以為只能賣 3000 臺，現在實際賣了十多萬臺。雖然早期有一些負面評價，但總退貨率不到 5%。

駱軼航：退貨率這么低，核心原因是什么？

呂騁：比如美國數碼博主 MKBHD 前兩天做采訪時提到，兩年前他說 r1“幾乎無法評測”但最近很多人讓他重新評測，他表示現在完全不一樣了。

連當時給出最負面評測的人，觀點都發生了反轉。而且過去一年半里，我們給 r1 推送了超過 35 個設備端更新，云端更新更是不計其數，設備一直在跟著最新技術進化，本身沒有質量問題，這就是退貨率低的關鍵。

當時我們出了貨、賣了出去，所以我們是被罵得最多的。

駱軼航：但現在我反過來說，你今天坐在這兒，就說明這么一件事——你們還活著。

呂騁：不光活著，我們還做了好多新的東西。

駱軼航：你們當時為什么一定要做硬件？很多人覺得做軟件更簡單，也更省心。

呂騁：不是因為我做過硬件、喜歡做硬件，這個理解太膚淺了。

真正的原因是，如果不做硬件，我們只有三種選擇，做 APP、賣 API、做網頁。網頁在移動端的體驗不好，做 APP 則有很多限制。比如要支付 App Store 的蘋果稅，還有各種規則約束，最近很多 web coding 類 APP 被蘋果下架，就是因為蘋果特別反對別人做“生成 App 的 App”。

之前也有人說，做成 WhatsApp、Telegram 上的套殼方案行不行，但后來這種方案也被禁止了。

更重要的是，話語權不在自己手里，這很危險。你做得再好，也可能變成別人的附屬，比如蘋果沒有理由允許一個比 Siri 更聰明的產品取代自己的 Siri。從商業終點來看，這樣最終只會被收購。

我們這次創業，是希望能做得更大，所以寧愿承擔額外的風險，做硬件是我們仔細思考后的最佳路徑。

駱軼航：所以堅守硬件，本質上是為了掌握行業話語權？

呂騁：對。而且現在硅谷的投資人也有一個共識變化，他們覺得軟件沒有護城河了。

很多人說，你做一個軟件沒什么大不了，我可以用 Claude Code 去反向工程。現在 AI coding agent 的效果大幅提升，軟件的可復制性越來越強。而硬件能給我們一個輸入循環，只要設備能正常運行，用戶體驗就一定會越來越好，這是軟件無法比擬的優勢。

駱軼航：總結下來，第一波 AI 硬件浪潮里，你們能活下來，不是靠運氣，而是靠正確的選擇和堅持？

呂騁：是這樣。我們在業界共識形成之前，就確定了做硬件、做 LAM 的方向，而且在關鍵問題上沒有走錯路。創業本身就是一件辛苦的事，YC 里 99.99%的創業公司都會失敗，我們能活著，本身就是一種能力。

我常跟投資人說，我們現在狀態很好，活著，而且產品還挺好用，不用擔心生存問題。但這個過程非常艱辛，堅信的路上肯定有無數個瀕臨失敗的階段。

從 “點按鈕” 到 DLAM，AI Agent 的進化之路

駱軼航：其實很多人對 rabbit 的理解，只停留在 r1 這個硬件上，但對我來說，你們一開始的核心是兩個東西，r1 和 LAM。LAM 不是具體產品，卻是你們的核心底層邏輯。

呂騁：對，LAM 就是 Large Action Model，用動作替換了傳統大模型的語言。過去一年，AI agent 進化的主要方向就是動作，我們過去一年的核心工作，就是推進 LAM 的迭代，到今天已經是第五代了。

駱軼航：能不能詳細說說 LAM 五代的進化過程，每一代的核心突破是什么？

呂騁：第一代 LAM 現在看很原始，是用特定的數據實驗室訓練的，有點像 Tesla Autopilot 的屏幕錄制方式。比如 Spotify 有個播放按鈕，我們就默認它全世界都長這樣，找到這個按鈕就能點擊操作，這也是為什么 r1 上線時只有幾個 APP 能用。

第二代 LAM，我們最早實現了更廣泛的使用場景。當時有了更成熟的推理模型，我們上線了 playground 功能，能夠操作所有網頁。我們把這個功能推送到 r1 一個月內，Anthropic 也推出了 Computer Use，不過只能在網頁里操作。

半年后，OpenAI 做了 Operator，Perplexity 推出了 Comet 瀏覽器，其實都是這個方向。但這一代的局限是，只能在無頭瀏覽器里操作網頁。

第三代 LAM，我們從去年 2 月份開始研發，核心是研究除了網頁之外，能不能跨平臺控制其他設備。去年 2 月 19 號我們官網發布的 demo，就是控制 Android 系統。

當時我們用 ADB 坐標、accessibility tree 和 Android Intent 來實現，但這種方法在今天看來，還不是面向消費者的成熟方案，所以我們沒有正式發布。我當時還專門回國拿了豆包手機測試，發現它也不是面向消費者的技術路徑，后來豆包也確實被部分第三方平臺禁用。

第四代 LAM，是我們去年下半年打造的多 Agent 架構。當時我們發現一個問題，比如用 Manus、ChatGPT Pro 做系統性調研或文檔處理時，它會把任務拆解成幾步，但每一步的上下文窗口和記憶是緊湊在一起的，就像一個老板既要統籌管理，又要做掃地、保安、廚師等基礎工作，事情一復雜，執行效果就會很差。

我們意識到，以前所有 AI 助手都是靜態問答邏輯，一條線到底。

你問今天天氣怎么樣，它就回答；你說明天加個日歷，它就執行。但在 agent 時代，這種靜態問答模式，在長期的上下文窗口和記憶挑戰面前，會越來越難滿足需求。所以我們做了并行架構，變成蜂群式 Agent，里面每個角色的權重不一樣，有的負責計劃，有的負責問答，有的負責執行。

最近 GitHub 上有個“三省六部制”的項目，其實我們去年就做過類似的方向，這一切都是為今年發布的 DLAM 做準備。

駱軼航：DLAM 是第五代 LAM 的核心，你說它是中間態產品，能不能用通俗的話解釋一下，它到底是什么，工作邏輯又是什么？

呂騁：DLAM 是我們的中間態產品，不是最終形態。我們現在認為它是當下最好用的方案，但再過一段時間，我們就會把它顛覆掉。它解決的是圖形界面的問題，是 GUI 的“最后榮光”。

如果圖形界面不存在了，DLAM 就沒有價值了。但它現在有價值，是因為還有很多“最后一公里問題”。比如讓 agent 給你轉錢，你還是會想自己確認一下，有些事不能完全交給 OpenClaw 這類工具。這個階段，自動化是可以實現的，這就是 DLAM 的核心價值。

DLAM 的工作邏輯，完全是從人類用電腦的原始邏輯出發的。人用電腦需要三個部分，大腦、眼睛、手，我們就按照這個邏輯設計 DLAM。

第一是“腦”，用任何大語言模型來理解用戶需求。

第二是“眼”，用視覺實時查看屏幕，但不是傳統的截圖方式，不是把屏幕切成格子或靜態截圖，那樣在 UI 復雜時效果不好。我們借助 LAM 1 到 4 代的訓練數據，能做到動態視覺理解。

第三是“手”，我們不做 ADB 層面的坐標控制，因為對方想封掉你就可以封掉，還需要用戶開啟權限，體驗不好。我們做了一個驅動，能模擬人手在所有鍵盤、鼠標、觸摸屏上的操作，還能執行所有軟件的快捷鍵，然后轉化成高效的二進制流，和 agent、大模型無縫銜接、實時協同。

駱軼航：所以 DLAM 的核心優勢是通用、跨平臺？

呂騁：對。今天的 DLAM，不管是 macOS、Linux、Windows、Android，還是華為鴻蒙，甚至一些研究院、航天的非通用操作系統，只要人能看懂界面，DLAM 就能使用。

比如 Salesforce 的客戶，像 Walmart、Target 這些公司，他們的系統 30 年沒換過，每個部門、每個門店的邏輯都不一樣。DLAM 在這個階段就有巨大優勢，能用人能看懂的方式，讓 agent 去改造這些老舊系統，瓦解當下的 SaaS 模式，推開最后一堵墻。

駱軼航：你剛才提到 GUI 的“最后榮光”，而最近 CLI 命令行越來越普及，DLAM 和 CLI 之間是什么關系？

呂騁：CLI 是人與機器溝通最高效的方式，也是比 GUI 更早出現的交互方式，現在它的重要性前所未有地超過了 GUI。但 CLI 也是人跟機器交互的最后一道屏障，如果以后人和機器不需要復雜交互，CLI 的重要性也會下降。

DLAM 和 CLI 的關系很簡單。DLAM 解決的是當下 GUI 還未消亡時的自動化問題，而 CLI 是未來的趨勢。因為它能打破 APP 的“殼”，打破信息孤島，讓不同軟件、服務的信息實現共享。我們內部現在也在往 CLI 方向推進，DLAM 是中間態，等 GUI 完全消亡，DLAM 的價值就會被替代，但現階段，它是最貼合實際、最實用的方案。

駱軼航：你覺得 GUI 最終會消亡嗎？

呂騁：我覺得一定會完全消亡，哪怕在硬件上也是如此。人與任何智能體的首要交流方式，應該是語言和文字。我們現在聊天，不需要跳舞、不需要畫圖，就能表達所有想法。人跟狗交流，也是用語言，因為人就是這樣的物種，習慣用自己的方式和其他事物溝通。

以前需要 GUI，是因為電腦不知道你在做什么，需要把信息可視化，讓你手動操作。比如每次視頻會議都要手動點“加入”，但電腦其實應該自己知道要做什么。

CLI 的厲害之處，就是打通了 APP 的殼，讓上下文和記憶可以共享。而 agent 的發展，就是加速去掉“中間層”。

你說“幫我叫輛出租車，晚上八點去機場”，你不需要知道它用了什么 APP、打了什么電話，只要結果是七點半車到樓下就行。以后，人真正需要的，就是和 AI 系統自然對話，把需求說清楚，剩下的都交給 agent。

駱軼航：所以 LAM 的五代迭代，本質上是一步步靠近“讓 AI 自主完成任務”這個目標？

呂騁：對。從第一代只能點擊特定 APP 的按鈕，到第二代能操作網頁，第三代能跨平臺控制 Android，第四代做多 Agent 架構，第五代推出 DLAM 解決 GUI 自動化問題，每一步都是在推進 agent 的能力，讓它從“需要人指導”，慢慢變成“能自主理解、自主執行”。而且我們每次判斷的方向，后來都被行業驗證是對的。

比如我們做廣泛控制時，后來才有了 Anthropic 的 Computer Use、OpenAI 的 Operator，只是我們沒有成為做得最大的那個，但方向沒走錯，就比什么都重要。

Cyberdeck 與人類最后的護城河

駱軼航：聊完 LAM，大家最關心的就是 rabbit 的下一代硬件。你之前提到，你們在做一個代號叫 Cyberdeck 的產品，能不能詳細說說它的定位？

呂騁：我們已經官宣要做 Cyberdeck 了，但沒說具體長什么樣。它的靈感來自索尼當年的 VAIO P，一款翻蓋小黑本，和 r1 的靈感來自寶可夢道具一樣，有自己的設計溯源。它的定位是原生 AI 動作計算機，不是給程序員用的，而是面向 AI 原生用戶，尤其是年輕人的設備。

駱軼航：它的核心特點是什么？和 r1 有什么不一樣？

呂騁：首先，它很小，比筆記本電腦小很多，非常便攜。其次，它是 CLI 界面，本質上是一臺非常干凈的 Linux 設備。第三，它配備了 40%布局的全機械鍵盤，矮軸設計，用戶還能自己換軸，確保長時間打字的舒適度。因為你不可能隨時都方便說話，做認真的項目、整理 Markdown 文檔時，還是需要好用的鍵盤。

和 r1 不一樣，r1 是概念產品，發布時我們就知道出手太早，用戶會疑惑“這東西能用來干嘛”。

但 Cyberdeck 不一樣，用戶拿到手就能想明白它的用途，即開即用，不會再拿它跟手機對比。它的邏輯和手機、傳統筆記本完全不同，不需要裝 Windows、macOS、Chrome OS，開機就能和 AI agent 對話，用上所有 CLI 工具、運行所有 agent 項目。

駱軼航：它解決的核心痛點是什么？

呂騁：最核心的痛點是多設備同步和便攜性。我自己就有這個困擾，家里有游戲電腦，公司有工作電腦，在電腦上用 Claude 做的工作，到公司還要重新配置，普通消費者沒人愿意花半天時間做這件事。

Cyberdeck 就能解決這個問題，它能把你所有設備的文件、任務統一起來，你拿著它，就能遠程控制所有設備，隨時和 AI agent 交流。

還有一個痛點，就是現在沒有一款消費級設備，能兼顧便攜性、CLI 交互，還能兼容所有 CLI 工具和 Agent 項目。手機不行，因為 iOS 跑不了 uv、Python 這些第三方庫，安卓也只能實現遠程控制。傳統筆記本太大，而且很多不兼容，閑置率很高。Cyberdeck 就是要做這樣一款設備，填補這個市場空白。

駱軼航：價格方面，有什么規劃嗎？目前市場反饋怎么樣？

呂騁：我們希望能做到和 Mac mini 差不多的價格，還能留一些利潤。內存價格這段時間漲得很厲害，但我們還是想盡量壓低價格，讓更多年輕人能買得起。

我們在 Twitter 上公布了早期訪問的注冊鏈接，兩三周時間，已經有 7000 多人注冊了。按照這個價格，我們已經能回本，甚至能實現盈利翻倍。這說明大家看懂了這個產品，知道它能解決自己的問題，和 r1 相比，這款產品的市場風險小了很多。

駱軼航：你覺得它會成為 AI 原生時代年輕人的第一臺電腦嗎？

呂騁：我覺得會。我們公司有個 16、17 歲的暑期實習生，他的電腦屏幕一打開，就只有 Claude Code。對他來說，用電腦就是跟 AI 講話，這是很自然的事。現在的年輕人，已經被迫成為 AI 原生用戶了，他們對“軟件”“瀏覽器”這些概念，可能都沒有我們這一代深刻。

我們問公司的年輕同事，想要什么型號的工作電腦，他們說“我們不在乎，只要能跑 Claude 就行”。

對年輕人來說，Cyberdeck 就是他們需要的第一臺電腦。便攜、能和 AI 順暢交互、能解決多設備同步的問題，不需要復雜的配置，開機就能用。而且它足夠開放，本質是 Linux 設備，用戶可以做任何自己想做的事，這也符合年輕人的需求。

駱軼航：聊到 AI 原生時代，我有個問題。未來是 Agent 驅動的世界，人和人之間的差距，會體現在哪里？你之前提到“沒有文化，Agent 就是廢的”，能不能展開說說？

呂騁：對，這是最核心的差距。知識是靜態的，可以被索引，但文化是活的，可以被構建。

最近流行什么、什么東西代表什么意義，這些都是被建構出來的，很難被索引。美國有句話叫“know your memes”，這就是文化的一部分，很復雜，AI 沒法輕易復制。

舉個簡單的例子，我特別喜歡《新世紀福音戰士》，連電子煙都是 EVA 主題的。如果一個沒看過 EVA 的人，讓 Claude 做一個 EVA 風格的界面，他只會說“幫我做一個符合《新世紀福音戰士》審美的網站”。Claude 能做出來，但肯定做不出我想要的效果。因為我作為資深粉絲，對 EVA 視覺語言的理解，不是一句“像它一樣”就能說清楚的，這就是文化和審美帶來的差距。

我們內部做過一個測試，讓工程師只寫提示詞，不直接寫代碼，在自己的代碼庫里測試，結果發現人和人之間的差距非常大。這個差距，不是編碼能力的差距，而是知識體系、思維建構的差距。

你的知識體系越完善，每天攝入的知識越多，這些知識在你的記憶宮殿里形成的結構越清晰，你給 Agent 的提示詞就越精準，Agent 的表現就越好。

駱軼航：我突然發現，AI 時代，這件事是沒法教的。你的 Agent 長什么樣，你給它什么樣的提示詞，取決于你的算力、參數、預訓練方式、上下文記憶、RAG，每個人都不一樣。

呂騁：確實沒法教。這就跟帶小孩一樣，父母能做的就是身體力行示范、孜孜不倦溝通，不能打罵，只能慢慢引導。Agent 也一樣，你說一遍它不一定聽，有時候記不住、明知故犯，甚至反著來。

你需要每天對它進行強化學習，就像養小孩、養狗一樣。狗前兩到四個月就定型了，后面很難糾正，Agent 也一樣，你對它的約束能力越高，要求它“別干什么”就越難。

駱軼航：我前兩天和 Claude 探討，為什么給它的上下文一多，結果反而更糟。我問能不能用技能約束上下文，它說“你的技能本身就是上下文”，我當時就懵了。

我也做過一個實驗，覺得自己提示詞寫得不好，就用所有模型，從最快最小的開始，一路用到最頂層的模型，設計了一個游戲。讓最頂層的模型產出一個大師級提示詞，讓 Codex 一看就能執行，結果和我要求的完全一樣。中間經過很多層，每一層模型的知識水平都比下一層高。

我用最簡單的自然語言描述需求，第一層模型翻譯成 Markdown 提示詞，再轉給更好的模型，一路篩上去。最后 GPT-4.5 輸出的 prompt，和我當初說的“人話”相比，差距大到讓人振奮。這個差距，就是文化和知識積累帶來的。

駱軼航：所以 AI 時代，人類最后的護城河，就是文化和審美？

呂騁：對。三年以后，AI 可能不再需要人類的指導性輸入，每個模型都能解決普通人 99.99%的問題。到那個時候，用戶真正會為什么買單？就是審美。就像服裝，所有人穿不暖的時候，只強調功能性。等大家都穿暖吃飽了，核心就是舒服和審美。AI 能解決功能問題，但沒法替代你對世界的理解，沒法替代你的文化積累和審美判斷。

我之前有個激進的觀點，AI 市場可能未來三年就打完了，就是 AI 不再需要人類給予指導性輸入的節點。到那個時候，人和人的差距，就全在文化和審美上。哪怕知識層面打平了，誰能在文化上有更有創造力的指導，形成有效的約束落在 Agent 上，最終產生的差距就會很大。沒有文化，你的 Agent 就是廢的。

駱軼航：我最近有個很惶恐的經歷，用 AI 寫了一篇五六千字的文章，從和 Claude 討論到發稿，只用了五十分鐘，結果文章爆了。很多人說我想得很深，但其實我想得很草。觀點框架是我的，但細節不是，我甚至不知道礦機技術發展到哪個階段。

那些讓文章“火”的點，到底歸我還是歸 AI，我分不清楚。我唯一覺得自己還有用的，就是建構敘事的能力，找到不同事物之間的強關聯，這個能力目前還沒被 AI 取代。

呂騁：這就是最核心的東西，建構敘事、文化審美，這些都是 AI 沒法替代的。以后，AI 能幫你做所有執行層面的事，但“你想做什么”“你想要什么樣的結果”，還是取決于你自己的文化和審美。

我們這一代很幸運，站在從模擬時代到數智時代的轉折點，承前啟后。而我們能做的，就是堅守方向，給 AI-native 的一代，做出他們想要的計算設備，同時守住人類最后的護城河。

駱軼航：今年是電子計算機誕生 80 年，也可能是新的“Macintosh 時刻”，你覺得 rabbit 能抓住這個機會嗎？

呂騁：我們希望能。歷史當下可能無法判斷對錯，但我們希望回頭來看，我們是走在時代前面的。我們接受創業的風險，也堅信自己的方向，繼續努力，給大家奉獻更好的產品，給 AI-native 的一代做出他們想要的計算設備。

駱軼航：好，非常感謝 Jesse 今天的分享，也期待 Cyberdeck 的正式發布，期待 rabbit 能在 AI 硬件的賽道上，走出一條不一樣的路。

呂騁：謝謝，也期待之后和大家再分享更多新進展。

點個“愛心”，再走吧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.