![]()
本文來自微信公眾號:字母PRO,作者:李炤鋒,編輯:王靖,題圖來自:AI生成
過去一年,AI硬件的主戰場不再只是“把大模型塞進手機”,而是開始爭奪更底層的東西:人們到底要用什么形態去接觸AI。
在這一過程中,誕生了許許多多的AI硬件產品,從AI耳機、AI眼鏡、AI手機到AI錄音筆、錄音卡片等。
一邊是無屏的、可穿戴的“新物種”,一邊是繼續以屏幕為中樞、把AI寫進系統底座的傳統終端升級。
我們把前一條路線統稱為“筆”:它不是指具體外形,而是泛指輕便、隨身、低存在感,以音頻/環境感知為主輸入,通常不帶有屏幕的AI硬件。
“筆”最激進的樣本,早在2024年就有人做過。Humane在那一年推出AI Pin,它被定義為可夾在衣服上的“可穿戴電腦”,主打讓用戶擺脫智能手機。
不過,該產品因延遲高、投影不可視、應用生態匱乏等問題遭遇大量差評,最終僅獲得約1萬筆訂單;Humane隨后也被惠普收購。
相比之下,更務實的“筆”正在從窄場景切入。以Plaud、釘釘A1、飛書錄音豆為代表的AI錄音硬件,強調會議、采訪等明確場景,通過隨身采集語音,再由大模型完成轉寫與總結。
這一方向的想象力,如今在OpenAI身上被進一步放大。
OpenAI已確認與前蘋果設計負責人Jony Ive展開硬件層面的合作,項目瞄準一種不同于手機與PC的新型AI設備,強調更自然的交互與更低的存在感,目前已知形態也被形容為“像一支筆”。
與“筆”并行的,是仍以屏幕為中樞的另一條路線。微軟將Copilot+PC定義為新一代PC形態,并明確提出NPU算力門檻;Meta和各大手機廠商則持續在眼鏡、手機等終端上強化AI與顯示、系統的深度融合。
如果把這些現象放在一起,會看到一條清晰的分岔:新銳AI公司更愿意押注“筆”——無屏、貼身、輸入優先;傳統互聯網/硬件公司更愿意押注“屏”——在既有形態的產品上,延伸顯示、系統與生態能力。
顯然,面對AI硬件這一品類,行業內已經出現了對交互成本、技術成熟度與商業化路徑的不同押注。
一
2025年,在一次公開對談中,OpenAI CEO奧特曼形容當下的數字生活“就像走在時代廣場”。
他表示,信息、推送和屏幕不斷爭奪注意力,而他們正在探索的AI硬件,目標恰恰相反——“更平靜(more calm),更少打擾(less distracting)”。
事實上,這一理念并不新鮮,卻在近兩年被重新提起。與其把AI塞進手機或PC,不如退回到更基礎的一層:先感知和連接世界本身。我們把這類設備概括為“筆型AI”——輕、貼身、低存在感;在產品邏輯上,它們的感知優先級高于操作。
從行業視角看,當下概念中的“筆型AI”,并不在于替代手機或PC成為新的硬件入口,而在于爭奪個人與組織的第一手輸入權:語音、環境、視角,在相對無感的前提下,讓AI能夠持續接收并處理信息。
不過,在這一理念驅使下,過去幾年中卻未能孕育出成功打開市場的產品。
時間回到2024年,Humane推出的AI Pin、Rabbit的R1,都試圖成為“脫離手機的AI終端”,用語音或環境感知完成即時響應,甚至跨應用執行任務。但最終,這些產品都反響平平,未能打開市場。
體驗差是最直接的結果。科技評測人Marques Brownlee在評測AI Pin時直言:“這是我評測過最差的產品之一——不是因為想法,而是因為它現在根本不能用。”
另一層原因是,當時端側算力還無法支撐復雜推理,大多數無屏設備延遲與中斷頻繁。《華爾街日報》科技專欄作家Joanna Stern在對比體驗多款無屏AI設備時寫道,Humane AI Pin與Rabbit R1“更像科學項目,而不是成品”。她還在視頻測試中記錄到,Rabbit做一次“實時翻譯”用了四分鐘。
業內對端側算力的衡量標準之一是NPU(神經處理單元)性能。IDC等機構認為需超過30TOPS才基本滿足大語言模型推理能力,但截至2024年初,只有少數SoC達到這一門檻,如高通驍龍8 Gen 3與蘋果A17 Pro等。
而在一些更“垂”的場景里,“筆型AI”的定位迅速收縮,以記錄優先的一批AI產品陸續面世。在中國市場,這種變化體現得尤為明顯,例如釘釘推出的A1錄音卡片,以及飛書與安克合作的AI錄音豆。
在海外市場,也出現了類似取向的產品,如Plaud的Note Pro。這類設備更關注把碎片化的語音、會議內容和環境音轉成可檢索、結構化的語料,而不是即時對話或執行任務。
a16z投資的AI硬件公司Limitless(前Rewind)也走向了類似取向。其創始人Dan Siroker在接受采訪時曾表示,他們“不是在做第二臺設備,而是在做記錄對話的基礎設施”。
不過,當“筆”的外延繼續擴展,矛盾也隨之升級。近年來,一些團隊開始嘗試把攝像頭引入耳機或頭戴設備,希望獲得更自然的第一視角輸入。這既意味著電池與算力需要重新分配,也在社會層面引發了對隱私邊界的擔憂。
技術分析師Avi Greengart在討論AI可穿戴趨勢時指出,消費者對隱私的期待“并沒有消失,但確實在發生位移”。人們愿意為便利讓渡部分邊界,卻仍對“被持續記錄”保持警惕。
也正是在這種背景下,OpenAI與Jony Ive團隊的硬件項目被視為“筆”的最大變量。OpenAI全球事務負責人Chris Lehane曾對外確認,公司計劃在2026年下半年展示首款硬件設備,其關注重點并不在顯示,而在更自然、更克制的環境感知。
Ive曾主導iPhone 4,開啟并定義了上一個智能手機時代。但在其設計生涯中,另一個被反復提及的產品是更簡單、克制的iPod。也許在未來OpenAI的硬件上,我們還能看到iPod的影子。
拋開Ive的“執念”,“筆型AI”更像AI時代的傳感器層。它不直接替人做決定,以感知為第一優先級,進而再驅動用戶的交互。但在一些以交互為先的場景中,“屏”的重要性似乎又不可替代。
二
與“筆型AI”試圖降低存在感不同,有屏的硬件陣營——不管是傳統的PC/手機,還是新銳產品——都在過去兩年中積極擁抱AI。
這條路線的分水嶺,可以說出現在AI從“應用能力”轉向“系統能力”的時刻。
2024年5月,微軟發布Copilot+PC,號稱是一次AI在操作系統層面的重構。官方文檔中指出,新一代Windows設備需要配備算力達到40+TOPS的NPU,部分AI能力將以“系統原生”的方式運行,而非通過獨立應用調用。
![]()
這一設計,本質上是在把AI融入到硬件的系統層。微軟消費業務負責人Yusuf Mehdi在發布會中直言,這是“重新定義Windows電腦”的一次調整。
類似的邏輯,也出現在手機端。無論是蘋果、三星,還是小米、vivo等國產廠商,近年來都把AI能力直接下沉到系統層。
這表明在AI時代,屏幕仍然是信息展示、交易確認和權限授權的中樞。AI加持下的智能手機,擁有了與超級App爭搶“第一入口”的資本。
以字節此前與中興聯合推出的豆包手機助手為例,其定位并不是獨立應用,而是深度嵌入系統交互流程,參與搜索、寫作、日程、通知等多個環節,并通過系統級入口重新分配用戶與信息、服務之間的關系。
當AI進入系統層,首先就被互聯網時代的同行視為“洪水猛獸”。早在2024年,微軟推出Recall功能,嘗試通過周期性記錄屏幕內容,幫助用戶事后檢索信息。這一功能在發布初期即引發巨大爭議。
通信應用Signal率先公開反對,指出Recall在設計上未給予應用足夠的控制權,系統級截圖機制可能捕捉加密通信界面。隨后,一批工具宣布默認屏蔽Recall。
一年后的豆包手機助手上,類似的場景再次上演。社交、電商、金融等領域的頭部企業,其旗下App紛紛屏蔽豆包手機助手。
可靠性,成為智能手機推進AI進化節奏的重要影響因素。去年,蘋果宣布將原計劃推出的Siri AI功能推遲至2026年。拋開蘋果自研模型水平落后這一原因,蘋果官方曾回應稱,這些功能尚未達到預期的可靠性標準。
在隨后的采訪中,蘋果全球市場負責人Greg Joswiak曾表示,蘋果不希望用戶接觸到“表現不穩定的系統級能力”。而根據最新消息,蘋果計劃讓新版Siri使用由Google Gemini驅動的基礎模型,以提升語義理解與對話能力。
新版Siri能否進一步推動手機AI的邊界,仍需等到正式發布的那一天。
把視角轉向AI眼鏡,屏型路線的特征被進一步放大。眼鏡成為手機等終端屏幕形態的延伸,把信息展示轉移到用戶視野中。
Meta與Ray-Ban合作的AI眼鏡率先打開了市場,首先在語音、翻譯和基礎視覺理解等功能上跑通日常使用頻率,隨后在二代產品中引入光波導技術。而在Meta之前,Rokid、雷鳥、阿里夸克等企業也先后推出了帶有光波導可視技術的AI眼鏡。
不過,相比上一輪以“無顯示”為主的AI眼鏡,可視AI眼鏡在工程層面臨的挑戰并未緩解,反而更加集中地暴露出來。
Meta首席技術官Andrew Bosworth在談到Orion原型時直言,顯示部件的良率“糟糕得難以想象”。換言之,想要成為新時代的AI終端,AI眼鏡仍有不少工程問題有待突破。
事實上,在當前技術路徑中,光波導幾乎是唯一能夠在保證視野通透的同時,將信息疊加到現實世界中的方案。不過,直到今天,光波導的規模化量產仍是一個尚未解決的工程難題。
另一方面,技術路線的高度同質化,也影響著一些廠商對AI眼鏡的態度。近期,業內一些傳聞又指向了字節將在近期發布AI眼鏡。但據XR Vision工作室推測,這款產品或將不會發售,字節或將直接開啟下一代產品的研發。
XR Vision的這一推測,源自當前AI眼鏡賽道“硬件同質化、功能趨同”的普遍困境,正如行業內對vivo暫停AI眼鏡項目的評論所言,當下大廠在該賽道普遍謹慎,核心原因正是“很難做出差異化”。
在技術迭代需要更多時間的一背景下,屏型AI更像一場耐力賽。不管是AI手機還是AI眼鏡,都需要操作系統、硬件門檻和生態的持續整合。
三
拆解使用邏輯后,你會發現“筆”和“屏”并不是同一條路。想象一個很日常的場景:開會時,你只想把人說的話完整記住;散會后,你需要把重點寫進紀要、把任務派出去。在AI交互層面,前者需要“感受和采集”,后者需要“操作和訂正”。
是否讓AI參與決策,成為這場AI硬件分化背后的重要原因之一。有些場景可以不涉及決策、先行感知,但一旦進入決策環節,交互邏輯就完全不同。
為什么“決策”必須更謹慎?復雜系統研究者梅拉妮·米切爾曾在采訪中表示,生成式模型容易在不同情境下表現出脆弱性與自相矛盾,因此人類必須保持監督與編輯的角色。
翻譯成更直觀的話就是:模型可以幫你推進流程,但人必須能夠監控這個過程,并且隨時介入和把控。這正是有屏AI硬件不可替代的一面。
在學術界,有一個概念被稱為“自動化偏差”——人們傾向于相信系統給出的建議,哪怕自己隱約覺得不對。
早在2000年,美國的一項實驗研究《問責機制與自動化偏差》就指出:當參與者被要求對整體表現或決策準確性“承擔責任”時,自動化偏差的發生率會下降。在AI時代,這意味著一旦結果需要追責,人就更需要一個可確認、可校驗的界面,而這恰恰是“屏”最擅長承擔的部分。
因此,“筆”與“屏”的路線之爭,本質上是AI硬件所對應場景分化的結果:貼身設備“筆”更像“感知與記憶外設”,負責持續采集信息;屏幕終端更像“編輯與執行中樞”,強調任務的持續交互與可追蹤性。
不過,考慮到技術層面的不斷進化,“筆”的價值也許會在更長周期中體現出來。
全天候的理解和感知,使“筆”形態能夠為AI提供長期語料與上下文。換言之,建立在持續感知之上的技術,未來的“筆”可能會比“屏”更懂用戶。“筆”更契合AI時代的長期記憶,“屏”則更像一個工作臺。
斯坦福人類中心AI研究所曾提出,將人類與AI的交互設計放在算法核心,是確保系統可用且可信的關鍵,強調“算法不只是輸出結果,更要考慮人類如何理解與使用這些結果”。
本質上,“筆”和“屏”只是代表了這一邏輯中的兩種優先級選擇:是優先“長期記憶”,還是優先“即時反饋”。
新銳AI公司希望跳出傳統交互邏輯,通過新的產品形態塑造新場景與新需求。這也是為什么在AI Pin失敗之后,業內仍愿意期待OpenAI無屏方案的成果。
而在ToB領域,越來越多公司已經不再試圖用一臺設備“包辦一切”。Plaud、釘釘、飛書將AI硬件定位為語音入口,已經在垂直場景中驗證了“持續感知”的可行性。
事實上,“筆”和“屏”從來都不矛盾,它們更像產品設計中“不可能三角”的兩端:無感與便攜、可視與信息處理,以及穩定輸出所需的續航與算力支持。
換言之,AI硬件對未來的定義不止一個。“筆”和“屏”陣營的邊界,或許會隨著技術迭代逐漸模糊。但在當下,“筆”形態的超級入口尚未真正出現,通用AI在短期內仍離不開傳統手機等“屏”設備作為算力終端。
它們最終究竟是替代還是協作的關系,AI企業與傳統硬件企業,或許會在未來兩年內給出答案。
本文來自微信公眾號:字母PRO,作者:李炤鋒,編輯:王靖
本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4834979.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.