![]()
新智元報道
編輯:好困 桃子
【新智元導讀】40克AI眼鏡變身Agent之眼,數字分身定制分身。當Agent爬出屏幕走進物理世界,這場關于生產力的降維打擊,真的不只是說說而已。
這幾個月,硅谷和中文AI圈都在流傳一個心照不宣的暗號,「養龍蝦」。
一個Agent,7x24小時不睡覺,自主開瀏覽器、寫代碼、抓數據、交付成果……
![]()
這些「龍蝦」一度被視為未來的生產力神話,然而,它們所有的演進路徑,都指向同一個終點:
怎么在一塊屏幕里,把活干得更猛一點。
所謂的「AI員工」,本質上是一個被釘死在屏幕背后的同事。下一代Agent,究竟該如何突破玻璃的束縛?
4月15日,廣交會開幕當天,有人試著把這道坎跨過去。
一副40克的眼鏡;一顆裝進機器人腦袋里的「超腦」;一個能跨設備接力干活的桌面搭子;再加上底層重新升級的AstronClaw平臺,整套「Claw全家桶」一次性砸了下來。
![]()
佩戴訊飛AI眼鏡的多模交互場景
干這件事的是訊飛。
所有這些硬件、軟件、模型、平臺的更新,都指向了同一件事——
把Agent從屏幕里拽出來,讓AI真正觸手可及!
這一次,「龍蝦」沖出了屏幕
要做到這一點,第一步,是先給「龍蝦」一副能夠看見世界的身體。
硬件,才是Agent走出屏幕的第一道門。
訊飛AI眼鏡:Agent有了眼睛
訊飛翻譯硬件家族里最輕的那一塊,是一副眼鏡。
訊飛AI眼鏡整機,僅40克。
作為全球最輕的雙目單色顯示多模態眼鏡,它比市面主流產品(50克以上)減重約20%。
重量只是入場券。訊飛AI眼鏡搭載的GlassClaw,才真正改變了Agent的輸入方式。
你看到什么,它就能識別和理解;你聽到什么語言,它就實時翻譯。
![]()
跨語言方面,中英首響快至2秒,AR翻譯目光鎖定2秒就能自動出譯,加上18個離線語種,基本覆蓋了廣交會這種跨國采購場景的剛需。
更硬的技術活,藏在降噪方案里。訊飛AI眼鏡首創了「唇動識別」多模態降噪方案,靠5+1麥克風陣列加骨傳導,最遠拾音距離8米。把聲源定位從「聽哪個方向」變成「看誰的嘴在動」。
發布會現場,新華社記者徐弘毅戴上訊飛AI眼鏡,在科大訊飛展臺跑了一段相當能打的實操。
展臺老師在講解訊飛AI翻譯耳機時,訊飛AI眼鏡同時捕獲語音和圖像。多模態數據傳到AstronClaw,然后給徐弘毅補上了一段背景——
這款耳機是全球首款骨導加氣導的開放式專業翻譯耳機。
去年在上海和迪拜兩地同步發布,當時還做了一場跨國翻譯電話演示。
![]()
最關鍵的環節在最后。徐弘毅扶了一下眼鏡,說了一句話——
「根據我剛剛逛展的過程,生成相關素材發送到微信」。
GlassClaw把展區一路看到、聽到的內容整理成圖文素材,發到了展臺工作人員的微信里。從看到、認知、理解、思考到輸出,一口氣搞定全流程。
![]()
當Agent的輸入從屏幕里的文字,變成眼前的真實世界,人機交互的范式就被重寫了。
Agent不再需要你一字一句地把世界描述給它聽,它自己就能看。
Claw直控機器人,送咖啡熱舞震撼
如果GlassClaw是Agent的眼睛,Claw就是Agent的神經中樞。
主持人直接在AstronClaw下達一句指令:Guide 01,給我送杯咖啡。
![]()
然后,AstronClaw操控訊飛Guide 01機器人,提著咖啡慢慢走向臺前,遞給了主持人。
![]()
更驚艷的還在后頭。Guide 01把舞臺交給了它的「WallEX」和「小弟Nova」。
其中,WallEX是升級了Claw能力的智慧家居中控屏。Nova是配套氛圍燈,會根據場景自動調色,主打家居里的浪漫氛圍。
現場,機器人用一支舞,把這一組合的感染力瞬間拉滿。
![]()
這次Claw接入Guide 01,瞄準的是機器人行業一個老大難:語音交互和動作執行嚴重割裂。
過去機器人聽懂一句話和做成一件事之間,隔著一層厚厚的代碼。
一句簡單指令往往要被拆成一連串動作,稍微復雜一點開發成本就指數級往上竄。
Claw打通了這一層。
它把AstronClaw的任務編排能力、訊飛機器人超腦平臺、星火大模型、多模態交互技術深度融合,跑出的是一條完整鏈路:
自然交互理解 → 多傳感器融合 → 自主任務規劃 → 物理端執行
通過「軟硬一體」模組的形式,任何機器人廠商都可以快速集成。
這等于給整個行業交了一份標準答案。機器人廠商不用再自己啃Agent這塊骨頭,Claw就是一個即插即用的Agent大腦模塊。
家居場景的智能終端怎么接進Agent生態,訊飛給的答案和機器人是同一個,都接進同一套任務編排和上下文里。
「眼睛」和「手腳」都有了,Agent已經能看、能動。
但真正要把活干完、干好,還得有一套能把任務串起來、記得住上下文的軟件中樞。
它叫AstronClaw。
聊天框裝不下的活,AstronClaw接住了
過去的AstronClaw更像一個能干的網頁助手,在瀏覽器里派活,云端把活干完。
這套「養龍蝦」模式3月上線之后迅速跑通。訂閱從16.8元/月起步,企業級Agent的門檻被壓到了一杯咖啡錢。
這里順帶說一件事。開篇提到的那個OpenClaw,中國信通院4月剛出了一份《OpenClaw類智能體部署風險管理指南》。行業開始給「養龍蝦」這件事劃安全底線了。
最重要的是,科大訊飛成為首批通過自檢的廠商之一。
這在一定程度上證明了AstronClaw在安全架構、任務執行隔離、數據處理規范等方面,已經具備了進入企業核心場景的能力。
不過,聊天框有聊天框的天花板。
一個任務從手機切到電腦再切到會議室,Agent就斷片,每次交互都是一次重新開始。這是所有對話界面智能體繞不開的坎。
這一次,AstronClaw的升級,直接動了底層架構。
第一刀砍在端云協同。
復雜任務不再綁在單一設備上,云端負責思考和規劃,終端負責現場執行。
一個任務從辦公本發起,可以在手機上繼續推進,再推到電腦收尾,換設備不斷片。
第二刀砍在跨端記憶同步。
Agent記得自己走到了哪一步,也記得你上次提過什么要求。
用訊飛自己的話說,這是「像接力賽一樣持續推進」。Agent從一次性聊天,變成了一條不會斷的任務流。
還有一刀砍在生態接口。
硬件連接協議這次一起開放,不同類型的智能設備都能快速接入AstronClaw。前面那只機器人和那副眼鏡,背后跑的就是這套協議。
目前,訊飛把第一臺跨設備接力的Agent裝在自家辦公本X5上。
發布會上,主持人對辦公本說一句話,剛才在AstronClaw云端生成的逛展攻略和個人行程就同步了過來。
![]()
Loomy:上傳一張照片,造一個數字分身
AstronClaw是云端那只龍蝦,Loomy是鉆進你電腦里的那只。
3月發布的Loomy已經跑通了基本能力。目錄級隔離讓AI不越雷池半步。
QQ、飛書、釘釘、微信四大IM接入,手機就是遠程控制臺,首發期贈送積分,新用戶無門檻就能上手。
![]()
這一次的升級,Loomy要從桌面工具變成長期協作伙伴。
會議中自動整理紀要、安排日程、跟進任務進度這些事,從「你得打開軟件操作」變成了「你開口它去做」。
更有趣的,是這次新加的Buddy。
只需上傳一張照片,加一段極具個人性格特色、工作風格的文本描述,就能量身定制一個外貌、風格相似的數字分身。
它可以成為你的「工作搭子」,更懂你自己,并處理一系列工作任務。
這不,現場主持人萬里懟臉演示「萬里Loomy」全程搭建過程,她把自己平時一些特點扔給Loomy:
喜歡回復111、不喜歡拖拉、做事責任感強、容易焦慮憤怒
它會調用soul-creator技能,把萬里的說話風格、特點、價值觀寫入soul檔案中,最終生成一個萬里Loomy。
![]()
接下來萬里現場出了個考題:「領導開會三四十分鐘還沒進入正題,怎么打斷?」萬里Loomy一口氣給了五個高情商方法,最后一條是「實在不行就忍」。另一位主持人馬高聽完插了一句「咱倆共用一個老板」,全場笑場。
這就是Buddy「懂你」的真實樣子,它給你的不是一個標準答案,是一個像你自己會寫的答案。
![]()
![]()
而且,在Loomy中可以創建多個Buddy,處理各種各樣的工作任務。
比如,訊飛劉慶峰董事長沒來現場,讓已創建好的劉總Buddy,以其風格生成一段40s發言,給現場打打氣。
這種真實感,只能用「震撼」形容。不僅聲音像素級還原,竟連演講中標志性語調、鼓舞風格都與劉慶峰本人如出一轍。
合成語音里那句「用人工智能建設美好世界的使命」,全場靜了幾秒。
有了Loomy數字分身,真正的需求還是讓它去完成手里的案頭工作,比如PPT、視頻、宣傳文案。
現場,萬里Loomy一口氣調用了三個原生Skill,把廣交會的案頭活全清了——
智文Skill寫了一份廣交會復盤PPT。據現場介紹,智文Skill的原生應用已經突破1000萬用戶。
智作Skill做了一條圍繞訊飛AI眼鏡的宣傳視頻,用的是萬里自己的數字分身做出鏡。
繪文Skill寫了一篇廣交會的報道文章,并在兩個第三方自媒體平臺預發布等待審核。
可以看到,以上這些都是「通用型」案頭任務。在廣交會上,最典型的還是采買任務。
招采Claw抓出圍串標,陪練AI賽博實戰
別急,這里就輪到企業級智能體出場了。
最重要的「招采Claw」,深度融合了AstronClaw、SkillHub和招采知識庫的招采助手。
發布會上,主持人把整套招采文件一口氣全部上傳,招采Claw自動調用文件解析Skill。
它先把復雜標書規整化處理,方便后面定位每一處細節。然后像專家一樣,開始檢測圍串標風險。很快抓出兩家公司的標書里用了同一張圖片,判定為圍串標,取消兩家資格。
![]()
![]()
![]()
接下來是資質評審。招采Claw發現一家公司的工程資質是乙級,但招標文件明確要求甲級,排除。
最后兩步,是初評和復審。招采Claw這里沒有派單個Agent上場,而是拉起了一個Agent Team。
每家入圍企業分配一個子Agent專門跟進,主Agent負責統籌。復審環節再細分。
業績評審、施工組織、項目團隊、環境保護各派一個專精Agent,互不干擾、并行推進,最后由主Agent合稿出報告。
![]()
可不要小瞧這一過程。發現相似圖表、資質不合格等細節,以往要耗費多位專家時間和精力。招采Claw把專家從繁瑣活里解放出來,時間花在決策、談判、把控風險上,效率成倍提升。
這是Agent Team多智能體協同第一次跑在一個真實的企業級場景里,也是這次發布會最炸的賣點之一。
職場中,通常對打工提出了更高的要求:深諳行業各種know-how,成為多技能人才。
這不,陪練skill,企業員工專業培訓的「賽博老師」能救你。
它調用了「星火陪練」的技能,與Claw一起生成一個真實的模擬場景。
主持人在「招采討價還價」的模擬里挑了個獨家供應商「何總」,十幾年經驗,一上來就咄咄逼人。
![]()
兩輪交鋒下來,最終以8%讓價、60天賬期、合同寫最低采購量收尾,AI給的成績是90分。
![]()
評審報告還按節奏掌控力、風格控制力等維度給出了詳細分析。
![]()
招采陪練做的是新人訓練。AI模擬供應商和采購員對話,把幾個月實戰壓縮成幾十輪對話。
SkillHub:企業技能的「軍火庫」
以上提到的陪練Skill,這么多訊飛Skill可以在哪里用得上?
它們全部都放在了技能倉庫—— Astron SkillHub中。它是管理AI技能的「企業版NPM」,國內首個企業級自托管的開源技能平臺。
![]()
技能、數據、日志都留在企業自有環境里,數據主權完全在自己手里。
企業里真正值錢的東西,往往是資深員工踩過坑沉淀下來的prompt、腳本文件以及工作流。
這些東西過去散落在聊天記錄、筆記和模板文件里,人一走,流程也跟著走。
SkillHub做的就是把這類工作流打包成版本化、權限化、可審計的技能,存進公司的私有倉庫。
新員工一個命令就能調用。
到現在,SkillHub上的開源Skill已經超過3000個,由海內外開發者共同維護。
生態兼容性上,SkillHub完全兼容ClawHub CLI協議。一次發布,AstronClaw、OpenClaw、Loomy都能一鍵下載、安裝和調用。
到這里,「Claw全家桶」的全貌已經擺出來了——
GlassClaw在物理世界負責感知和執行,WallEX覆蓋家居場景; AstronClaw在云端調度任務,Loomy在桌面當協作伙伴和數字分身,SkillHub把企業的技能資產沉淀下來。
市面上,幾乎所有廠商都在說自己軟硬一體,但真能做到的沒幾家。
原因很簡單,「堆料」不難,難的是往下打得穿。
訊飛的差異化不是「做得全」,是「每一層都是自己的」。
從自研大模型、自建平臺、自造硬件、自養開發者生態,這四件事但凡缺一件,這根主干就斷了。
眼睛看到的、手腳執行的、桌面協作的、企業沉淀的,最后都要匯到同一個大腦里。
而能不能匯得通,答案全在底座。
標王連莊,靠的是十六年家底
說了這么多,最終所有的線索都指向了一個必須回答的問題:憑什么是訊飛?
先上數據。2025年全年,訊飛拿到了210個中標項目,23.16億中標金額。數量和金額兩項都是第一,蟬聯2025年大模型「標王」。
也就是說,訊飛一家的中標金額,大幅超過了榜單上后面幾家披露金額的總和。
更關鍵的是分布。教育、醫療、金融、通信、能源、政務六大行業全線覆蓋,80%以上是應用類項目,真正落地到了企業業務流。
數字背后是具體的項目。
訊飛拿下了安徽省人工智能應用中試基地,深耕醫學垂類模型,承擔全省試點的那一環。
國家能源集團用「OCR+星火大模型」打造智能無人評審系統,率先在非招采購全類別、全方式的業務跑通。
西安鐵路通過星火知識庫與訊飛智文,將大模型能力平替進大基建基層的日常辦公流。
尤其要拎出來說的是美團。基于星火大模型的AI文案和AI腳本,已經在旗下多個產品上線。這一條的分量不在于單子大小,在于客戶是誰。一線C端互聯網大廠接入訊飛的大模型底層,是客戶光譜里的新面孔。
而所有這些項目背后,是一個從2010年長起來的開放平臺。
截至2026年3月31日,訊飛開放平臺已經沉淀1074萬開發者團隊、931項AI產品、403萬應用、43.1億臺終端設備。十六年家底。光星火發布以來就新增664萬開發者,大模型相關開發者253萬。
能做Agent生態整合的公司不止一家。但能把生態、模型、硬件、落地經驗全部湊齊的,沒幾家。
當龍蝦走出聊天框
當Agent有了眼睛、耳朵和手,它要解決的問題就變了。不再是「如何回答得更聰明」。是「如何把事情真的做完」。
一年前,AI圈剛開始流行養龍蝦的時候,沒人說過龍蝦有一天會爬出魚缸。
現在它爬出來了。
下一個問題不再是它能不能替人干活。是它走到哪家工廠、哪個會議室、哪個展臺,就會先改變哪里。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.