網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

李未可：一副眼鏡和一個(gè)AI Agent生態(tài)系統(tǒng)

2025-06-20 16:52:12　來(lái)源: 87870網(wǎng)

北京舉報(bào)

分享至

“李未可源自于我們對(duì)于AI的相信。”

在日前的發(fā)布會(huì)上，李未可CEO茹憶開(kāi)場(chǎng)就用一句話，為大家解開(kāi)了縈繞在這家創(chuàng)業(yè)公司身上的謎團(tuán)。也向業(yè)內(nèi)宣布，李未可是在這個(gè)行業(yè)中，與眾不同的玩家。

縱觀熱鬧的“百鏡大戰(zhàn)”，無(wú)論是波導(dǎo)還是BB，主流廠商普遍將顯示能力作為產(chǎn)品差異化的核心路徑。但在這片逐漸同質(zhì)化的紅海中，李未可科技給出了截然不同的答案：

李未可要做的，不是“加了AI的眼鏡”，而是用AI構(gòu)建硬件生態(tài)。

這不只是產(chǎn)品設(shè)計(jì)上的區(qū)別，更是技術(shù)路徑、思維方式的巨大區(qū)別。通過(guò)對(duì)過(guò)往產(chǎn)品路徑的拆解和茹憶的采訪，我們也更加了解李未可的“AI-first”。

不是“加AI的硬件”，而是“為AI構(gòu)建的終端”

李未可創(chuàng)始人茹憶在發(fā)布會(huì)上表示：“AI是工具的覺(jué)醒，而我們相信最貼近人的交互入口，是眼鏡。”

這句話可以說(shuō)是“開(kāi)宗明義”，包含了李未可推出產(chǎn)品的出發(fā)點(diǎn)。

一方面，我們目前看到所有李未可的產(chǎn)品都來(lái)源于讓AI“飛入尋常百姓家”。

比如，不管是Meta Lens還是City Air，李未可都不會(huì)在其他方面過(guò)多糾結(jié)，而是把重量做的足夠輕，戴起來(lái)完全和普通眼鏡沒(méi)區(qū)別；把續(xù)航做得足夠久，上下班通勤，幾天一充都沒(méi)問(wèn)題；把所有小功能做到足夠“精”，180多種語(yǔ)言，嘈雜環(huán)境依然準(zhǔn)確……再給你一個(gè)擊穿底價(jià)的價(jià)格。

從形態(tài)到重量都“輕盈”的City Air

顯而易見(jiàn)，實(shí)用、易得。

形而上來(lái)講，為了讓AI更好的落地，他們反推交互方式、芯片架構(gòu)、重量控制乃至使用場(chǎng)景，最終形成AI能力的物理化體現(xiàn)與場(chǎng)景化承載。

另一方面，李未可除了讓智能眼鏡作為AI的“宿主”之外，還決定自研大模型。

首先，有一個(gè)不容忽略的問(wèn)題是，從實(shí)用、易得到讓每個(gè)人都覺(jué)得“好用”中間還隔著一道天塹。如果你問(wèn)一個(gè)普通消費(fèi)者，TA期待的AI眼鏡什么樣，TA都至少會(huì)回答你，有個(gè)萬(wàn)能的AI助手。

要實(shí)現(xiàn)萬(wàn)能的難度是指數(shù)級(jí)增長(zhǎng)的，畢竟人類就是一個(gè)會(huì)在凌晨?jī)牲c(diǎn)搜索“畢加索是不是大小眼”的生物，你很難預(yù)測(cè)他們?cè)谧呗返臅r(shí)候會(huì)不會(huì)問(wèn)出“剛才我原地投籃拋物線的曲率是多少”這種問(wèn)題。

在這個(gè)難度級(jí)別上，如果再去接入第三方的通用AI大模型，那就會(huì)離最終“好用”的目標(biāo)越來(lái)越遠(yuǎn)，所以自研大模型就顯得非常必要。

同時(shí)，這其中也包含著李未可的野心。雖然大模型在C端早已家喻戶曉，但真正“讓普通用戶天天用得上”的AI原生應(yīng)用，至今仍未大規(guī)模爆發(fā)。ChatGPT發(fā)布之后，許多廠商將AI作為產(chǎn)品賣點(diǎn)加入眼鏡、耳機(jī)、手表等終端，但真正“有黏性、反復(fù)使用、高頻依賴”的功能場(chǎng)景仍然比較稀缺。

李未可科技選擇正面迎戰(zhàn)這個(gè)難題。它不是將AI功能“平鋪展開(kāi)”，而是從用戶實(shí)際使用路徑出發(fā)，把AI功能濃縮為四個(gè)高頻場(chǎng)景型能力：AI隨時(shí)譯、AI 隨身記、AI隨地游、AI隨心聽(tīng)。

在之前的測(cè)評(píng)中，李未可的AI能力就已經(jīng)很強(qiáng)了

為了支撐這種AI原生體驗(yàn)，李未可自研了WAKE-AI多模態(tài)大模型平臺(tái)，其2.0版本將重點(diǎn)放在三個(gè)維度：多模態(tài)感知與理解（語(yǔ)音、圖像、文本同步處理）、多智能體協(xié)作與推理（Agent任務(wù)拆解與調(diào)度）、邊緣側(cè)離線AI推理能力（適配長(zhǎng)時(shí)佩戴、弱網(wǎng)場(chǎng)景）。

其中最具代表性的技術(shù)架構(gòu)是“ZeroAgent”，即“零級(jí)智能體”。它不是傳統(tǒng)語(yǔ)音助手，而是一個(gè)AI交互系統(tǒng)的調(diào)度大腦，具備自主感知、任務(wù)拆解、智能體調(diào)度與結(jié)果反饋能力。

更簡(jiǎn)單來(lái)理解，這個(gè)“0”就意味著起點(diǎn)，零級(jí)智能體就是AI的女?huà)z、上帝、指揮官。

舉個(gè)例子，你在外逛街，對(duì)AI說(shuō)餓了、渴了，ZeroAgent首先會(huì)理解這是你的餐飲需求，然后把它拆分成你在哪（定位），你平常愛(ài)吃的、愛(ài)喝的（偏好識(shí)別），附近的餐廳推薦等不同的任務(wù)，分發(fā)給下面專門(mén)負(fù)責(zé)的AI助手來(lái)完成。

這樣做有什么好處呢？

與通用大模型相比，Agent分發(fā)形式更可控。跟人類工作一樣，專業(yè)的AI干專業(yè)的事，得到的結(jié)果更加透明、可信，更少出現(xiàn)突然“胡說(shuō)八道”的情況；

與傳統(tǒng)語(yǔ)音助手相比，零級(jí)智能體會(huì)先識(shí)別和拆解用戶需求的真實(shí)意圖，更加智能化；

此外，Agent形式更加自由。它就像樂(lè)高一樣，擁有許多個(gè)承擔(dān)獨(dú)立任務(wù)的獨(dú)立模塊，可以根據(jù)不同的場(chǎng)景需求自由選用和組合，這也是李未可為未來(lái)發(fā)展生態(tài)埋下的伏筆。

技術(shù)深挖，“聽(tīng)說(shuō)讀寫(xiě)”成核心落點(diǎn)

與強(qiáng)調(diào)顯示、手勢(shì)、虛擬界面的AR眼鏡不同，李未可的智能眼鏡四項(xiàng)核心功能，即隨時(shí)譯、隨身記、隨地游、隨心聽(tīng)，都圍繞AI能力進(jìn)行設(shè)計(jì)與優(yōu)化。

在主流翻譯眼鏡多采用通用ASR系統(tǒng)的背景下，李未可選擇自行訓(xùn)練自適應(yīng)模型，強(qiáng)化對(duì)小語(yǔ)種、地方口音的識(shí)別能力。目前支持180余種語(yǔ)言，重點(diǎn)覆蓋“一帶一路”國(guó)家、東南亞等區(qū)域語(yǔ)系，并已在越南、印尼、阿聯(lián)酋等實(shí)際展會(huì)場(chǎng)景中驗(yàn)證有效率超過(guò)90%。

眼鏡段播放翻譯內(nèi)容，手機(jī)端同步顯示文字

更重要的是，其翻譯系統(tǒng)支持對(duì)話、聽(tīng)譯、離線三種模式，能夠根據(jù)網(wǎng)絡(luò)環(huán)境、噪音強(qiáng)度、內(nèi)容類型自動(dòng)切換。

根據(jù)發(fā)布會(huì)展示，在會(huì)展這種人流量大的環(huán)境中，展商面對(duì)高達(dá)90分貝以上的嘈雜環(huán)境，依然可以完成多輪準(zhǔn)確對(duì)話，準(zhǔn)確率約在93%-97%。而這種準(zhǔn)確、多場(chǎng)景的能力靠的不是更好的硬件設(shè)備，而是專為“群體交互+多語(yǔ)言”的場(chǎng)景微調(diào)過(guò)的AI模型基礎(chǔ)。

隨身記也不是一個(gè)簡(jiǎn)單的“錄音+轉(zhuǎn)寫(xiě)”模塊。它支持會(huì)議錄音、關(guān)鍵詞提取、結(jié)構(gòu)化摘要、任務(wù)分派，并能一鍵生成開(kāi)發(fā)信草稿或會(huì)議紀(jì)要。

在與米奧蘭特合作的多個(gè)海外展會(huì)中，李未可眼鏡通過(guò)AI慧記、AI慧寫(xiě)幫助展商在結(jié)束展會(huì)當(dāng)天就完成了80+位客戶記錄、內(nèi)容整理等工作，極大地提高了商務(wù)環(huán)境中最需要的效率，也減少了傳統(tǒng)人工整理的問(wèn)題。

在最新的版本中，還加入了多端同步功能，同一賬號(hào)下，不同端口平臺(tái)支持實(shí)時(shí)雙向編輯，AI對(duì)話推送了多端無(wú)縫同步，進(jìn)一步提升多系統(tǒng)協(xié)作效率。

這一系統(tǒng)背后是多模態(tài)內(nèi)容捕捉、時(shí)間軸對(duì)齊、任務(wù)意圖拆解等AI能力的集中體現(xiàn)。正如李未可發(fā)布會(huì)中提到的，“我們不希望你回去寫(xiě)周報(bào)，而是你說(shuō)完話，AI就已經(jīng)替你生成周報(bào)了。”

在生活化場(chǎng)景上，李未可也進(jìn)行了深度挖掘。旗下的旅拍眼鏡View支持“拍照即解說(shuō)”，結(jié)合圖像識(shí)別、地理定位與大模型生成，實(shí)現(xiàn)博物館、景點(diǎn)、街頭建筑等自動(dòng)解說(shuō)體驗(yàn)，讓AI成為大家旅行的解說(shuō)員、好搭子。

據(jù)了解，View目前支持6800+國(guó)內(nèi)外文旅地標(biāo)，支持實(shí)時(shí)對(duì)圖文問(wèn)答、AI語(yǔ)音講解。

實(shí)際中，我們只需要拍下想要了解的文物，眼鏡就可以自動(dòng)調(diào)用圖像識(shí)別+文本匹配+播報(bào)三重系統(tǒng)，生成專業(yè)的展品介紹內(nèi)容。這不僅是多模態(tài)輸入的真實(shí)落地，更是李未可“讓AI真正幫用戶感受世界”的產(chǎn)品哲學(xué)表現(xiàn)。

“隨心聽(tīng)”功能并非傳統(tǒng)意義上的“播報(bào)新聞”或“讀日程”，而是李未可在多模塊打通基礎(chǔ)上，打造的一個(gè)具備任務(wù)聯(lián)動(dòng)能力的信息播報(bào)引擎。

基于李未可科技自研的ASR大模型技術(shù)，將用戶在使用“隨時(shí)譯”“隨身記”“隨地游”等功能中產(chǎn)生的關(guān)鍵信息，以個(gè)性化、可控的語(yǔ)音形式實(shí)時(shí)播報(bào)，實(shí)現(xiàn)“脫手就能獲取信息”的智能體驗(yàn)。

值得注意的是，隨心聽(tīng)的播報(bào)內(nèi)容，也可以是來(lái)自“隨時(shí)譯”“隨身記”的結(jié)果，就相當(dāng)于每個(gè)人又多了一個(gè)私人秘書(shū)，能夠?qū)崿F(xiàn)多線辦公，也可以省去非常多整理和理解的步驟。

這“四大功能”并非簡(jiǎn)單聚合，而是李未可挖掘出的AI核心落地點(diǎn)，它們覆蓋了出行、對(duì)話、記錄、獲取信息等日常高頻場(chǎng)景，也體現(xiàn)了李未可大模型在多模態(tài)感知、多Agent協(xié)作、端側(cè)離線推理三大技術(shù)方向的落地深度。

公司不只是產(chǎn)品，也是“Agent AI操作系統(tǒng)”的布道者

在大家都力求小而美的時(shí)代里，作為一家創(chuàng)業(yè)公司，李未可選擇了一條技術(shù)更重、用戶體驗(yàn)門(mén)檻更高的路，這同樣也是一條潛力更大的路。

我們也發(fā)現(xiàn)，除了想讓AI為大家做點(diǎn)什么之外，李未可也想留下點(diǎn)什么。比如，好的生態(tài)。

在采訪中，茹憶提到一個(gè)有趣的觀點(diǎn)，即在未來(lái)，AI Agent世界里，語(yǔ)音助手就像是現(xiàn)在的操作系統(tǒng)一樣，是負(fù)責(zé)”執(zhí)行“的角色：“它會(huì)調(diào)用各種各樣的Agent，Agent就對(duì)應(yīng)我們用的程序。”

留下的這個(gè)口子，就是希望向開(kāi)發(fā)者開(kāi)放這個(gè)獨(dú)特的世界，讓更多人參與進(jìn)來(lái)。根據(jù)茹憶的介紹，目前接入了DeepSeek、豆包等主流AI平臺(tái)，在上面發(fā)布的Agent也可以接入到李未可的平臺(tái)中，讓更多智能眼鏡終端用戶也能體驗(yàn)到與手機(jī)、PC一樣，甚至更好的AI Agent。

當(dāng)未來(lái)的智能設(shè)備都可能變成AI智能體的承載體時(shí)，誰(shuí)能率先搭建出AI操作系統(tǒng)與智能體生態(tài)，誰(shuí)就能掌握“終端即平臺(tái)”的下一個(gè)時(shí)代。而李未可，正在這條看似冷門(mén)但可能最通向未來(lái)的道路上，全力前行。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.