“李未可源自于我們對(duì)于AI的相信。”
在日前的發(fā)布會(huì)上,李未可CEO茹憶開(kāi)場(chǎng)就用一句話,為大家解開(kāi)了縈繞在這家創(chuàng)業(yè)公司身上的謎團(tuán)。也向業(yè)內(nèi)宣布,李未可是在這個(gè)行業(yè)中,與眾不同的玩家。
![]()
縱觀熱鬧的“百鏡大戰(zhàn)”,無(wú)論是波導(dǎo)還是BB,主流廠商普遍將顯示能力作為產(chǎn)品差異化的核心路徑。但在這片逐漸同質(zhì)化的紅海中,李未可科技給出了截然不同的答案:
李未可要做的,不是“加了AI的眼鏡”,而是用AI構(gòu)建硬件生態(tài)。
這不只是產(chǎn)品設(shè)計(jì)上的區(qū)別,更是技術(shù)路徑、思維方式的巨大區(qū)別。通過(guò)對(duì)過(guò)往產(chǎn)品路徑的拆解和茹憶的采訪,我們也更加了解李未可的“AI-first”。
不是“加AI的硬件”,而是“為AI構(gòu)建的終端”
李未可創(chuàng)始人茹憶在發(fā)布會(huì)上表示:“AI是工具的覺(jué)醒,而我們相信最貼近人的交互入口,是眼鏡。”
這句話可以說(shuō)是“開(kāi)宗明義”,包含了李未可推出產(chǎn)品的出發(fā)點(diǎn)。
一方面,我們目前看到所有李未可的產(chǎn)品都來(lái)源于讓AI“飛入尋常百姓家”。
比如,不管是Meta Lens還是City Air,李未可都不會(huì)在其他方面過(guò)多糾結(jié),而是把重量做的足夠輕,戴起來(lái)完全和普通眼鏡沒(méi)區(qū)別;把續(xù)航做得足夠久,上下班通勤,幾天一充都沒(méi)問(wèn)題;把所有小功能做到足夠“精”,180多種語(yǔ)言,嘈雜環(huán)境依然準(zhǔn)確……再給你一個(gè)擊穿底價(jià)的價(jià)格。
![]()
從形態(tài)到重量都“輕盈”的City Air
顯而易見(jiàn),實(shí)用、易得。
形而上來(lái)講,為了讓AI更好的落地,他們反推交互方式、芯片架構(gòu)、重量控制乃至使用場(chǎng)景,最終形成AI能力的物理化體現(xiàn)與場(chǎng)景化承載。
另一方面,李未可除了讓智能眼鏡作為AI的“宿主”之外,還決定自研大模型。
首先,有一個(gè)不容忽略的問(wèn)題是,從實(shí)用、易得到讓每個(gè)人都覺(jué)得“好用”中間還隔著一道天塹。如果你問(wèn)一個(gè)普通消費(fèi)者,TA期待的AI眼鏡什么樣,TA都至少會(huì)回答你,有個(gè)萬(wàn)能的AI助手。
要實(shí)現(xiàn)萬(wàn)能的難度是指數(shù)級(jí)增長(zhǎng)的,畢竟人類就是一個(gè)會(huì)在凌晨?jī)牲c(diǎn)搜索“畢加索是不是大小眼”的生物,你很難預(yù)測(cè)他們?cè)谧呗返臅r(shí)候會(huì)不會(huì)問(wèn)出“剛才我原地投籃拋物線的曲率是多少”這種問(wèn)題。
![]()
在這個(gè)難度級(jí)別上,如果再去接入第三方的通用AI大模型,那就會(huì)離最終“好用”的目標(biāo)越來(lái)越遠(yuǎn),所以自研大模型就顯得非常必要。
同時(shí),這其中也包含著李未可的野心。雖然大模型在C端早已家喻戶曉,但真正“讓普通用戶天天用得上”的AI原生應(yīng)用,至今仍未大規(guī)模爆發(fā)。ChatGPT發(fā)布之后,許多廠商將AI作為產(chǎn)品賣點(diǎn)加入眼鏡、耳機(jī)、手表等終端,但真正“有黏性、反復(fù)使用、高頻依賴”的功能場(chǎng)景仍然比較稀缺。
李未可科技選擇正面迎戰(zhàn)這個(gè)難題。它不是將AI功能“平鋪展開(kāi)”,而是從用戶實(shí)際使用路徑出發(fā),把AI功能濃縮為四個(gè)高頻場(chǎng)景型能力:AI隨時(shí)譯、AI 隨身記、AI隨地游、AI隨心聽(tīng)。
![]()
在之前的測(cè)評(píng)中,李未可的AI能力就已經(jīng)很強(qiáng)了
為了支撐這種AI原生體驗(yàn),李未可自研了WAKE-AI多模態(tài)大模型平臺(tái),其2.0版本將重點(diǎn)放在三個(gè)維度:多模態(tài)感知與理解(語(yǔ)音、圖像、文本同步處理)、多智能體協(xié)作與推理(Agent任務(wù)拆解與調(diào)度)、邊緣側(cè)離線AI推理能力(適配長(zhǎng)時(shí)佩戴、弱網(wǎng)場(chǎng)景)。
其中最具代表性的技術(shù)架構(gòu)是“ZeroAgent”,即“零級(jí)智能體”。它不是傳統(tǒng)語(yǔ)音助手,而是一個(gè)AI交互系統(tǒng)的調(diào)度大腦,具備自主感知、任務(wù)拆解、智能體調(diào)度與結(jié)果反饋能力。
更簡(jiǎn)單來(lái)理解,這個(gè)“0”就意味著起點(diǎn),零級(jí)智能體就是AI的女?huà)z、上帝、指揮官。
![]()
舉個(gè)例子,你在外逛街,對(duì)AI說(shuō)餓了、渴了,ZeroAgent首先會(huì)理解這是你的餐飲需求,然后把它拆分成你在哪(定位),你平常愛(ài)吃的、愛(ài)喝的(偏好識(shí)別),附近的餐廳推薦等不同的任務(wù),分發(fā)給下面專門(mén)負(fù)責(zé)的AI助手來(lái)完成。
這樣做有什么好處呢?
與通用大模型相比,Agent分發(fā)形式更可控。跟人類工作一樣,專業(yè)的AI干專業(yè)的事,得到的結(jié)果更加透明、可信,更少出現(xiàn)突然“胡說(shuō)八道”的情況;
與傳統(tǒng)語(yǔ)音助手相比,零級(jí)智能體會(huì)先識(shí)別和拆解用戶需求的真實(shí)意圖,更加智能化;
此外,Agent形式更加自由。它就像樂(lè)高一樣,擁有許多個(gè)承擔(dān)獨(dú)立任務(wù)的獨(dú)立模塊,可以根據(jù)不同的場(chǎng)景需求自由選用和組合,這也是李未可為未來(lái)發(fā)展生態(tài)埋下的伏筆。
技術(shù)深挖,“聽(tīng)說(shuō)讀寫(xiě)”成核心落點(diǎn)
與強(qiáng)調(diào)顯示、手勢(shì)、虛擬界面的AR眼鏡不同,李未可的智能眼鏡四項(xiàng)核心功能,即隨時(shí)譯、隨身記、隨地游、隨心聽(tīng),都圍繞AI能力進(jìn)行設(shè)計(jì)與優(yōu)化。
在主流翻譯眼鏡多采用通用ASR系統(tǒng)的背景下,李未可選擇自行訓(xùn)練自適應(yīng)模型,強(qiáng)化對(duì)小語(yǔ)種、地方口音的識(shí)別能力。目前支持180余種語(yǔ)言,重點(diǎn)覆蓋“一帶一路”國(guó)家、東南亞等區(qū)域語(yǔ)系,并已在越南、印尼、阿聯(lián)酋等實(shí)際展會(huì)場(chǎng)景中驗(yàn)證有效率超過(guò)90%。
![]()
眼鏡段播放翻譯內(nèi)容,手機(jī)端同步顯示文字
更重要的是,其翻譯系統(tǒng)支持對(duì)話、聽(tīng)譯、離線三種模式,能夠根據(jù)網(wǎng)絡(luò)環(huán)境、噪音強(qiáng)度、內(nèi)容類型自動(dòng)切換。
![]()
根據(jù)發(fā)布會(huì)展示,在會(huì)展這種人流量大的環(huán)境中,展商面對(duì)高達(dá)90分貝以上的嘈雜環(huán)境,依然可以完成多輪準(zhǔn)確對(duì)話,準(zhǔn)確率約在93%-97%。而這種準(zhǔn)確、多場(chǎng)景的能力靠的不是更好的硬件設(shè)備,而是專為“群體交互+多語(yǔ)言”的場(chǎng)景微調(diào)過(guò)的AI模型基礎(chǔ)。
隨身記也不是一個(gè)簡(jiǎn)單的“錄音+轉(zhuǎn)寫(xiě)”模塊。它支持會(huì)議錄音、關(guān)鍵詞提取、結(jié)構(gòu)化摘要、任務(wù)分派,并能一鍵生成開(kāi)發(fā)信草稿或會(huì)議紀(jì)要。
![]()
在與米奧蘭特合作的多個(gè)海外展會(huì)中,李未可眼鏡通過(guò)AI慧記、AI慧寫(xiě)幫助展商在結(jié)束展會(huì)當(dāng)天就完成了80+位客戶記錄、內(nèi)容整理等工作,極大地提高了商務(wù)環(huán)境中最需要的效率,也減少了傳統(tǒng)人工整理的問(wèn)題。
![]()
在最新的版本中,還加入了多端同步功能,同一賬號(hào)下,不同端口平臺(tái)支持實(shí)時(shí)雙向編輯,AI對(duì)話推送了多端無(wú)縫同步,進(jìn)一步提升多系統(tǒng)協(xié)作效率。
![]()
這一系統(tǒng)背后是多模態(tài)內(nèi)容捕捉、時(shí)間軸對(duì)齊、任務(wù)意圖拆解等AI能力的集中體現(xiàn)。正如李未可發(fā)布會(huì)中提到的,“我們不希望你回去寫(xiě)周報(bào),而是你說(shuō)完話,AI就已經(jīng)替你生成周報(bào)了。”
在生活化場(chǎng)景上,李未可也進(jìn)行了深度挖掘。旗下的旅拍眼鏡View支持“拍照即解說(shuō)”,結(jié)合圖像識(shí)別、地理定位與大模型生成,實(shí)現(xiàn)博物館、景點(diǎn)、街頭建筑等自動(dòng)解說(shuō)體驗(yàn),讓AI成為大家旅行的解說(shuō)員、好搭子。
![]()
據(jù)了解,View目前支持6800+國(guó)內(nèi)外文旅地標(biāo),支持實(shí)時(shí)對(duì)圖文問(wèn)答、AI語(yǔ)音講解。
實(shí)際中,我們只需要拍下想要了解的文物,眼鏡就可以自動(dòng)調(diào)用圖像識(shí)別+文本匹配+播報(bào)三重系統(tǒng),生成專業(yè)的展品介紹內(nèi)容。這不僅是多模態(tài)輸入的真實(shí)落地,更是李未可“讓AI真正幫用戶感受世界”的產(chǎn)品哲學(xué)表現(xiàn)。
“隨心聽(tīng)”功能并非傳統(tǒng)意義上的“播報(bào)新聞”或“讀日程”,而是李未可在多模塊打通基礎(chǔ)上,打造的一個(gè)具備任務(wù)聯(lián)動(dòng)能力的信息播報(bào)引擎。
![]()
基于李未可科技自研的ASR大模型技術(shù),將用戶在使用“隨時(shí)譯”“隨身記”“隨地游”等功能中產(chǎn)生的關(guān)鍵信息,以個(gè)性化、可控的語(yǔ)音形式實(shí)時(shí)播報(bào),實(shí)現(xiàn)“脫手就能獲取信息”的智能體驗(yàn)。
值得注意的是,隨心聽(tīng)的播報(bào)內(nèi)容,也可以是來(lái)自“隨時(shí)譯”“隨身記”的結(jié)果,就相當(dāng)于每個(gè)人又多了一個(gè)私人秘書(shū),能夠?qū)崿F(xiàn)多線辦公,也可以省去非常多整理和理解的步驟。
這“四大功能”并非簡(jiǎn)單聚合,而是李未可挖掘出的AI核心落地點(diǎn),它們覆蓋了出行、對(duì)話、記錄、獲取信息等日常高頻場(chǎng)景,也體現(xiàn)了李未可大模型在多模態(tài)感知、多Agent協(xié)作、端側(cè)離線推理三大技術(shù)方向的落地深度。
公司不只是產(chǎn)品,也是“Agent AI操作系統(tǒng)”的布道者
在大家都力求小而美的時(shí)代里,作為一家創(chuàng)業(yè)公司,李未可選擇了一條技術(shù)更重、用戶體驗(yàn)門(mén)檻更高的路,這同樣也是一條潛力更大的路。
我們也發(fā)現(xiàn),除了想讓AI為大家做點(diǎn)什么之外,李未可也想留下點(diǎn)什么。比如,好的生態(tài)。
在采訪中,茹憶提到一個(gè)有趣的觀點(diǎn),即在未來(lái),AI Agent世界里,語(yǔ)音助手就像是現(xiàn)在的操作系統(tǒng)一樣,是負(fù)責(zé)”執(zhí)行“的角色:“它會(huì)調(diào)用各種各樣的Agent,Agent就對(duì)應(yīng)我們用的程序。”
![]()
留下的這個(gè)口子,就是希望向開(kāi)發(fā)者開(kāi)放這個(gè)獨(dú)特的世界,讓更多人參與進(jìn)來(lái)。根據(jù)茹憶的介紹,目前接入了DeepSeek、豆包等主流AI平臺(tái),在上面發(fā)布的Agent也可以接入到李未可的平臺(tái)中,讓更多智能眼鏡終端用戶也能體驗(yàn)到與手機(jī)、PC一樣,甚至更好的AI Agent。
當(dāng)未來(lái)的智能設(shè)備都可能變成AI智能體的承載體時(shí),誰(shuí)能率先搭建出AI操作系統(tǒng)與智能體生態(tài),誰(shuí)就能掌握“終端即平臺(tái)”的下一個(gè)時(shí)代。而李未可,正在這條看似冷門(mén)但可能最通向未來(lái)的道路上,全力前行。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.