![]()
昨天晚上,我們跟千問 AI 眼鏡團(tuán)隊還有何同學(xué)搞了一場直播。
本來托尼我正在興致勃勃地看二狗、何同學(xué)和千問的產(chǎn)品負(fù)責(zé)人閑聊,結(jié)果猝不及防,被一個新功能給“ 毒 ”到了。
![]()
這功能叫“ AI 克隆同聲傳譯 ”,是阿里家的千問 AI 眼鏡 S1 新上的一個核心功能。
具體的情況大概是這樣子的:
![]()
相信大家也聽出來了,怎么這個翻譯結(jié)果的聲音,有點(diǎn)特別啊 —— 平時咱們用的同聲傳譯,翻譯出來的聲音跟機(jī)器播報一樣,干巴巴的。
![]()
但千問 S1 這個翻譯結(jié)果,卻極其生動地保留了對方原本的聲音特質(zhì)、音色、語氣,甚至連講話時的情緒和口音都完美復(fù)刻了。
這就很有意思了。
以往我們想要實現(xiàn)這種定制音色翻譯的效果,起碼得經(jīng)過在 APP 內(nèi)錄入音色、打開翻譯、調(diào)用音色等等復(fù)雜的操作步驟。
現(xiàn)在對著眼鏡說一句話就能實現(xiàn)了。
我們現(xiàn)場就要了一臺千問 S1 回來,在體驗了一段時間之后,我們發(fā)現(xiàn)它搞的花活不止這個 AI 克隆同聲傳譯。
在說這些之前,可能要跟大家介紹一下這款千問 S1 的基本情況。 千問 S1 從遠(yuǎn)處看跟一副普通的眼鏡形態(tài)差不多。
![]()
靠近了仔細(xì)看就會發(fā)現(xiàn)鏡框左上角和右上角的位置分別放上了攝像頭和閃光燈。
![]()
![]()
兩塊鏡片都有一個長條形狀的區(qū)域,這是它的光波導(dǎo)顯示區(qū),可以理解成這個眼鏡的屏幕。
![]()
鏡腿上也有各種開孔和按鍵。
![]()
所有這些基本硬件就構(gòu)成了一副能拍照,能顯示單色畫面,能聽歌,還能問 AI 的智能眼鏡。
一開始我們也只是體驗到了一些主流 AI 拍攝眼鏡都有的功能。
比方說第一人稱視角拍攝。
這個功能偶爾會被我們用來拍一些雙手操作的功能操作鏡頭,比方說給大家拍一下第一人稱玩手游什么的。
![]()
俺們編輯部不少當(dāng)了奶爸奶媽的同事也跟我們反饋,用 AI 眼鏡拍逗寶寶玩的視頻也很方便,雙手完全解放出來了,不耽誤跟寶寶互動,同時拍出來的視頻也更接近自己眼睛看到的。
千問 S1 也給 AI 眼鏡的第一人稱拍攝,加入了一些自己的小巧思。
比方說它的快門鍵是支持半按對焦的,輕觸快門鍵,用戶會聽到滴滴的一聲,同時視線正前方就會出現(xiàn)一個方框,用來標(biāo)定拍攝畫面的中心。
![]()
這就跟單反和微單相機(jī)上的是同一個邏輯,相當(dāng)于在拍攝前給了用戶一個大概的構(gòu)圖參考,讓出片的成功率大大提高。
除了拍攝的小巧思之外,千問 S1 還利用兩個光機(jī)和鏡片上的光波導(dǎo)屏幕,搞出了很多實用的功能。
比方說導(dǎo)航,我們打開之后,走在路上,導(dǎo)航畫面直接貼在眼前,相當(dāng)于是解鎖了一個隨身 HUD 。
![]()
又比方說提詞器功能,把演講稿在手機(jī) APP 內(nèi)上傳之后,眼鏡上就能顯示自動滾動的臺詞內(nèi)容了。千問 S1 還能自動識別當(dāng)前說話位置,保證我們話說到哪,眼前的詞就滾動到哪,漏詞跳句都能緊緊跟上。
![]()
當(dāng)然啦,這些功能市面上不少其他的 AI 拍攝眼鏡也都能找到平替,千問 S1 在一些細(xì)節(jié)上做了更多優(yōu)化。
但隨著體驗的深入,我們也發(fā)現(xiàn)了一些不一樣的東西,很多功能體驗著體驗著,感覺“ 生態(tài)痕跡 ” 越來越濃了。。。
比方說這個錄音紀(jì)要。
![]()
我們以前接觸過的其他 AI 眼鏡,頂多就開會的時候,把聽到的說話內(nèi)容轉(zhuǎn)寫成文字,再用大模型總結(jié)梳理一下。
但千問 S1 不一樣,它生成的錄音總結(jié),不但條理清晰,還帶有結(jié)構(gòu)導(dǎo)圖,甚至連待辦事項都給提取出來了。。。
![]()
但仔細(xì)一想,這也合理,千問 S1 搭載的是千問大模型,之前如果有在手機(jī)和電腦上用過千問大模型的小伙伴都知道它到底有多強(qiáng)。
現(xiàn)在來到眼鏡之后,讓錄音轉(zhuǎn)寫總結(jié)多一個模態(tài)能力,好像也不是什么難事。
但是吧,我們逐漸發(fā)現(xiàn)了更多“ 生態(tài)痕跡 ” ——
比方說,手機(jī) APP 里有一個叫出行服務(wù)的功能。
![]()
點(diǎn)進(jìn)去綁定服務(wù)賬號之后, 網(wǎng)約車到達(dá)、火車即將發(fā)車、航班延誤時這些行程關(guān)鍵節(jié)點(diǎn)信息就可以自動推送到眼鏡屏幕上。
目前支持高德打車訂單、全網(wǎng)12306訂單、飛豬、航班管家、阿里商旅下單的飛機(jī)訂單。
![]()
仔細(xì)一看全是阿里生態(tài)內(nèi)的服務(wù)。
到這兒其實千問已經(jīng)暗示得很明顯了——
它并不想做一副單純的硬件眼鏡,而是企圖把阿里“ 全家桶 ”生態(tài)的能力,具象化到千問 S1 上。
結(jié)合這兩年 AI 眼鏡的發(fā)展?fàn)顩r來看,這樣的操作算得上是一個非常大膽的嘗試了。
這可能還得從 AI 眼鏡的爆火和消費(fèi)者體驗的錯位開始說起。
洛圖科技的數(shù)據(jù)顯示,2025 年中國智能眼鏡市場出貨量同比暴漲了將近 87%,增長的大頭像千問S1這樣能拍照的AI眼鏡。
![]()
但不少已經(jīng)下單的差友都跟我們反映,AI 眼鏡買回去之后新鮮感一過,很多就變成普通眼鏡了。
原因其實也不復(fù)雜,之前 AI 眼鏡能夠解決的問題非常有限,很難讓用戶養(yǎng)成習(xí)慣第一時間先用眼鏡,而不是掏出手機(jī)。
不少用戶用了幾次之后就陷入了“ 這玩意到底能干嘛 ”的迷茫期。
這也是昨晚千問 S1 直播中,幾位嘉賓集中探討,企圖回答的重要問題 —— 怎么樣才能讓 AI 眼鏡變得更好用,避免用戶買回去之后就吃灰。
而聽完現(xiàn)場千問 S1 產(chǎn)品負(fù)責(zé)人的介紹,再結(jié)合我們自己的體驗來看,千問 S1的破題方法非常簡單粗暴但有效:
![]()
利用大廠優(yōu)勢,先整合出一臺軟硬件足夠優(yōu)秀的設(shè)備,再逐步把整個生態(tài)能力毫無保留地傾注給它。
某種意義上這也算是功能上的“ 堆料 ”了,只要我給的夠多,那就總有一款適合你。
其實年初千問 APP 就已經(jīng)給我們打了個樣了。
千問大模型跟阿里生態(tài)內(nèi)的各個應(yīng)用結(jié)合之后,實現(xiàn)的效果真的讓人眼前一亮。
想要打車,直接一句話千問就能調(diào)起同在阿里生態(tài)體系內(nèi)的高德幫忙搞定,搜地址、定路線、選車型這些繁瑣的操作,它全在后臺給你整好了,你只要確認(rèn)就行。
![]()
類似的便捷辦事功能還有很多,設(shè)想一下,如果把這些功能都跟眼鏡進(jìn)行一個聯(lián)動,AI 眼鏡會變成什么樣子。。。
理解完這一層之后,咱再回去看千問 S1 的硬件配置的話,這些配置安排得非常超前了。
比方說 AI 眼鏡一直以來都被人詬病的續(xù)航問題,千問的解決方案考慮的就很全面。
注意看它的鏡腿尾部的地方,這其實就是它的電池,而且只要稍微用一點(diǎn)力扯一下就會發(fā)現(xiàn),這塊電池是可以拿下來的。
![]()
這就是千問的 1 秒換電設(shè)計,理念其實跟新能源汽車的換電方案是一樣的:眼鏡因為物理體積限制,沒有辦法做上特別大的電池,那干脆換個思路,沒電就換一塊電池。
![]()
同時為了避免換電過程中會出現(xiàn)導(dǎo)航中斷、音樂結(jié)束或者 AI 服務(wù)斷掉的情況,千問 S1 還設(shè)計了雙電池系統(tǒng),除了能更換的電池之外,眼鏡里還有一塊電池。
俺估計這么復(fù)雜的設(shè)計,目的也是為了保障用戶能長時間不間斷的佩戴體驗,只有做好了這點(diǎn),才能說服用戶將來用千問 S1 體驗生態(tài)內(nèi)更多的功能。
除了續(xù)航以外,眼鏡長時間佩戴的舒適度上,千問 S1 的設(shè)計也是出乎意料地到位。
在拿到眼鏡之前,我還在想眼鏡的舒適度設(shè)計,無非就在鼻托上下點(diǎn)功夫,換個舒服的材質(zhì),設(shè)計下可調(diào)節(jié)的結(jié)構(gòu)。
![]()
但拿到千問 S1 之后,我發(fā)現(xiàn)我還是低估了千問的耐心 ——
它不但設(shè)計好了鼻托,還把電池、主板、天線這些跟功能沒有強(qiáng)關(guān)聯(lián)性、又很有份量的器件,通通后置在鏡腿末端。
這樣這些器件就能與前面的鏡框、攝像頭、鏡片形成前后 1:1 的均衡配重,這就好比挑擔(dān)子,只要前后一樣重,你哪怕劇烈運(yùn)動也賊穩(wěn)固,同時也不會感覺到壓迫感。
![]()
另外,為了呈現(xiàn)更多模態(tài)的內(nèi)容,千問 S1 的顯示也是下了血本了。
昨天直播里也有聊到,千問 S1 強(qiáng)行在一副 AI 眼鏡里設(shè)計了雙光機(jī)系統(tǒng),給左右眼同時提供可以調(diào)節(jié)視距的畫面。
![]()
這樣的好處就是可以精準(zhǔn)控制顯示畫面的遠(yuǎn)近距離,該近就近,該遠(yuǎn)就遠(yuǎn)。
普通的單光機(jī)眼鏡,左右眼看到的畫面完全一樣,就像看一張固定的圖片,距離無法改變。
而雙光機(jī)設(shè)計,是給左右眼各配一個獨(dú)立的“微型投影儀”。
通過軟件精確控制這兩個畫面的角度和位置,就能模擬出人眼觀察遠(yuǎn)近物體時的自然差異,從而讓大腦感覺虛擬屏幕的距離變遠(yuǎn)或變近了。
![]()
有了距離調(diào)節(jié)就能讓整個的體驗觀感舒適,自然。
舉個例子,面對面翻譯,距離通常不超過2米,如果翻譯后的文字在很遠(yuǎn)的平面上,那人的眼睛就要在對方表情和顯示文字之間反復(fù)對焦,不但表情容易失控不太美觀,眼睛來來去去地對焦還容易頭暈。
這時候雙光機(jī)、雙目顯示的價值就體現(xiàn)出來了,
當(dāng)然啦,高顯示亮度,也是雙光機(jī)帶來的價值,千問官方宣稱,雙光機(jī)疊加后 S1 的峰值亮度高達(dá) 4000nits。
就我們的體驗來看,像白天戶外看個導(dǎo)航和打車提示,屏幕顯示的細(xì)節(jié)信息都能看清楚。
![]()
另外,考慮到近視人群要配近視鏡片的需求,千問 S1 也沒像其他 AI 眼鏡那樣,偷懶做外掛鏡片的設(shè)計,而是直接把近視鏡片和顯示模塊做成了“ 一體化的貼合鏡片 ”。
這種鏡片用極其硬核的分子鍵合技術(shù),把光波導(dǎo)和定制的超薄平凹近視鏡片,通過納米級精度一次性死死貼合在一起。
好處就是,用戶日常用起來,就跟普通的近視眼鏡沒任何區(qū)別。
但也帶來了額外的加工步驟 —— 每個人的度數(shù)、瞳距都不一樣,這種極度非標(biāo)的定制,對供應(yīng)鏈的考驗絕對是地獄級的。
類似的硬件上的超前堆料,千問 S1 其實還安排了很多,這里我就不一一展開了,我看我們硬件部的同事已經(jīng)在安排詳細(xì)的測試視頻了,感興趣的到時候可以來聽俺們繼續(xù)嘮。
分析到這里,大家應(yīng)該看明白了。
千問 S1 表面上看是端上來了一副眼鏡,但實際上背后是千問和阿里一整套的軟硬件結(jié)合的生態(tài)。
從能力和可能性上來說,千問 S1 絕對對得起千問產(chǎn)品負(fù)責(zé)人自己的評價 —— 它是出色的日常眼鏡,更是一位全面的生活助理。
![]()
這可能就是大廠做 AI 硬件思路上不一樣的地方。
其實,做 AI 硬件就像是端著一杯水。當(dāng)你死死盯著它,想不明白這一小杯水到底能干嘛的時候,最好的辦法,就是把這杯水直接倒進(jìn)湖里。
把 AI 眼鏡融入到一個龐大的生態(tài)當(dāng)中,沒準(zhǔn)才是這個形態(tài)的最終答案。
起碼千問 S1,已經(jīng)打了個好樣了。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.