品玩2月10日訊,GitHub開發(fā)者sseanliu近日開源VisionClaw項目,為Meta Ray-Ban智能眼鏡提供實時AI助手能力。該方案結(jié)合Gemini Live API與可選的OpenClaw本地網(wǎng)關(guān),支持用戶通過語音指令實現(xiàn)視覺識別、消息發(fā)送、購物清單管理及附近地點搜索等功能。
系統(tǒng)通過眼鏡攝像頭以約1fps頻率傳輸JPEG圖像至Gemini,并建立雙向?qū)崟r音頻通道。iPhone亦可作為測試設(shè)備模擬完整流程。項目架構(gòu)清晰,包含音頻管理、視頻采集、工具調(diào)用路由等模塊,要求iOS 17及以上系統(tǒng)及Xcode 15.0+開發(fā)環(huán)境。
VisionClaw已在GitHub獲得超590星標(biāo),代碼遵循開源許可協(xié)議,為智能穿戴設(shè)備的AI集成提供了可復(fù)用的技術(shù)范式。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.