![]()
此次開源意味著硬件廠商、手機廠商和開發者均可基于AutoGLM。
據IPO早知道消息,智譜深夜開源其核心AI Agent模型AutoGLM。該模型被業界視為全球首個具備“Phone Use”(手機操作)能力的AI Agent,能夠穩定完成外賣點單、機票預訂等長達數十步的復雜操作流程。
此次開源意味著硬件廠商、手機廠商和開發者均可基于AutoGLM,在自己的設備或系統中復現一個能“看懂”屏幕、并模擬真人進行點擊、輸入、滑動的AI助手。目前,AutoGLM已支持微信、淘寶、抖音、美團等超過50個高頻中文應用的核心場景,其自動化操作能力與此前引發熱議的“豆包手機”演示相似。
AutoGLM的開源將大幅降低AI手機的技術門檻,推動AI手機生態從封閉走向開放共創。同時,項目支持本地與云端部署,確保數據與隱私控制權始終掌握在使用者手中。
值得注意的是,智譜開源的是一整套可以「拿來就用」的能力,具體包括:
訓練好的核心模型;
Phone Use 能力框架與工具鏈;
可直接跑通的 Demo,覆蓋 50+ 高頻中文 App;
針對 Android 的適配層與示例工程;
文檔、快速上手指南。
在智譜看來,Agent的爆發,需要所有人一起參與。其更樂見的是:有團隊基于 AutoGLM,做出真正意義上的 AI 原生手機;有研究者把其中的某個模塊拆出來,變成一篇論文、一套新算法;有個人開發者把一個 Demo 改成自己的項目,在某個小眾場景里真正跑起來。
當然,AutoGLM會以這樣的產品形態出現,源于智譜對AGI早期形態的理解。智譜認為,從Agent到AGI,還需要滿足3A原則:Around-the-clock(全時):24 小時運行,即使用戶離線,Agent 依然在執行任務;Autonomy without interference(自主零干擾):獨立運行,不占用用戶屏幕與算力,平行世界的搭子;Affinity(全域連接):跳出瀏覽器對話框,跨越手機、電腦、手表、眼鏡、家電等設備,操作物理世界。
接下來,AutoGLM 團隊會繼續努力,一起推動 Agent 開源和研究,那個夢想中的“賈維斯”,才會真的在人人身邊出現。
本文為IPO早知道原創
作者|Stone Jin
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.