快科技4月7日消息,京東這次在AI圖像領域搞出了新名堂,探索研究院正式開源了自研的JoyAI-Image-Edit圖像模型。
這款模型最厲害的地方是能真正看懂圖像的三維空間結構,徹底解決了傳統AI修圖空間邏輯混亂的問題,空間理解與編輯能力還達到了世界一流水平。
之前我們用AI修圖、做圖總踩坑,移動物體容易變形,換視角透視出錯,調整物體前后關系還會遮擋混亂,核心就是傳統AI只在平面上P圖,不懂三維空間。
而JoyAI-Image-Edit把空間智能融入底層,貼合真實世界的空間規律,能精準理解圖像背后的空間結構,移動物體、換視角都能保持場景幾何規律,遮擋、光影也自然,主體和場景結構都不會亂。
這款模型還有三大核心空間編輯能力,能實現視角變換、空間漫游和物體空間關系操控,比如用自然語言指定相機角度就能生成新視角圖像,還能連續移動視角生成連貫的多視角畫面。
同時它還兼容15類通用編輯能力,不管是替換刪除物體、風格遷移,還是長文本渲染,都能高效完成。
它的應用場景也特別廣,電商內容生產、創意設計、3D模型重建、具身智能視覺感知等領域都能用,尤其是在具身智能領域,能為機器人理解世界提供關鍵底層能力。
近期京東在AI領域動作不斷,不僅開源了基礎大模型,相關AI產品調用量也大幅增長,還將打造全球最大具身數據采集中心,持續推動AI和產業的深度融合。
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.