![]()
Matrix-Game-3.0昨天把代碼扔上GitHub,開源社區愣了幾秒才反應過來——這玩意兒能讓AI實時生成720p視頻,延遲壓到500毫秒以內。換句話說,你打字說"一只企鵝在月球上喝咖啡",畫面幾乎是跟著你敲鍵盤的節奏往外吐。
項目負責人放話:「我們沒做預渲染,每一幀都是現算的。」這句話的潛臺詞很扎心——之前那些號稱"實時"的AI視頻工具,多半是在偷偷緩存或者降分辨率糊弄人。
技術細節藏在一篇技術報告里。團隊用了動態token壓縮,把視頻流切成可預測的塊,GPU不用等整幀算完就能開始畫下一幀。實測在單張4090上跑,720p@24fps穩得住,掉幀率不到3%。
開源社區已經開始拆代碼。有人發現他們砍掉了傳統擴散模型的去噪循環,換成了一步到位的蒸餾版本——代價是畫面偶爾會出現"果凍效應",快速移動的邊緣會糊一下。
最尷尬的是某閉源競品。上周剛宣發"行業首個實時視頻生成",演示里主播說話嘴型都對不上;Matrix-Game-3.0的demo里,用戶邊打字邊改提示詞,畫面跟著實時變形,連頭發絲飄動的方向都能逐幀控制。
項目文檔最后埋了一句:目前只支持英偉達顯卡,AMD用戶"建議先觀望"。評論區第一條熱評是:"所以我的RX 7900 XTX又成電子垃圾了?"
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.