作者|子川
來源|AI先鋒官
還得是美團,這跨界太有技術含量了!
就在上個月,美團剛開源了大語言模型LongCat-Flash-Chat,我這邊還沒來得及好好體驗。
結果一覺醒來,他們又開源了一款視頻模型——LongCat-Video。
![]()
據官方介紹,LongCat-Video的參數為13.8B,同時該模型在文生視頻和圖生視頻上的能力,直接沖到了開源模型的頂級水平。
其中最值得注意的是,它還能生成分長達4分鐘的長視頻。
![]()
從官方給出的全面評估數據來看,該模型可以和PixVerse-V5和Wan2.2-T2V-A14B一較高下了。
甚至在有些維度的測評成績甚至可與谷歌的Veo3媲美。
![]()
![]()
那效果到底如何,給大家看幾個官方的案例就清楚了。
先來看一下文生視頻的效果。
一個穿著白色裙子的女生在湖面上跳芭蕾舞,無論是動作還是水中的倒影,表現都十分自然。
光影效果和物理規律都拿捏得相當到位。
旋轉跳躍,一氣呵成,滑板在空中翻轉動作,沒有絲毫的突兀感。
盒子變形的過程絲滑流暢,機械結構一一展開,不過細看還是可以看得出有些許的AI感。
再來看看圖生視頻的效果。
一個男生從畫中徑直走到電競椅上,人物的樣貌、穿著,甚至周圍環境的風格,都與原圖保持了一致。
這不雙十一快到了, LongCat-Video也是狠狠展示了在電商中的表現。
此外,LongCat-Video最核心的能力還在于視頻延長,它能像制作連續劇一樣生成分鐘級長視頻。
一個視頻搞定后,只需接著續寫提示詞,最終就能生成片段。
比如下面這個接近半分鐘的視頻,就是通過以下提示詞一步步實現的,下面小編將提示詞翻譯成中文,以便大家更好的了解。
浴室設計典雅,配有大理石臺面,水槽上方有一面光線充足的大鏡子。臺面上整齊地擺放著各種彩妝產品,旁邊的架子上還掛著一條毛絨毛巾。這位女士穿著一件時尚的黑色連衣裙,頭發梳成松散的波浪形。女人站在大鏡子前,輕輕調整角度,以獲得更好的視野。她顯得專注,確保鏡子完美地反射出她的形象。
女人打開水龍頭,開始洗手。
女人撿起掛在墻上的毛巾。
女人一邊看著鏡子,一邊擦干雙手
效果是不是還不錯!
同時,美團不僅把LongCat-Video免費開源了出來,還采用了極其開放的MIT許可證。
簡單來說,就是允許所有人(包括公司)免費使用這個模型,甚至用它來開發商業產品賺錢!
美團這波格局直接拉滿了。
目前,美團LongCat-Video還沒有提供可直接在線體驗的網站,可能還需要等待一段時間。
不過,對于有技術能力的朋友們來說,可以直接上手部署,搶先體驗,官方已經給出了所有相關資源。
項目主頁:
https://meituan-longcat.github.io/LongCat-Video/
模型地址 (Hugging Face):
https://huggingface.co/meituan-longcat/LongCat-Video
技術報告:
https://github.com/meituan-longcat/LongCat-Video/blob/main/longcatvideo_tech_report.pdf
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.