作者|子川
來源|AI先鋒官
快手帶著大家伙來了!
12月1號,可靈AI突然放出一個重磅消息——推出了O1模型。
官方稱其為"全球首個統一多模態視頻模型"。
從官方給出的介紹來看,這次可靈O1的核心亮點在于把文生視頻、圖生視頻、視頻編輯、內容增刪、風格變換等一大堆功能,全部集成到一個統一的模型里。
以前我們用AI視頻工具,基本都是這樣的:想文生視頻,就去文生視頻的入口;想圖生視頻,就得切換到圖生視頻功能;想編輯視頻,又得找視頻編輯工具。
每個功能都是獨立的,切換起來麻煩不說,效果還不一定連貫。
但可靈O1不一樣,它把這些功能全部融合到一個模型里。
你上傳一張圖片、一段視頻,或者直接輸入文字描述,模型都能理解你想干什么,然后直接給你生成出來。
更厲害的是,這個模型還結合了Chain-of-thought技術,也就是思維鏈推理能力。
這意味著它不僅能理解你的指令,還能像導演一樣記住主角、道具和場景,無論鏡頭怎么切換,主體特征都能保持一致。
說了這么多理論,那實際效果到底怎么樣?下面我們來試玩一番。
視頻內容增刪是可靈O1最讓人驚喜的功能之一。
你可以在視頻中任意增加或刪除內容,比如給角色添加一件衣服、消除路人、增加道具等等。
比如上傳一個女生打傘的視頻,但是我需要去除這把傘,效果是這樣的——
原視頻
可以很清楚地看到,原視頻中的傘被刪除掉。而且視頻的一致性保持的相當出色,除了傘以外,其他都沒有任何變化。
不過也會去除不完整的情況出現。
像下面這一段,原本視頻中有一只小兔子。
![]()
把它刪除效果是這樣的,細看可以看出兔子原有的位置扣除的并不干凈。
除了增刪,可靈O1還能修改視頻中的特定部分。比如你想把角色的衣服從紅色改成藍色,想把夏天的場景變成冬天,或者給視頻加上特效,都能輕松實現。
比如把原有視頻中的形象進行替換。
原視頻
一致性的效果依舊出色,這次我們可以用蠟燭作為參考物,原視頻的蠟燭燃燒的狀態和修改后視頻的一致的。
還能把騎自行的車傻狍子換成一只兔子。
![]()
不過也有失敗的案例,比如左側的杯子憑空長出了一條尾巴。
同時你還可以在原有視頻中增加一些元素,比如在跳舞女孩的后面添加一個外星人。
還有之前很火的風格轉換可也以在可靈O1中完成。
把風景視頻轉換成日本動漫風格。
整體體驗下來會發現,可靈O1提供了統一的Omni界面,支持圖片、視頻、主體等多模態輸入。整個操作流程非常簡單,學習成本比較低。
同時在實際體驗過程中發現可靈O1在某些復雜場景下可能還會有一些瑕疵,但這種"大一統"的設計理念,很可能會成為未來AI工具發展的方向。
畢竟,誰不想要一個能解決所有問題的全能工具呢?
目前可靈O1已經全量上線,感興趣的可以去體驗一下。
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.