作者|子川
來(lái)源|AI先鋒官
可靈又又又又更新啦!
可靈推出了全新的視頻生成模型可靈 2.5 Turbo模型。
![]()
據(jù)可靈團(tuán)隊(duì)介紹,較上代相比,新一代的可靈 2.5 Turbo主要是升級(jí)下面幾點(diǎn):
提示詞理解與時(shí)序控制更精準(zhǔn)。
高速動(dòng)態(tài)質(zhì)量更流暢更穩(wěn)定。
多種風(fēng)格保持能力全面覆蓋。
更高品質(zhì)、更低價(jià)格,價(jià)格比可靈2.1同檔位便宜30%!
這些技術(shù)上的提升可能聽(tīng)起來(lái)比較抽象,我們直接通過(guò)幾個(gè)案例來(lái)感受一下
在提示詞理解方面,可靈 2.5 Turbo 甚至能理解古詩(shī)詞。
提示詞:欲把西湖比西子,淡妝濃抹總相宜
是不是有種想象照進(jìn)現(xiàn)實(shí)的感覺(jué)?
西湖、荷花再加上一位身著古裝的古典美人,非常契合了詩(shī)詞中“西子”的韻味和“淡妝濃抹”的意境。
理解力Max!
如果說(shuō)視頻模型最怕什么,運(yùn)動(dòng)場(chǎng)景首當(dāng)其沖,大幅度動(dòng)作做著做著很容易就“崩掉”。
經(jīng)常出現(xiàn)肢體扭曲、畫(huà)面破碎等情況,就像這樣——
兩只手和兩只腳纏繞在一起,并在空中直立翻個(gè)大跟頭,簡(jiǎn)直比菲力賓跳水隊(duì)還抽象。
升級(jí)后的可靈 2.5 Turbo,在處理大幅度運(yùn)動(dòng)時(shí)表現(xiàn)得更加穩(wěn)定和順暢。
提示詞:正常速度,展示一名籃球運(yùn)動(dòng)員從后場(chǎng)帶球突破至扣籃。主體是一名身穿白色球衣的年輕球員,位于畫(huà)面中央,動(dòng)作連貫自然。背景是燈光閃耀的籃球館,觀眾席模糊但熱烈。球員一路帶球突破,避開(kāi)防守,騰空扣籃。整體風(fēng)格為寫(xiě)實(shí)體育競(jìng)技,暖黃燈光,高亮度,中高飽和度,氛圍熱血。鏡頭采用正面跟隨拍攝,無(wú)剪輯持續(xù)跟隨,從遠(yuǎn)景到近景捕捉完整動(dòng)作。
運(yùn)球突破再到最后的扣籃,一氣呵成,幾乎沒(méi)有沒(méi)有任何卡頓或動(dòng)作形變。
特別是鏡頭始終跟隨主體,完整捕捉了整個(gè)連貫的動(dòng)作。
除此之外,2.5 Turbo生成視頻的人物表現(xiàn)力方面更加的細(xì)膩,表演更具張力。
提示詞:真實(shí)速度播放。昏暗的馬戲團(tuán)后臺(tái),氣氛詭異,唯一的頂燈灑下冷白光,周?chē)鷱浡覊m。鏡頭從近景開(kāi)始,正面拍攝一名身穿破舊小丑服、滿臉白色油彩的小丑,他的紅鼻子和涂抹開(kāi)的口紅讓笑容顯得僵硬。起初他咧嘴大笑,露出整齊的白牙,眼角皺紋拉開(kāi),鏡頭緩慢推進(jìn)到特寫(xiě),他的笑聲逐漸停下,嘴角緩緩下垂,眼神開(kāi)始黯淡,淚水從涂著油彩的眼角流下,沿著臉頰留下黑色淚痕。背景聲音消失,只能聽(tīng)到他的呼吸聲。下一瞬間,鏡頭捕捉到他抬起頭,嘴角緩緩扭曲成詭異的邪笑,牙齒在冷光下反射著光,眼神變得陰冷,淚水和笑容同時(shí)掛在臉上,既滑稽又恐怖。鏡頭略微抖動(dòng),定格在他詭異的表情上,畫(huà)面充滿心理壓迫感。
昏暗的燈光、小丑臉上夸張卻又僵硬的笑容,加上泛黃的牙齒和從眼角流出的黑色淚水,看得小編雞皮疙瘩都掉落一地。
可靈 2.5 Turbo在紙面實(shí)力同樣表現(xiàn)不俗。
在可靈AI團(tuán)隊(duì)內(nèi)部構(gòu)建的評(píng)測(cè)集中,文生視頻和圖生視頻方面幾乎都碾壓seedance 1.0 mini、seedance-1.0和Veo3-fast這三款模型。
![]()
![]()
那實(shí)際效果到底如何,是騾子是馬,總得拉出來(lái)遛一遛才知道。
老規(guī)矩,來(lái)一場(chǎng) PK。
這次可靈 2.5 Turbo 的對(duì)手是字節(jié)的 seedance-1.0 模型,看看究竟誰(shuí)能更勝一籌。
眾所周知,“抽卡”是視頻生成必備的環(huán)節(jié),為了保護(hù)我方錢(qián)包。
所以定了一個(gè)規(guī)則:使用相同的提示詞,每款模型生成兩次,選取效果更好的一次進(jìn)行比較。
案例一:鏡頭追隨
提示詞:
滑板手在U池做‘空中抓板’動(dòng)作,鏡頭先近距鎖定滑板尾部,起跳后順勢(shì)拉近到面部特寫(xiě)并自動(dòng)對(duì)焦,落地時(shí)再拉遠(yuǎn)至半身構(gòu)圖,全程自動(dòng)曝光與景深過(guò)渡自然。
可靈2.5 Turbo
seedance-1.0
先說(shuō)優(yōu)點(diǎn),兩款模型動(dòng)作上都沒(méi)有變形。
但可靈 2.5 Turbo 的鏡頭追隨能力明顯要比 seedance-1.0 好不少。
在可靈的視頻中,鏡頭先是精準(zhǔn)地對(duì)準(zhǔn)滑板尾部,滑板手起跳后,鏡頭順勢(shì)平滑地拉近并自動(dòng)對(duì)焦到人物面部,這個(gè)過(guò)渡非常自然。
同時(shí)兩款模型都有一個(gè)缺點(diǎn),沒(méi)有做空中抓板的這個(gè)動(dòng)作。
案例二:跑車(chē)變形機(jī)甲
提示詞:固定鏡頭,拍攝,霓虹光,照耀的黃昏街道上,紅色跑車(chē)緩慢展開(kāi)機(jī)械結(jié)構(gòu),車(chē)門(mén)與引擎蓋以折疊位移方式重組,輪組向外翻轉(zhuǎn)形成關(guān)節(jié),變形為機(jī)甲人形后,仰視,鏡頭,金屬表面倒映著街燈,暖光,地面陰影隨結(jié)構(gòu)變化同步調(diào)整,機(jī)械關(guān)節(jié)處溢出少量白色蒸汽
可靈2.5 Turbo
seedance-1.0
結(jié)果一目了然,2.5 Turbo 生成的畫(huà)面,完完整整地展現(xiàn)了紅色跑車(chē)從汽車(chē)形態(tài)逐步展開(kāi)成變形為機(jī)甲人形的全過(guò)程。
反觀 seedance-1.0,僅完成了一半的變形,然后呈現(xiàn)一個(gè)機(jī)器人直接“坐”在了一輛跑車(chē)上的畫(huà)面。
案例三:運(yùn)動(dòng)能力
提示詞:
黃昏的露天跳水池,一名職業(yè)跳水運(yùn)動(dòng)員從10米跳臺(tái)起跳,完成向前翻騰三周半抱膝,鏡頭自下向上跟隨起跳軌跡,隨后快速下?lián)u至水面,捕捉入水瞬間的水花收束與漣漪,真實(shí)光影與水體折射。
可靈2.5 Turbo
seedance-1.0
先說(shuō)可靈 2.5 Turbo,在運(yùn)動(dòng)員空中完成向前翻騰三周半抱膝動(dòng)作時(shí),有幾幀畫(huà)面出現(xiàn)了輕微的動(dòng)作形變,雖然不影響整體理解,但不夠完美。
而 seedance-1.0 的表現(xiàn)則更糟糕,運(yùn)動(dòng)員跳到空中后,直接來(lái)了個(gè)一字馬后空翻。
除此之外,這兩款模型似乎對(duì)數(shù)字都不敏感,提示詞明確的是10米,而它們生成的視頻都是1~2米的跳臺(tái)。
案例四:微距視角
提示詞:微距視角拍攝熱帶雨林潮濕地面,螞蟻用前肢托舉綠葉邊緣緩慢前行,葉片邊緣有細(xì)小露珠,鏡頭緩慢,推進(jìn),從葉尖露珠逐漸聚焦到螞蟻復(fù)眼,背景蕨類(lèi)植物形成朦朧光斑,柔和,自然光,照亮絨毛細(xì)節(jié)
可靈2.5 Turbo

seedance-1.0

這次在微距視角下,兩款模型效果都相當(dāng)不錯(cuò)。如果非要在這兩者之間選一個(gè)更厲害的,小編依然會(huì)選擇可靈2.5 Turbo。
它實(shí)現(xiàn)了聚焦到螞蟻復(fù)眼”這個(gè)細(xì)節(jié)!
經(jīng)過(guò)這一系列的實(shí)測(cè)與對(duì)比,可靈 2.5 Turbo 的能力確實(shí)提升了不少,無(wú)論是在復(fù)雜語(yǔ)義的理解,還是高難度動(dòng)態(tài)場(chǎng)景的流暢展現(xiàn),表現(xiàn)都相當(dāng)不錯(cuò)。
目前 可靈2.5 Turbo已經(jīng)上線,感興趣的朋友可以去試玩一番。
掃碼邀請(qǐng)進(jìn)群,我們帶你一起來(lái)玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問(wèn)、訊飛星火等AI大模型,順便學(xué)一些AI搞錢(qián)技能。
往期文章回顧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.