<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      畫(huà)到哪,動(dòng)到哪!字節(jié)跳動(dòng)發(fā)布視頻生成「神筆馬良」ATI,已開(kāi)源

      0
      分享至



      Angtian Wang 是字節(jié)跳動(dòng)的研究員,研究方向包括視頻生成、3D 視覺(jué)、differentiable rendering。博士畢業(yè)于約翰霍普金斯(Johns Hopkins University)大學(xué)。師從 Dr. Alan Yuille。

      近年來(lái),隨著擴(kuò)散模型(Diffusion Models)、Transformer 架構(gòu)與高性能視覺(jué)理解模型的蓬勃發(fā)展,視頻生成任務(wù)取得了令人矚目的進(jìn)展。從靜態(tài)圖像生成視頻的任務(wù)(Image-to-Video generation)尤其受到關(guān)注,其關(guān)鍵優(yōu)勢(shì)在于:能夠以最小的信息輸入生成具有豐富時(shí)間連續(xù)性與空間一致性的動(dòng)態(tài)內(nèi)容。

      然而,盡管生成質(zhì)量不斷提升,當(dāng)前主流方法普遍面臨一個(gè)關(guān)鍵瓶頸:缺乏有效、直觀、用戶友好的運(yùn)動(dòng)控制方式。

      用戶在創(chuàng)作動(dòng)態(tài)視頻時(shí),往往具有明確的運(yùn)動(dòng)意圖,例如人物要往哪個(gè)方向奔跑、鏡頭如何推進(jìn)拉遠(yuǎn)、動(dòng)物的跳躍軌跡等。但現(xiàn)有方法普遍依賴于預(yù)設(shè)模板、動(dòng)作標(biāo)簽或風(fēng)格提示,缺少一種既自由又精準(zhǔn)的方式來(lái)指定對(duì)象與攝像機(jī)的運(yùn)動(dòng)路徑。尤其是在存在多個(gè)主體或復(fù)雜場(chǎng)景交互的情況下,這種控制能力的缺失,極大限制了生成系統(tǒng)的創(chuàng)意表達(dá)能力與實(shí)際應(yīng)用價(jià)值。

      為了解決這一問(wèn)題,字節(jié)跳動(dòng)提出了ATI——一種全新的、以「軌跡為指令」的可控視頻生成框架。ATI 的核心理念是:將用戶在輸入圖像上手繪的任意軌跡,轉(zhuǎn)化為驅(qū)動(dòng)物體與攝像機(jī)運(yùn)動(dòng)的顯式控制信號(hào),并以統(tǒng)一的潛在空間建模方式注入視頻生成過(guò)程。這使得視頻創(chuàng)作從「參數(shù)調(diào)控」轉(zhuǎn)變?yōu)椤缚梢暬瘎?chuàng)意」,讓用戶「畫(huà)到哪,動(dòng)到哪」,以直觀方式實(shí)現(xiàn)幀級(jí)精準(zhǔn)控制。



      • Title:ATI: Any Trajectory Instruction for Controllable Video Generation
      • Paper:https://arxiv.org/pdf/2505.22944
      • Project page:https://anytraj.github.io/
      • Github:https://github.com/bytedance/ATI
      • Hugging Face:https://huggingface.co/bytedance-research/ATI
      • ComfyUI:https://github.com/kijai/ComfyUI-WanVideoWrapper

      方法

      ATI 接受兩個(gè)基本輸入:一張靜態(tài)圖像和一組用戶手繪軌跡。這些軌跡可以在圖像上自由繪制,支持任意形狀,包括直線、曲線、折線、回環(huán)乃至抽象形狀。ATI 通過(guò)高斯運(yùn)動(dòng)注入器(Gaussian Motion Injector)將這些軌跡編碼為潛在空間中的運(yùn)動(dòng)向量,再注入至擴(kuò)散生成流程中,進(jìn)而引導(dǎo)生成過(guò)程逐幀呈現(xiàn)對(duì)應(yīng)的物體運(yùn)動(dòng)與視角變換。



      如上圖所示,我們希望讓視頻生成模型「理解」用戶畫(huà)出的運(yùn)動(dòng)軌跡,并在后續(xù)幀里按照這條軌跡產(chǎn)生動(dòng)作。為此,我們?cè)谀P偷妮斎胩卣骺臻g上,對(duì)每一個(gè)軌跡點(diǎn)都注入一個(gè)「高斯權(quán)重」。使得模型就能在特征圖上「看到」一顆顆從時(shí)刻 0 到 t 按軌跡移動(dòng)的小「亮點(diǎn)」,并在訓(xùn)練中逐步理解輸入軌跡在輸入特征上和 denoise 生成視頻的關(guān)聯(lián)。



      編碼圖像:先用一個(gè)「編碼器」把原始圖片轉(zhuǎn)換成一張低分辨率的特征圖。

      采樣特征:對(duì)于軌跡的起始點(diǎn),從特征圖上精確地(通過(guò)雙線性差值,保持小數(shù)位置精度)取出一個(gè)特征向量。

      生成高斯權(quán)重:在每一幀,對(duì)應(yīng)軌跡點(diǎn)的位置,都用一個(gè)小圓形「高斯」亮點(diǎn)去覆蓋周?chē)南袼兀娇拷鼒A心的像素,權(quán)重越高。

      注入特征:把起始點(diǎn)的特征向量,按照這些高斯權(quán)重「軟」地分配到特征圖上的鄰近區(qū)域,并在模型在生成視頻時(shí)輸入給模型。

      這樣一來(lái),當(dāng)我們給生成器喂入圖像和這組「高斯掩碼+特征」,模型就能直觀地「看懂」在每一幀里,哪兒應(yīng)該動(dòng)、怎樣動(dòng),從而生成符合用戶手繪軌跡的連貫動(dòng)畫(huà)效果。借助高斯運(yùn)動(dòng)注入器(Gaussian Motion Injector)與像素級(jí)通道拼接策略(Pixel-wise Channel Fusion),ATI 能夠統(tǒng)一控制對(duì)象級(jí)動(dòng)作、局部身體部位運(yùn)動(dòng)與攝像機(jī)視角變化,無(wú)需切換模型或模塊結(jié)構(gòu),即可高效支持多目標(biāo)、多風(fēng)格、多任務(wù)的視頻生成需求。同時(shí) ATI 支持多個(gè)視頻生成模型,可以在 Seaweed-7B 以及 Wan2.1-I2V-14B 等不同結(jié)構(gòu)以及大小的模型上均有穩(wěn)定的表現(xiàn)。

      結(jié)果展示



      用戶僅需在原圖上以手指或鼠標(biāo)拖拽繪制任意軌跡,ATI 即可實(shí)時(shí)捕捉該軌跡路徑并將其注入擴(kuò)散模型。借助高斯運(yùn)動(dòng)注入器,無(wú)論直線、曲線還是復(fù)雜回環(huán),均能被轉(zhuǎn)化為連貫自然的動(dòng)態(tài)視頻——畫(huà)到哪兒,動(dòng)到哪兒。



      在人物或動(dòng)物肖像場(chǎng)景中,用戶可以指定奔跑、跳躍、揮臂等關(guān)鍵動(dòng)作的軌跡。ATI 對(duì)每一幀中的關(guān)鍵點(diǎn)進(jìn)行細(xì)粒度采樣與編碼,準(zhǔn)確還原關(guān)節(jié)弧度與質(zhì)心移動(dòng),生成符合生物力學(xué)規(guī)律的自然運(yùn)動(dòng)序列。



      當(dāng)場(chǎng)景包含多個(gè)目標(biāo)時(shí),ATI 最多可并行處理 8 條獨(dú)立軌跡。系統(tǒng)通過(guò)空間掩碼和通道分離策略,保證各對(duì)象身份信息互不干擾,從而呈現(xiàn)復(fù)雜群體互動(dòng)時(shí)的連貫動(dòng)態(tài)。



      ATI 不僅支持對(duì)象級(jí)運(yùn)動(dòng)控制,還能同步驅(qū)動(dòng)攝像機(jī)視角。用戶可在原圖上繪制推拉、平移、旋轉(zhuǎn)等鏡頭軌跡,將其與對(duì)象軌跡共同注入潛在空間,生成包含搖鏡、跟隨和俯仰等電影級(jí)鏡頭語(yǔ)言的視頻。



      在同一推理過(guò)程中,物體與攝像機(jī)軌跡可同時(shí)注入,借助像素級(jí)通道拼接策略實(shí)現(xiàn)多條運(yùn)動(dòng)指令的無(wú)縫融合。系統(tǒng)無(wú)需模塊化切換,即可在潛在特征中并行呈現(xiàn)角色動(dòng)作、群體互動(dòng)與鏡頭切換,輸出豐富而連貫的動(dòng)態(tài)敘事。



      ATI 展示出良好的跨領(lǐng)域泛化能力,覆蓋寫(xiě)實(shí)電影、卡通插畫(huà)、油畫(huà)質(zhì)感、水彩渲染、游戲美術(shù)等多種藝術(shù)風(fēng)格。通過(guò)更換參考圖與輸入軌跡,系統(tǒng)能夠在保留原始風(fēng)格特征的基礎(chǔ)上生成對(duì)應(yīng)的運(yùn)動(dòng)視頻,滿足多元化的應(yīng)用需求。



      用戶可在潛在空間中繪制超越物理邊界的軌跡,以生成飛天、伸縮、扭曲等非現(xiàn)實(shí)動(dòng)作效果,為科幻或魔幻場(chǎng)景提供無(wú)限創(chuàng)意空間。



      基于 Wan2.1-I2V-14B 的高精度模型,ATI 可生成與實(shí)拍媲美的視頻短片,精準(zhǔn)還原面部表情、服飾材質(zhì)與光影細(xì)節(jié);同時(shí)提供輕量級(jí) Seaweed-7B 版本,以滿足資源受限環(huán)境中的實(shí)時(shí)交互需求。

      模型開(kāi)源

      目前,ATI 的 Wan2.1-I2V-14B 模型版本已在 Hugging Face 社區(qū)正式開(kāi)源,為研究人員與開(kāi)發(fā)者提供了高質(zhì)量、可控的視頻生成能力。圍繞該模型的社區(qū)生態(tài)也在快速完善:Kijai開(kāi)發(fā)的 ComfyUI-WanVideoWrapper 插件支持 FP8 量化模型(如 Wan2_1-I2V-ATI-14B_fp8_e4m3fn.safetensors),顯著降低顯存需求,方便在消費(fèi)級(jí) GPU 上進(jìn)行推理部署。同時(shí),Benji在 YouTube 發(fā)布的教學(xué)視頻《ComfyUI Wan 2.1 任意軌跡指令運(yùn)動(dòng)控制教程》為創(chuàng)作者提供了詳盡的實(shí)操指南。完整代碼與模型請(qǐng)參閱 GitHub(bytedance/ATI)及 Hugging Face 模型庫(kù)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      巨虧超千億,某車(chē)企遭重創(chuàng)!

      巨虧超千億,某車(chē)企遭重創(chuàng)!

      電動(dòng)知家
      2025-12-16 21:16:58
      四川退休人員1088萬(wàn)人,共發(fā)放3982.7億養(yǎng)老金,人均養(yǎng)老金多少?

      四川退休人員1088萬(wàn)人,共發(fā)放3982.7億養(yǎng)老金,人均養(yǎng)老金多少?

      云鵬敘事
      2025-12-17 08:16:13
      1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)梗£愘s:這是給鬼子修的墳!

      1940年,陳賡把戰(zhàn)壕挖到2米深,劉伯承拍桌大怒:你在自掘墳?zāi)梗£愘s:這是給鬼子修的墳!

      史海孤雁
      2025-12-17 16:50:15
      方向盤(pán)摸了一次,喜事變喪事:杭州新車(chē)事故敲響警鐘!

      方向盤(pán)摸了一次,喜事變喪事:杭州新車(chē)事故敲響警鐘!

      劉哥談體育
      2025-12-17 14:24:38
      俄副外長(zhǎng)談烏克蘭危機(jī):“已接近解決”

      俄副外長(zhǎng)談烏克蘭危機(jī):“已接近解決”

      參考消息
      2025-12-16 21:06:12
      繼新加坡之后,馬來(lái)西亞華人發(fā)聲!

      繼新加坡之后,馬來(lái)西亞華人發(fā)聲!

      達(dá)文西看世界
      2025-12-17 10:42:35
      漲一分都難,這是什么股票,股價(jià)新低,依然不止跌,32萬(wàn)股東納悶

      漲一分都難,這是什么股票,股價(jià)新低,依然不止跌,32萬(wàn)股東納悶

      財(cái)經(jīng)智多星
      2025-12-17 15:42:00
      辣眼“知情人”曝料已婚知名大導(dǎo)演追求北電女學(xué)生,聊天記錄臉紅

      辣眼“知情人”曝料已婚知名大導(dǎo)演追求北電女學(xué)生,聊天記錄臉紅

      天天熱點(diǎn)見(jiàn)聞
      2025-12-16 16:57:46
      微軟31年技術(shù)老兵被裁:60歲重新求職,找了6個(gè)月工作后終“上岸”!

      微軟31年技術(shù)老兵被裁:60歲重新求職,找了6個(gè)月工作后終“上岸”!

      CSDN
      2025-12-16 16:13:43
      沈佳潤(rùn)小寶眼線火了!被問(wèn)是不是自己畫(huà)的,答案超戳心

      沈佳潤(rùn)小寶眼線火了!被問(wèn)是不是自己畫(huà)的,答案超戳心

      庭小娛
      2025-12-15 14:44:51
      反擊戰(zhàn)打響,歐盟 27 國(guó)收通知:對(duì)豬肉征收反傾銷(xiāo)稅,荷蘭先涼

      反擊戰(zhàn)打響,歐盟 27 國(guó)收通知:對(duì)豬肉征收反傾銷(xiāo)稅,荷蘭先涼

      潮鹿逐夢(mèng)
      2025-12-16 22:57:02
      不到48小時(shí)連曝3個(gè)瓜,強(qiáng)制取精、楊瀾被罵、回應(yīng)出軌,個(gè)個(gè)離譜

      不到48小時(shí)連曝3個(gè)瓜,強(qiáng)制取精、楊瀾被罵、回應(yīng)出軌,個(gè)個(gè)離譜

      張麻子講電影
      2025-12-17 21:22:24
      又揪出來(lái)一個(gè)巨貪,金額高達(dá)9.7億,首富夫人郝斌跨境逃亡失敗了

      又揪出來(lái)一個(gè)巨貪,金額高達(dá)9.7億,首富夫人郝斌跨境逃亡失敗了

      軍機(jī)Talk
      2025-12-16 11:06:32
      宋丹丹也沒(méi)想到,冠上“宋”姓的兩個(gè)孫子,如今已經(jīng)開(kāi)始為她爭(zhēng)光

      宋丹丹也沒(méi)想到,冠上“宋”姓的兩個(gè)孫子,如今已經(jīng)開(kāi)始為她爭(zhēng)光

      豐譚筆錄
      2025-12-17 10:01:44
      再也不慣著!楊鳴大鬧裁判,被連判3個(gè)技犯遭驅(qū)逐,自己打敗自己

      再也不慣著!楊鳴大鬧裁判,被連判3個(gè)技犯遭驅(qū)逐,自己打敗自己

      南海浪花
      2025-12-17 22:02:24
      大鵬談被搜狐辭退:對(duì)電影播放有分歧,沒(méi)有補(bǔ)償金

      大鵬談被搜狐辭退:對(duì)電影播放有分歧,沒(méi)有補(bǔ)償金

      鞭牛士
      2025-12-17 17:59:55
      常務(wù)副皇帝怡親王胤祥后人今何在:九世孫退休前是北京副處級(jí)干部

      常務(wù)副皇帝怡親王胤祥后人今何在:九世孫退休前是北京副處級(jí)干部

      銘記歷史呀
      2025-12-17 17:42:20
      越來(lái)越多孩子得白血病?醫(yī)生坦言:家里4樣?xùn)|西是禍根,趁早扔了

      越來(lái)越多孩子得白血病?醫(yī)生坦言:家里4樣?xùn)|西是禍根,趁早扔了

      DrX說(shuō)
      2025-11-19 14:42:09
      張學(xué)良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門(mén),他為何閉口不談?

      張學(xué)良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門(mén),他為何閉口不談?

      歷史回憶室
      2025-12-16 14:26:14
      連續(xù)退賽80天,鄭欽文再破天花板,讓李娜和整個(gè)網(wǎng)壇“沉默”了

      連續(xù)退賽80天,鄭欽文再破天花板,讓李娜和整個(gè)網(wǎng)壇“沉默”了

      好賢觀史記
      2025-12-17 14:07:35
      2025-12-17 22:52:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11943文章數(shù) 142512關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬(wàn)億靠畫(huà)餅 Waymo值千億靠跑單

      頭條要聞

      捐贈(zèng)博物館價(jià)值8800萬(wàn)的名畫(huà)現(xiàn)身拍賣(mài)市場(chǎng) 捐贈(zèng)方發(fā)聲

      頭條要聞

      捐贈(zèng)博物館價(jià)值8800萬(wàn)的名畫(huà)現(xiàn)身拍賣(mài)市場(chǎng) 捐贈(zèng)方發(fā)聲

      體育要聞

      短短一年,從爭(zhēng)冠到0勝墊底...

      娛樂(lè)要聞

      狗仔曝?zé)岵〗愕軕僬嬲劻耍浚浚?/h3>

      財(cái)經(jīng)要聞

      重磅信號(hào)!收入分配制度或迎重大突破

      汽車(chē)要聞

      一車(chē)多動(dòng)力+雙姿態(tài) 長(zhǎng)城歐拉5上市 限時(shí)9.18萬(wàn)元起

      態(tài)度原創(chuàng)

      健康
      時(shí)尚
      旅游
      本地
      軍事航空

      這些新療法,讓化療不再那么痛苦

      這才是50歲女人該有的冬季穿搭,既保暖又體面,想不優(yōu)雅都難

      旅游要聞

      大理洱源縣境內(nèi)的G214國(guó)道擅長(zhǎng)蛇形走位,堪稱經(jīng)典的天險(xiǎn)路段

      本地新聞

      云游安徽|踏過(guò)戰(zhàn)壕與石板,讀一部活的淮北史

      軍事要聞

      最新現(xiàn)場(chǎng):山東艦完成年度最后一次海上訓(xùn)練

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 峡江县| 亚洲综合欧美在线一区在线播放| A?V综合久久天堂A?V色欲| 偷看少妇自慰xxxx| 精品无码一区二区三区| 中文字幕无码色综合网| 一边捏奶头一边高潮视频| 卢湾区| 精品无码国产不卡在线观看| 亚洲精品字幕| 国产精品毛片一区二区| 欧美粗大猛烈老熟妇| 新巴尔虎右旗| av香港经典三级级 在线| 侯马市| 在线A级毛片无码免费真人| 精品伊人久久久久7777人| 成人三级久久久久视频| 久久国模吧| 色色色999| 熟妇好大好深好满好爽| 丁香久久婷婷| 精品国产一区二区三区香蕉| 国产97色在线 | 免| 国产熟人av一二三区| 99中文视频| 精品无码毛片| 性色高清xxxxx厕所偷窥| 亚洲播播| 高白浆久久| 国模天堂| 男人天堂手机在线| 久久精品中文字幕免费 | 精品久久久久久无码不卡| 国产精品AV在线观看| 久久婷婷成人综合色综合| 色欲人妻综合网站| 亚洲乱码中文字幕小综合| 韩国无码一区二区三区精品| 国产精品自在自线视频| 久久国产精品日本波多野结衣 |