我輸入了一段 prompt,按下生成。手還擱在鍵盤上呢,視頻已經出來了。
畫面前景是一杯冒著熱氣的黑咖啡,背景模糊;隨后焦點平滑轉移,清晰展現出背景中一位翻閱舊書的女孩。
改了兩個詞,把光線方向調了一下,再按一次。又出來了,質感沒掉。提示詞寫得很隨意,就是腦子里的畫面用大白話說了一遍,沒有刻意堆關鍵詞,模型全聽懂了。
![]()
提示詞:前景是一杯正在冒著熱氣的黑咖啡,占據畫面主導位置,背景模糊。隨后,鏡頭焦點自然地轉移到背景中,清晰地展現出一位正在翻閱舊書的女孩。
這是 PixVerse V6 給我的第一感受。不是「效果好」三個字能概括的,準確說是「這個效果,居然這個速度就出來了」。
PixVerse 出片快,這件事圈里不算新聞。大多數 AI 視頻工具還在用排隊考驗耐心的時候,PixVerse 已經是同類里生成速度最快的選手。在 Artificial Analysis 的視頻生成模型排行榜上,PixVerse V6 更是處在第一梯隊。
![]()
不過如果 V6 只是「更快了一點、畫質更好了一些」,那它只是一次常規迭代,不值得單獨拿出來聊。
V6 做的事情,是把「快」從一個技術參數,變成了一種創作層面的結構性優勢。指令理解強了,提示詞不用反復打磨;畫質也更穩了,這些環節省下來的時間疊在一起,比單純的生成速度提升值錢得多。
換句話說,當出片質量夠穩定、速度夠快,創作者的瓶頸就不再是工具,而是想法本身 。AI 沒有讓創作者貶值,它反而讓好想法比以前更值錢了。
不只是快,每一幀也經得起放大看
PixVerse V6 的操作本身沒有任何門檻,新手也能輕松上手。
打開拍我 AI,在輸入框里用自己的話描述想要的畫面,選好分辨率、畫面比例和時長,點生成就行。支持 360P 到 1080P 輸出,橫屏豎屏都能選,單次生成時長可以自己控制。
附拍我 AI 網頁端地址: https://pai.video
V6在指令理解上有了肉眼可見的進步,只需簡單描述創作意圖就足夠,無需堆砌專業術語,它明白你要的是什么光線、什么氛圍、什么景別,這也導致省下的不僅是時間,還有反復推敲提示詞的精力。
也支持上傳參考圖。想還原某個風格、想鎖定角色長相,把圖扔進去就行,模型會參照著生成。
![]()
演示生成過程
V6 最讓我意外的進步在于物理仿真。
我試了一段微距鏡頭。金黃色蜂蜜緩慢滴落,拉出晶瑩的絲線,落在松餅上緩緩散開。絲線被重力拉細,接觸面的擴散速度也和蜂蜜的黏度匹配。
它有重量,有重力,有因果。
![]()
提示詞:微距鏡頭。高粘度的金黃色蜂蜜正緩慢地從木質攪拌棒上滴落,拉出長長的、晶瑩剔透的絲線,最后重重地落在下方剛出爐的松餅上,蜂蜜在接觸面緩緩散開。畫面具有極強的真實物理運動邏輯。
以前 AI 視頻里的物理世界是「會動的像素」,V6 里的物體在遵守物理定律。這一點的意義超出視覺層面。我們判斷一個畫面真不真,靠的是一種直覺:這杯水倒出來的方式對不對?這滴蜂蜜落下的軌跡合不合理?V6 在這個層面上交出了一份像樣的答卷。
物理仿真解決的是世界真不真實,而人像質感解決的是人的質感對不對。
這是 AI 視頻最容易翻車的科目。稍有不慎就是恐怖谷。五官精致但表情僵硬,皮膚光滑但質感像硅膠,眼睛很亮但眼神沒焦點。你能認出這是一張臉,但直覺會告訴你,這不是一個人。
V6 在這方面讓我重新有了新的審視。一些圈內創作者拿它和 Seedance 放在一起比,結論基本是:兩者互有勝負,很難說誰壓過誰。
我試了一段中年男性演員的面部特寫,他正努力克制哭泣的沖動,淺景深,柔和側光。出來的結果很難讓人移開視線。鼻翼輕微顫動,眼角濕潤,這幾個動作之間有時間差,有層次,有內在邏輯。
![]()
這種微表情的層次感,讓人物開始有了一種 AI 演員的即視感。對比之下,以前 AI 人像的情緒更接近「狀態切換」,V6 里的情緒有了過程。皮膚質感的取向也值得單說——肌理,毛孔、細紋、光線下的皮膚色差都保留。
打斗戲是 AI 視頻的體能測試。
拳頭要打在正確位置,被打的人要有合理反應,身體運動慣性要連貫,多角色空間關系不能穿模。任何一個環節崩了,就變成搞笑視頻。許多 AI 視頻模型的生成結果要么是兩個人在做體操,要么揮拳的手臂穿過了對方的臉。
在體驗 V6 的過程中,我生成了一段大雨滂沱的泥濘小巷里,兩名武術高手正在激烈近身肉搏的場景。一記重拳擊中對方下顎,雨水和汗水隨沖擊飛濺,受擊者的面部肌肉因沖擊力產生真實的震顫。
![]()
畫質之外,真正讓我興奮的是 V6 補齊了一套鏡頭語言能力。
變身特效方面,我生成了一臺科技感極強的機械無人機在空中急速飛行,隨后快速從金屬形態幻化為一條由流動墨水和水墨線條組成的、散發幽藍光芒的水墨神龍。
![]()
提示詞:中國風動漫風格,無人機在飛行過程中快速從金屬形態幻化為一條由流動的墨水、墨點和水墨線條組成的、散發著幽藍光芒的水墨神龍。
過渡自然,沒有常見的像素閃爍和邊緣殘影。金屬的硬度和水墨的流動之間有一個過渡狀態,兩種質感都沒有被粗暴切斷,整個變身過程更接近融合,而非替換。
運鏡能力同樣有驚喜。電影級航拍視角下,一臺無人機在廢棄的、生銹的工業廠房內部急速穿行。廠房的空間感、金屬質感的光線處理、高速運鏡時畫面的穩定性,三件事同時做到位,沒有出現 AI 常見的那種「不知道該看哪」的混亂感。
![]()
提示詞:電影級航拍視角,現實主義風格。一臺無人機在廢棄的、生銹的工業廠房內部急速飛行。
還有一個方向是子彈時間。黑客帝國式的視角旋轉,主體定格,背景動態延續。這類鏡頭對時間感的控制要求很高,稍有偏差就會變成慢放,V6 處理得比較克制,速度分層是有的,沒有用力過猛。
我還試了兩個對空間穿越要求更高的場景。第一個是課堂。無人機視角從走廊切入教室,鏡頭跟著這股氣流穿出教室,拉到整個校園上空。試卷和白紙被氣流卷起,滿天都是,運鏡軌跡卻沒有斷。
第二個是蜜蜂從窗縫擠進來,穿過臥室、客廳,找到廚房里的蜂蜜罐再飛出。每個房間光線和景深都不同,換場時蜜蜂飛行慣性有輕微滯后,和真實昆蟲的節律對得上。
多鏡頭切鏡可能是對實際工作流貢獻最大的能力。一段時尚女裝廣告短片,三個鏡頭的銜接流暢,色調溫暖統一,沒有 AI 的拼湊感。
![]()
還有三個我比較喜歡的運鏡和場景調度的測試。
比如一架紙飛機在維多利亞式書架間起飛,書本跟著騰空排成隧道,隨后場景切進腦內微觀世界,神經元在半透明星云狀組織里閃著熒光,像縮小版的銀河系。
同樣是紙飛機在圖書館迷宮里做非線性飛行,俯沖、側滑、擦邊過障礙,鏡頭緊緊跟隨,轉彎時有強烈的側滑感,沒有糊掉。
![]()
前腳還是琥珀暖色的圖書館,進入腦內世界后立刻切成深藍和深紫,但因為運鏡沒有斷,切換反而變成了一種視覺沖擊,并不突兀。
![]()
這些能力單拿出來每一項都是加分項。組合在一起,意味著 V6 開始具備完整的鏡頭語言能力了。
最后一個讓我印象深刻的點,不是畫面,是聲音。
V6 在開啟 Audio 之后,音頻適配有了明顯增強。我試了一段微縮模型視角的場景:遠處火山正在噴發,小人國村民四散奔逃,一只巨大的手拿著透明碗從天而降,將整個村莊罩住,透明碗落下的瞬間帶著空氣被壓縮的細微震動。
特別是 ASMR 類場景。下雨天的窗戶、篝火噼啪聲、書頁翻動。這些畫面本身就追求沉浸感,音頻質量直接決定你是在看視頻還是沉浸在場景里。
一個人暴力出片叫效率,一群人暴力出片叫生產力
如果 V6 只是一個更快更好的 AI 視頻模型,故事到這里可以收尾了。但 PixVerse 顯然不打算只講到這里。
據了解,這次還同步上線了兩個東西:Team Plan 和 Mini Apps。
Team Plan 是給 2 到 15 人的工作室用的。核心機制很簡單,團隊共享一個積分池。
不再是每人一個賬號各算各的,而是整個團隊統一消耗,按角色分配權限。老板看全局,創意總監管項目分組,剪輯師專注出片。個人空間的素材和模板一鍵同步到團隊空間,不用在群里來回傳文件。
![]()
聽起來不復雜,但解決的問題很真實。以前工作室用 AI 視頻工具,就是每人開各自的賬號,出了好素材在群里互傳,版本管理靠文件命名加日期。這跟十年前用 U 盤傳 PPT 沒什么本質區別。
Team Plan 做的事情,就是把 AI 視頻從個人工具升級成了團隊生產線。一個人連出十條挑最好的叫個人效率,五個人各出十條,五十條里挑一條炸裂的,叫團隊生產力。
Mini Apps 走的是另一條路。使用方式簡單到不需要解釋:上傳幾張商品圖,系統自動幫你剪成一條完整的廣告視頻。不用懂剪輯,不用知道什么叫鏡頭語言。
![]()
一個淘寶店主、一個小紅書博主、一個街邊奶茶店老板,都能在幾分鐘內拿到一條可以直接發的產品視頻。
V6 模型是給創作者的武器,Mini Apps 是給所有人的傻瓜相機。當創作門檻被壓到零,暴力出片就不只是創作者的方法論了,它變成了人人能用的基礎設施。
快,才是最貴的畫質
畫質夠好,速度夠快,成本這道關也值得單獨說一說。
720p 分辨率常態成本大概為每秒 0.04 美元,放在當前市場里已屬低位,對應的卻是第一梯隊的生成質量,4 月 7 日前購買會員至高打七折,生成時積分消耗再減免 30%,進一步把規模化出片的成本壓了下來。
![]()
這讓我想到攝影從膠卷到數碼的變化。
膠卷時代一卷 36 張,按一次快門前得在腦子里構圖三分鐘,因為每一張都有成本,但快門本身的質量沒有區別。數碼時代的攝影師怎么拍?因為每一張都清晰、都夠用,所以可以連拍 200 張,事后選構圖最好的那張。沒人會說這「不嚴肅」,因為最終給觀眾看的永遠是那張最好的。
V6 讓 AI 視頻創作進入了這種「數碼時代」。
而 PixVerse 對「快」的理解,也早已超出了生成速度本身。
從早期的高速生成,到 R1 的實時交互,到 V6 的強指令理解讓描述變得更自然,再到 Team Plan 把協作效率拉到團隊量級,這條線串起來,體現的是 PixVerse 在多個維度上同時提速:生成速度快、指令理解準確、協作效率提升。
支撐這一切的,是 PixVerse 扎實的模型迭代能力。
能在排行榜上持續保持第一梯隊,靠的是每一代產品都在扎實啃硬骨頭,物理仿真、人像質感、鏡頭語言,每一項都是難而正確的方向。V6 的初衷很純粹:讓創作者把精力放在創意上,其余的交給工具。
當一個工具把高質量的生成變成了觸手可及的日常,又把使用門檻壓到零、把協作效率拉到團隊級別,它就不再只是一個「模型」了。它正在變成內容時代的基礎設施。
PixVerse V6 開啟了 AI 視頻的暴力出片時代,快到不講道理,好到能直接交片。
這個時代才剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.