![]()
圖片來源:網(wǎng)絡
當所有AI生成工具瘋狂地內(nèi)卷優(yōu)化prompt并爭相標榜自己可以一句話生成圖片和視頻時,一支年輕的字節(jié)系創(chuàng)業(yè)團隊,基于自己對于創(chuàng)作的深度理解,用一套積木式創(chuàng)作架構工具同時擊穿了專業(yè)制作人和普通用戶的痛點,構建了一個自成循環(huán)的創(chuàng)作生態(tài)。這支團隊就是我們今天對話的主角——ArtArch。
2024年底成立的ArtArch,在2025年初就連續(xù)完成了兩輪融資,投資方包括錦秋基金、九合創(chuàng)投、BV百度風投。十月底,ArtArch 發(fā)布了自己的第一款產(chǎn)品——Skira。
在加入字節(jié)之前,ArtArch的創(chuàng)始人兼CEO黃嚴已經(jīng)完整走過一條從底層系統(tǒng)到大規(guī)模業(yè)務的技術路徑。在北大念碩士期間,就以第5號員工的身份加入了格靈深瞳,從早期到上市,7年時間,把算法、后端、前端、工程架構、大數(shù)據(jù)中心、機器學習平臺做了個遍。
2020年,黃嚴加入了字節(jié)跳動AI Lab,擔任工程研發(fā)leader,這一次,他又站到了整個創(chuàng)作與視覺體系的“系統(tǒng)中樞”。 AI Lab這個部門后來整合成“智能創(chuàng)作”部,其主要任務就是把創(chuàng)意創(chuàng)新的鏈路,不管是模型還是非模型、算法還是特效、剪輯還是渲染,全部工程化,變成 API、SDK、服務,供各業(yè)務線調(diào)用。這段經(jīng)歷為后來黃嚴創(chuàng)業(yè)做ArtArch打下了的堅實基礎。
“我深刻地感受到,創(chuàng)作正在從“拍—編—剪”時代,變成“用想象力構建作品”的時代。這成為我創(chuàng)業(yè)的底層邏輯。”黃嚴這么形容字節(jié)那段經(jīng)歷給他帶來的啟示。
ArtArch近日發(fā)布的短視頻生成產(chǎn)品Skira分為兩個版本,供專業(yè)制作人搭建各種玩法模板的PC端,和供普通用戶低門檻使用各種玩法生成視頻并分發(fā)的App端。值得關注的是Skira 的PC版采用了一種積木化的工具思路,將不同的模型和效果設計成模塊,制作人可以通過拖拽的方式任意組合,形成工作流。這一獨特的創(chuàng)作方式被媒體稱作“AI 工作流樂高化”。
而Skira得以實現(xiàn)這種獨特創(chuàng)作方式的底層原因,是被稱作“想象力引擎”的創(chuàng)作架構。這套引擎內(nèi)置了ArtArch 團隊自己打造的編譯器和編程語言,把多模態(tài)模型的能力、創(chuàng)作素材、工作流等內(nèi)容,都封裝進平臺里。這也是ArtArch團隊的核心能力。
近日,我們有幸與ArtArch的創(chuàng)始人黃嚴進行了一場深度對話,在為我們解惑了其獨特的創(chuàng)作AI設計思路的同時,也讓我們?nèi)媪私饬酥谱魅巳后w的真實狀態(tài)與Skira的商業(yè)野心。
以下為創(chuàng)投家與黃嚴的完整對話,略有刪減
創(chuàng)投家:很多公司都在搶奪自然語言交互的第一入口,盡全力去降低普通人使用復雜創(chuàng)作工具的門檻,咱們?yōu)槭裁催x擇了一條完全不同的道路呢?
黃嚴:我個人非常喜歡內(nèi)容和創(chuàng)作,而我們團隊對于創(chuàng)作者這個群體也有著更深度的理解。
我們發(fā)現(xiàn)有時候語言是有障礙的,大家都在追求用一句話去描述一個意圖,但其實我們的表達和我們所想的內(nèi)容本身就有誤差。可能我們腦海中真正想的東西Level很高,但未必能把這些想法和感覺準確傳達出來,模型的理解將會進一步放大這種誤差。
今天的模型在去理解意圖、匹配預期上已經(jīng)很強了,但是你仍會發(fā)現(xiàn),prompt類型的模型的產(chǎn)出總是不太穩(wěn)定,有時候漸行漸遠。有時候你想把它拉回來,結果它又變得更遠了。相信很多用過AI創(chuàng)作工具的人都有這種感受。
而創(chuàng)作本身就是一種表達,像語言藝術一樣,是可以有結構的。我們的團隊平時會去學習導演學之類的表達方式,這些本身就是套非常復雜的體系。我們看一個視頻時感覺行云流水,但其實里邊的主體怎么展現(xiàn),鏡頭結構怎么設計,轉(zhuǎn)場怎么過度,什么時間進入,甚至背景音效怎么配合,這些編排層面的復雜工作如果僅靠提示詞去傳達,我認為并不能真正貼合創(chuàng)作者本意。我們還是希望給予他們一個更貼合、更精準的表達權力,讓他們怎么想的,就能怎么實現(xiàn)。這個就涉及到對于用戶創(chuàng)意語境的理解,世界觀構架,再到創(chuàng)意結構的構建這個過程。
創(chuàng)投家:這種方式是一種過渡方案,還是未來會長久存在的方式?
黃嚴:其實這兩種創(chuàng)作方式并不沖突。當前我們的想象力引擎,本質(zhì)上是一套面向 AI-Native 時代的創(chuàng)作操作系統(tǒng)(Creative OS)。
這套系統(tǒng)并不是從生成結果出發(fā),而是從理解創(chuàng)作者的創(chuàng)作意圖與語境開始,逐步完成世界觀構建、創(chuàng)意結構生成,再到創(chuàng)作流程的自動化或半自動化編排,最終產(chǎn)生成片,并通過持續(xù)的交互式反饋實現(xiàn)自我迭代與演進。
我們所做的,是對“從一個想法到持續(xù)產(chǎn)出作品”這一過程進行底層重構,把原本高度依賴個人經(jīng)驗、工具拼接與反復試錯的創(chuàng)作行為,轉(zhuǎn)化為一個可被系統(tǒng)理解、可被工程化執(zhí)行、并能夠持續(xù)進化的完整創(chuàng)作閉環(huán)。
在這套創(chuàng)作OS架構中,Agent 與各類生成式模型并不是孤立調(diào)用的能力單元,而是被統(tǒng)一納入創(chuàng)作系統(tǒng)之中,根據(jù)不同階段承擔不同角色,充分發(fā)揮各自在理解、生成與反饋環(huán)節(jié)的優(yōu)勢。
正是這種從“意圖 → 結構 → 流程 → 作品 → 反饋 → 演化”的系統(tǒng)級設計,構成了想象力引擎的核心,也使其不再只是一個生成工具,而是一套能夠支撐持續(xù)創(chuàng)作與表達演進的底層基礎設施。
創(chuàng)投家:您認為AI創(chuàng)作工具最終給出的,應該是一個模型認為的最優(yōu)解?還是一個最貼合創(chuàng)作者意圖的解?
黃嚴:我更希望是后者,當前很多工具是前者。想象力引擎的核心是語境最優(yōu),是希望讓創(chuàng)作者的所想快速轉(zhuǎn)化為現(xiàn)實。
用戶的想象力其實是某種語境,是有明確目標感的意圖。但其實有很多語境是創(chuàng)作者自己都沒有描述出來的東西,需要模型去確認,需要替用戶產(chǎn)生聯(lián)想和構建,這其實是去理解他的內(nèi)心世界的過程,從而產(chǎn)出一套貼合他語境最優(yōu)的結果。
還是那句話,我們想做的事情是保護和完善創(chuàng)作者的表達權,而不是去追求與創(chuàng)作者意圖違背的結果,哪怕這個結果看起來更優(yōu)。
創(chuàng)投家:Skira的PC和APP端之間是如何協(xié)同的?
黃嚴:Skira App更ToC,是面向全球用戶的“一鍵創(chuàng)作”玩法宇宙。Skira PC更面向制作人與技術流創(chuàng)作者的“AI 工作流樂高化”創(chuàng)作工具。有了它們,Skira不只是一個應用,而是一套內(nèi)容流動機制與創(chuàng)作者生產(chǎn)力系統(tǒng)。
等于,Skira的整個模式從一開始就不是單邊供應或單邊消費,而是以“玩法”為中心的,供給—消費雙向循環(huán)。C 端需要專業(yè)創(chuàng)作者供給玩法,創(chuàng)作者的創(chuàng)意也需要C端用戶去消化、使用、再表達。所以Skira天然是一種平臺結構,PC和App分別承載了平臺的兩端。
創(chuàng)投家:現(xiàn)在Skira的生態(tài)中專業(yè)制作人和C端玩家的數(shù)量大概各是多少?
黃嚴:Skira目前還處在一個增長階段,我們不是很強調(diào)純粹數(shù)量上的增長,更在意質(zhì)量。可以透露的是,現(xiàn)在 Pro C 和 C 端用戶的比例是1:10。
創(chuàng)投家:這個想象力引擎的上限在哪?為什么現(xiàn)階段主要生成的內(nèi)容以30秒短視頻內(nèi)容為主?
黃嚴:能力邊界其實不由引擎或是模型決定,最終其實是由我們實際上可以支撐創(chuàng)作者的顆粒度來決定。
目前為什么選擇30秒短視頻?其實核心原因是我們的團隊非常懂30秒內(nèi)的創(chuàng)作邏輯。在短短30秒里,前三秒怎么抓人、后幾秒如何防止跳出、如何提升完播率,其實都是非常有挑戰(zhàn)的,在30s這個區(qū)間內(nèi)幾乎可以遇到AI創(chuàng)作的所有挑戰(zhàn),某種程度上比中長視頻更復雜,中長視頻反而AI作為輔助,制作團隊的作用會更大些。而我們關注的,正是如何在這30秒內(nèi)去直觀提升創(chuàng)作者意圖表達的效果。
而想象力引擎的上限其實是根據(jù)創(chuàng)作者能力界定的,核心維度在于創(chuàng)作者自身的想象力或者語境。
創(chuàng)投家:Skira和剪映的核心區(qū)別是什么?
黃嚴:剪映確實是一個非常偉大的創(chuàng)作工具,我也有幸參與了整個開發(fā)過程,但我們走的路徑確實完全不一樣。
剪映的出發(fā)點,是在剪輯的過程中融入一些創(chuàng)作的巧思,加入一些AI的內(nèi)容,它的核心是替抖音的用戶加速創(chuàng)作,推給用戶的東西叫作模板。
而我們提供給用戶的是制作人們搭建的玩法,玩法產(chǎn)生的不光是一個短視頻,更是一種表達方式,其交互形式更加多樣,受眾人群也更廣泛。同時,基于這批制作人生態(tài)引申出來的社交和社群屬性,也是我們更希望去深度發(fā)掘的東西。
創(chuàng)投家:Skira的商業(yè)化路徑是如何設計的?
黃嚴:我們商業(yè)化上的邏輯是,先通過好的技術架構,降低對于昂貴模型的依賴,以此來做好成本管控。
在此基礎上,我們希望大家可以先玩起來。增長雖然是第一優(yōu)先級,但我們從來不追求一波流,而是希望制作人能夠留存下來持續(xù)地進行創(chuàng)作。
所以我們設置的收費模式更多的是,當C端用戶真的喜歡我們的產(chǎn)品以及一些心儀的玩法,當制作人真的喜歡我們的創(chuàng)作架構進行更多的玩法創(chuàng)作時,他們才需要去購買一些創(chuàng)作的Credit包或者訂閱。我們更傾向用我們的玩法去擊中一些真正對玩法感興趣的人,所以推廣上一直也比較克制,不會去做一些激進的商業(yè)化,以免制作人的人群畫像出現(xiàn)偏差。
創(chuàng)投家:咱們是通過什么渠道獲取這些專業(yè)制作人的?咱們的生態(tài)里會給到他們怎樣的激勵?
黃嚴:專業(yè)制作人并不是一個憑空冒出來的新群體,中國的短視頻生態(tài)里本身就存在著一批AIGC的創(chuàng)作者和玩家,他們在抖音、小紅書生態(tài)里尤為活躍,而且極富創(chuàng)意。
站在他們角度,其實并不缺商單,現(xiàn)有流量平臺帶給他們的收入已經(jīng)比較可觀。他們需要另外的平臺有自己拿得出手的作品,以及更高的知名度,這個也是他們所追求的因為這樣會提升他們本身的議價能力。
所以他們普遍會有另兩個痛點,一個是工具不趁手,一個是無法被看見。比如說現(xiàn)在一個制作人要做一個短片,他需要先在Midjourney、可靈、即夢這些平臺上走一圈,再回到剪映,非常麻煩。而我們的思路是幫助他們提供一個可以構建小玩法,搭建小巧思的工具,在玩法里邊融入他的創(chuàng)作理念。另一面,制作人搭建的玩法會被推到臺前,普通用戶也可以在我們的生態(tài)里玩起來,就像在體驗制作人的世界觀一樣。
激勵這方面,根據(jù)玩法被調(diào)用大小,我們會提供分傭和補貼的策略,同時在制作人生態(tài)里我們還會組織一些創(chuàng)作比賽,也會給到一些現(xiàn)金獎勵。這算是給制作人開辟了一條新的收入路徑。
創(chuàng)投家:目前創(chuàng)作者使用Skira的反饋如何?
黃嚴:上線一個月,Skira已經(jīng)吸引了一批全球化的創(chuàng)作者KOC。
一些正反饋是,有創(chuàng)作者利用Skira中的玩法模板,已經(jīng)在YouTube上從0起號獲得單視頻上萬播放,而且大家會隔天或者隔幾天過來繼續(xù)看看有沒有什么新的好玩的玩法,觀察到的很多指標都超預期。
我們團隊一直在探尋短視頻創(chuàng)作者為什么能夠產(chǎn)出流量優(yōu)秀的作品,并形成了可實操的方法論,最后形成了引擎,希望AI時代來臨的時候,可以讓更多人真正把自己的想象力變成一種表達能力,并成為全球AI-Native創(chuàng)作的基礎設施。(作者|郭虹妘,編輯|陶天宇)
更多對全球市場、跨國公司和中國經(jīng)濟的深度分析與獨家洞察,歡迎訪問 Barron's巴倫中文網(wǎng)官方網(wǎng)站
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.