ONE2X 正式發(fā)布了 Medeo 1.0,很易上手
https://www.medeo.app/
ONE2X 剛完成A輪,累計(jì)融資額近2300 萬(wàn)美元
資方包括清流、九合、聯(lián)想,老股東美團(tuán)龍珠和小米王川繼續(xù)跟投,更早的投資方還有紅杉中國(guó)和百川
團(tuán)隊(duì)約 30 人,核心成員來自月之暗面、字節(jié)、阿里、快手
晨然是 Medeo 的產(chǎn)品負(fù)責(zé)人,是最典型的 AI 產(chǎn)品經(jīng)理樣本:懂技術(shù)、善于思考、既了解模型的脾氣,又明白創(chuàng)作者的痛苦
他之前是全棧工程師,剪視頻剪了 8 年,做過 B 站 UP 主,上傳過六七十個(gè)視頻,從編劇、導(dǎo)演到剪輯全流程都干過
去年 7 月的時(shí)候,晨然跟我說他加入了一個(gè)視頻工具創(chuàng)業(yè)公司,希望能創(chuàng)造點(diǎn)與眾不同的東西
當(dāng)時(shí)沒太當(dāng)回事,但直到前段時(shí)間才知道他去了 ONE2X 做 Medeo
優(yōu)秀的人,總是可以與優(yōu)秀的團(tuán)隊(duì),一拍即合
![]()
ONE2X 的創(chuàng)始人王冠,則更是有趣
是月之暗面前模型產(chǎn)品負(fù)責(zé)人,也是月之暗面第一個(gè)離職創(chuàng)業(yè)的人
ONE2X 的由來
在加入月之暗面之前,王冠嘗試過三次創(chuàng)業(yè)方向,每一次都精準(zhǔn)地踩在了 OpenAI 的更新路徑上
? 第一次,
做寫作輔助工具,剛跑通 Demo,ChatGPT 發(fā)布了? 第二次,
做「Excel 轉(zhuǎn)圖表」的代碼生成工具,剛看到效果,GPT-4 發(fā)布了,自帶 Code Interpreter,直接覆蓋? 第三次,
做 Agent 工作流,剛準(zhǔn)備融資上會(huì),OpenAI Plugins 發(fā)布了,思路完全撞車
這讓他意識(shí)到一個(gè)問題
如果不理解模型能力到底是怎么來的,未來會(huì)朝什么方向發(fā)展,你做的事情和模型的關(guān)系是什么,那就是在一個(gè)非常虛無的地基上構(gòu)建想法
于是,他去了月之暗面,待了一年,搞清楚幾件事之后出來創(chuàng)業(yè)
他的結(jié)論指向一個(gè)詞:數(shù)據(jù)
王冠把 AI 行業(yè)的發(fā)展分成三個(gè)階段:
?第一階段,拼公域數(shù)據(jù):誰(shuí)能更快清洗互聯(lián)網(wǎng)公開數(shù)據(jù),這個(gè)階段已經(jīng)過去,格局已定;
?第二階段,拼領(lǐng)域數(shù)據(jù):「我有你沒有」的行業(yè)私有數(shù)據(jù),這利好大廠;
?第三階段,拼內(nèi)生數(shù)據(jù):「之前世界上不存在的數(shù)據(jù)」
在 ChatGPT 出現(xiàn)前,沒有通過對(duì)話方式解決各種問題的海量自然語(yǔ)言數(shù)據(jù)。這份數(shù)據(jù)是因?yàn)橛辛?ChatGPT 這個(gè)產(chǎn)品形態(tài),才慢慢產(chǎn)生的
只有通過設(shè)計(jì)新的產(chǎn)品形態(tài)產(chǎn)生內(nèi)生數(shù)據(jù),應(yīng)用層公司才能建立壁壘
這是王冠選擇做視頻的底層邏輯之一
視頻是價(jià)值更高的模態(tài),在美國(guó)市場(chǎng),有 20-30 家做視頻處理的 SaaS 產(chǎn)品,ARR 都能做到幾千萬(wàn)美金
「一鍵生成」的問題
Medeo 的定位是「全品類對(duì)話式 AI 視頻創(chuàng)作工具」
用對(duì)話做視頻,而非一鍵生成視頻
今年 5 月,Medeo 發(fā)布了早期測(cè)試版本
同期的競(jìng)品不少,納米 AI 做得最早,小云雀、360 也在做類似的事
![]()
到了 10 月,這些聲音基本都沒了信息插播:國(guó)慶之初,Sora2 發(fā)布
晨然復(fù)盤過這件事。他的結(jié)論是:剪輯和創(chuàng)作絕對(duì)不是線性的過程,是一個(gè)反復(fù)迭代的過程
「一鍵生成」的問題在于,它剝奪了用戶迭代和修改的權(quán)利。一鍵出的視頻不夠好,用戶想改又改不了,這就成了死局
如果一鍵真能出好視頻,廠商應(yīng)該直接生產(chǎn)內(nèi)容去賣,而不是做工具
![]()
在目前階段,一鍵生成還未走通
還有一個(gè)例子。有些競(jìng)品做了「畫分鏡」的功能,用戶嘴上都夸好用,但實(shí)際上數(shù)據(jù)很難看,根本沒人用
分鏡只是傳統(tǒng)流程中階段性的產(chǎn)物,創(chuàng)作者真正關(guān)心的是最終效果。Sora-2 出來之后可以直接繞過分鏡出更好的視頻,內(nèi)置了多分鏡能力,對(duì)「先確定分鏡再做視頻」的工作流是降維打擊
![]()
類似虛榮指標(biāo),或許還可以有「虛榮功能」
Medeo 早期版本其實(shí)是一個(gè)半成品態(tài),生成系統(tǒng)還沒完全搭建好。這次 1.0 版本,是把生成系統(tǒng)的架構(gòu)搭建完成了,可以支持對(duì)話式連續(xù)創(chuàng)作、語(yǔ)義化 Workflow 的使用方式
這個(gè)形態(tài)參考了 Cursor
為什么是 Cursor
這里有個(gè)挺微妙的發(fā)現(xiàn)
晨然在做 Prompt Engineering 和 Context Engineering 的時(shí)候注意到:
目前主流的大模型,訓(xùn)練數(shù)據(jù)里高質(zhì)量的邏輯部分,很大比例來自于 Coding 場(chǎng)景
這事兒就顯得非常有趣:
在調(diào)試 Prompt 的時(shí)候,越對(duì)齊它的訓(xùn)練數(shù)據(jù)范式,模型就越聽得懂
他試過用視頻行業(yè)的術(shù)語(yǔ)去寫 Prompt,效果很差
但用類似代碼的邏輯,效果瞬間提升
非常有趣
要想讓 AI 聽得更懂,可以先把任務(wù),偽裝成寫代碼
![]()
這...讓我想到了繼剛提示詞
Cursor 還有一個(gè)值得借鑒的,是及時(shí)反饋
Agent 如果 3 秒內(nèi)沒給反應(yīng),用戶就會(huì)慌
在這里,Cursor 的交互做得最好
![]()
Cursor 和視頻生成,隔空互動(dòng)了
視頻和代碼最大的區(qū)別,是Validation
代碼寫錯(cuò)了, IDE 會(huì)報(bào)錯(cuò)
但視頻創(chuàng)作沒有「錯(cuò)誤」,它是風(fēng)格化的,允許幻覺
視頻沒有語(yǔ)法報(bào)錯(cuò),只有好不好看
![]()
這意味著 Medeo 沒法像寫代碼那樣做自動(dòng)化測(cè)試,得自己造「負(fù)反饋鏈路」
通過 AI 視覺模型去給用戶「報(bào)錯(cuò)」或「提示」
![]()
這也呼應(yīng)了王冠的產(chǎn)品架構(gòu)思路,他把生成系統(tǒng)分成三層:
? 底層是 DSL(領(lǐng)域特定語(yǔ)言),定義了視頻制作的原子操作;
? 中間層是 Context 系統(tǒng),負(fù)責(zé)把用戶模糊的意圖轉(zhuǎn)化為精確的指令;
? 頂層是 Environment,讓人和 AI 在里面共同活動(dòng)
「Context is Everything」,王冠反復(fù)強(qiáng)調(diào)這句話
![]()
基座模型大家用的都一樣,產(chǎn)品的優(yōu)劣完全取決于你在模型之外構(gòu)建的上下文
Medeo 工具
你在對(duì)話框里告訴 Medeo 你想做什么,它會(huì)幫你寫腳本、拆分場(chǎng)景、規(guī)劃節(jié)奏,然后自動(dòng)匹配媒體素材、語(yǔ)音音色、背景音樂,最后把所有東西編排到時(shí)間軸上
![]()
Medeo 產(chǎn)品界面,非常清晰、易用
三種玩法:
語(yǔ)義化工作流
用自然語(yǔ)言告訴 Medeo 你想如何制作視頻,包括視頻是什么樣、按什么步驟制作、每一步需要什么工具。比如「用圖生圖確保人物一致性生成分鏡,最后用 Sora-2 圖生視頻,然后配英文的解說」。Medeo 能直接響應(yīng)你的方法,按要求執(zhí)行
智能體模式
只描述你對(duì)視頻的想法,讓 AI 自由決策該如何制作。適合不想操心技術(shù)細(xì)節(jié)的人
對(duì)話模式
從一個(gè) idea 出發(fā),通過不斷對(duì)話,明確和完善想法以及視頻內(nèi)容。可以先說「你好」,然后慢慢聊出一個(gè)完整的視頻
這里,核心差異點(diǎn)在于「雙重控制」:既有 AI 對(duì)話式修改的便捷,又保留軌道編輯的手動(dòng)精修能力。交付的是可編輯的剪輯工程文件,不是死的視頻
![]()
目前支持的模型包括: Doubao、Gemini、Midjourney、 Minimax 和 Sora-2
生成的品類,也是全支持:動(dòng)畫、漫劇、科普視頻、教程、MV、廣告,都能做
批發(fā)商 vs 零售商
我問晨然
“Medeo 和可靈、Sora 什么關(guān)系?未來模型能力越來越強(qiáng),會(huì)不會(huì)把應(yīng)用層覆蓋掉?”
回答很直接
他們是供應(yīng)商(批發(fā)商),我們是零售商(加工商)
模型廠是在超市賣礦泉水的,一瓶賣 2 塊錢
應(yīng)用層是在 KTV 里賣礦泉水的,可以賣 20 塊
![]()
應(yīng)用層,通過場(chǎng)景服務(wù)來溢價(jià)
Sora 出來的時(shí)候,晨然說他也慌過,但體驗(yàn)后發(fā)現(xiàn),它解決不了「靈感」和「敘事邏輯」的問題
素材越好,對(duì)剪輯和敘事的要求就越高
王冠有一個(gè)說法:視頻可以分成兩個(gè)世界。物理世界的視頻,攝像頭拍攝的,對(duì)應(yīng)短視頻生態(tài),供給已經(jīng)非常充分;理念世界的視頻,AI 生成的,對(duì)應(yīng)知識(shí)、藝術(shù)、精神信仰類內(nèi)容,以前因?yàn)橹谱鞒杀具^高而稀缺
他把前者比作「夜店、生活廣場(chǎng)、超市」,把后者比作「圖書館、歌劇院、大教堂」
ONE2X 的目標(biāo)是后者
![]()
快手在今年 8 月發(fā)布的二季度財(cái)報(bào)中稱,可靈 AI 的單季收入已超過 2.5 億美元。Runway 在 6 月宣布年化營(yíng)收超過 9000 萬(wàn)美元
市場(chǎng)是存在的。問題是誰(shuí)能吃到應(yīng)用層的溢價(jià)
一個(gè) Remote Native 的組織
ONE2X 的組織形式也值得聊聊
從公司建立第一天開始,就決定以 Remote Native 的形式存在。沒有管理崗,甚至不考勤
王冠把建立組織類比為強(qiáng)化學(xué)習(xí)中「搭建環(huán)境」的過程
每個(gè)員工都是獨(dú)立的智能體
組織的任務(wù)不是去控制員工,而是搭建一個(gè)環(huán)境,讓智能體在其中自主活動(dòng)
Demo 先行
現(xiàn)在這個(gè)版本在 7、8 月份的時(shí)候就已經(jīng)做出來了一個(gè)非常接近的 Demo,一兩周時(shí)間就可以測(cè)試可行性
團(tuán)隊(duì)內(nèi)認(rèn)知閉環(huán)
Cursor 做得好,是因?yàn)閳F(tuán)隊(duì)本身就是自己產(chǎn)品的用戶。程序員、懂 AI 的人,每天高強(qiáng)度使用 Cursor,每個(gè)人既是生產(chǎn)者也是消費(fèi)者,非常清楚自己做的產(chǎn)品到底哪里不好
![]()
ONE2X 組織方法論
但 AI 加視頻比 AI 加 Coding 難一點(diǎn)。AI 加 Coding 很容易在一個(gè)人身上完成閉環(huán),但 AI 加視頻,需要既懂 AI 又懂內(nèi)容的人。如果反饋鏈路放得太遠(yuǎn),迭代速度就會(huì)變慢
所以 ONE2X 的做法是:
既然要做創(chuàng)作工具,團(tuán)隊(duì)本身就得成為創(chuàng)作者
所以,ONE2X 招了很多真正懂內(nèi)容的人,電影系的、影視行業(yè)的編劇,讓他們反復(fù)使用 Demo,更快速地積累產(chǎn)品還有哪些問題
創(chuàng)作者智慧才是壁壘
Medeo 發(fā)現(xiàn)很多用戶是 Prosumer(專業(yè)消費(fèi)者/半專業(yè)人士)
有個(gè)編劇,把自己幾萬(wàn)字的短劇寫作指南喂給 AI,跑通了一個(gè)非常牛的工作流。他甚至覺得手動(dòng)搞比用產(chǎn)品要好
到了 Medeo 中,他可以把這套手動(dòng)流程用自然語(yǔ)言表述的方式「縫」進(jìn)產(chǎn)品里
這給了團(tuán)隊(duì)啟發(fā):下一個(gè)階段的產(chǎn)品,其實(shí)是圍繞「創(chuàng)作者智慧」進(jìn)行服務(wù)
![]()
域民不以封疆之界,固國(guó)不以山溪之險(xiǎn)
工具隨時(shí)可以被替代。但如果用戶的 Prompt 習(xí)慣、項(xiàng)目 Context、Workflow 都沉淀在你這,產(chǎn)品才能成為真正的創(chuàng)作伙伴
所以 Medeo 現(xiàn)在做的很多功能,比如統(tǒng)一腳本格式、世界觀設(shè)定卡、人物小傳,本質(zhì)上都是為了幫助創(chuàng)作者固化這些「獨(dú)有智慧」
王冠表示:未來的創(chuàng)作者會(huì)兩極分化,金字塔尖的藝術(shù)家/專家,他們控制的不是生產(chǎn)內(nèi)容的能力,而是控制生產(chǎn)能力如何被使用的邏輯,不同創(chuàng)作者之間的壁壘在于 Recipe(配方)和 Taste(品味)
作為平臺(tái),不僅要提供錘子,還要幫用戶把敲打手法存下來
最后
現(xiàn)在看到的 AI 應(yīng)用,很像諾基亞手機(jī)上的計(jì)算器或貪吃蛇
作為創(chuàng)業(yè)者,在真正的「iPhone 時(shí)刻」到來之前,可以通過各種方式貼身的感知模型變化,積累數(shù)據(jù)和 Context,為未來做準(zhǔn)備
一切都在成長(zhǎng),一些事情值得記錄
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.