最近琢磨事群里,大家在秀自己的各種產出,我就也順道拿視頻參與了下,試了試基模的能力。
試完后最大感慨就是:AI折疊速度太快了,再不從業務回看技術(無人公司是這個視角),還是從技術看業務就真太危險了。
下面上一些結果,這是純粹使用體驗,不專業,不是評測,不整成懂車帝那樣。
我不會做視頻剪輯,所以下面的所有內容全部靠基模。
1. 20s的人物短視頻
這個視頻過程是用GPT生成了一張皮克斯風格的圖,然后可靈圖生視頻,聲音是自己錄后對的口型。
總計大概花了10多塊錢,用時10~20分鐘(不算等待的時間),也不算文案時間。
沒寫任何復雜提示詞,就正常和人說話一樣完成的。
語音合成比較拉胯,和當年做智能音箱的時候差別不大,還得自己錄。GPT精修人物形象比較拉胯,比如會把人物修成這樣...
![]()
2. 帶視覺效果的視頻
這是veo 3,也沒設計復雜提示詞,就是給了篇文章,讓它匹配一段視頻。
文章類似這篇:
這個也啥也沒干,就是把上面文章的段落給模型了。
上面這視頻也是沒干什么,就是扔了上面的文章的一段給模型,模型自己設計提示詞,自己生成。
這個模型能力還是很好的,比Sora好,但是沒啥配套的輔助工具,我又不會剪輯,就扔在哪兒了。
3. 文字問題看起來也接近解決
群里大家還很是貢獻了點其它創意,比如:
![]()
![]()
![]()
大家看起來都是用qwen image和豆包整的。文字是個神煩的問題,如果能解決就真的很好。
這里面十分要命的點是:每個這種改善估計都有N個團隊做過N種工具吧。可基礎模型一進步,這些工具的價值就真的會大幅削減。
從業務看AI,AI是成本,AI越進展能做的業務越多;從技術看AI,AI是能力,能力在AGI面前只可能加速貶值。
動筆寫無人公司,基本上是基于這個初衷,它應該是很少的從業務看AI的書吧。
注:入群或者加入AI碰撞局,聯系:shuixiu2024
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.