這兩天在折騰Claude Code Skill,
遇到一個(gè)新問題,長AI視頻的自動配樂。
我的痛點(diǎn)是AI短片段里的音效和音樂是無法徹底分離的。拼起來后每一段自帶的,風(fēng)格迥異的音樂互相沖突,整個(gè)視頻的配樂變得混亂不堪。
于是我開始琢磨,能不能用AI來解決這問題。
我的第一步,是把網(wǎng)上能找到的Suno,Udio,Mureka的官方教程和提示語都通過Claude Code的NotebookLM Skill傳到NotebookLM,這樣我就有了一個(gè)隨時(shí)可以調(diào)用的音樂創(chuàng)作知識庫。
![]()
目前想要零背景自己手搓一個(gè)AI音樂提示語還是有一點(diǎn)難度的,比方說是專業(yè)音樂人寫的提示語,
請制作一首歌,需求有
- 1. Techno曲風(fēng)
2. 歌曲使用Dorian調(diào)式
- 3. 鼓組使用Dorian調(diào)式
- 4. Bass使用303音色且要出現(xiàn)Filter Envelope的段落
- 5. 人聲需要帶有Vocoder效果
- 6. 歌曲BPM為129
這是我用GPT寫的,
沉穩(wěn)激昂的Techno舞曲,帶有強(qiáng)勁的4/4拍底鼓,滾動貝斯,金屬質(zhì)感合成器以及催眠般的夜店能量。
可以說有耳朵的都能聽出來的差距了,我寫的人聲有種趕著把詞念完的感覺,很長一段時(shí)間我都以為是模型的問題,沒想到是我寫的提示語根本就是在為難模型。
用Claude Code的原因是我可以直接把本地的AI視頻傳給Gemini3分析,文件大了還可以剪輯切片或者壓縮之后再上傳(用的這個(gè)skill mrgoonie/claudekit-skills),搞定后NotebookLM會輸出詳細(xì)的音樂風(fēng)格描述。
這是我想要二次配樂的影片,影片名字是Nefertiti Returns Home|娜芙蒂蒂回家了,
想要表達(dá)的是埃及文物應(yīng)該回到它的故鄉(xiāng)了。
這是輸出的音樂描述,盡可能還原畫面的氛圍感,以及適合用什么樂器,而不是詳細(xì)描述畫面里都有什么。
![]()
最后,我把這段描述喂給了昆侖萬維新上線的Mureka V8模型。
mureka.cn
出來的效果還蠻驚喜的,一次抽卡,在情緒,節(jié)奏和氛圍上,和我用Gemini分析出的畫面描述匹配度非常高,
這段時(shí)間我印象深刻的還有吳愛花,一個(gè)純AI的武打風(fēng)MV,給我拉回去小時(shí)候在TVB看流星蝴蝶劍的感覺
我也想用Mureka V8把這個(gè)MV重新配成中文版聽聽看,會有什么不一樣的。
在處理一些具有中國元素的音樂風(fēng)格時(shí),Mureka V8的理解力和表現(xiàn)力要比Suno V5更地道。
在生成三分鐘的完整曲目時(shí),V8能一直保持一個(gè)比較統(tǒng)一的結(jié)構(gòu)和邏輯,人聲的質(zhì)感和器樂的分離度也做得相當(dāng)不錯(cuò)。以后開車想聽什么DJ版,自己做就好了。
AI音樂自成一個(gè)品類,當(dāng)我的AI版Spotify!
比方說daft punk版千年等一回法海版,
BTW,昆侖自己做的AI女團(tuán)MV也很抓耳,
就在我以為這個(gè)工作流已經(jīng)很順暢的時(shí)候,我發(fā)現(xiàn)Mureka V8居然支持MCP,
有四種玩法,純音樂,帶人聲的音樂,生成歌詞,以及根據(jù)歌詞創(chuàng)作音樂。
![]()
有MCP就意味著我可以把它做成一個(gè)Skill,一個(gè)可以被其他程序自由調(diào)用的模塊,制作新Skills的思路很簡單,只需要保證Claude Code里面已經(jīng)有skills-creator這個(gè)技能,然后把MCP對應(yīng)的github頁面鏈接也丟給Claude,
幫我把這個(gè)開源工具 https://github.com/SkyworkAI/Mureka-mcp打包成一個(gè)Skill,只要我后續(xù)給出提示語,就可以幫我做出一首純音樂。
![]()
一條完全自動化的配樂工作流就這么誕生了。
我只需要把視頻丟進(jìn)去,NoteBookLM就會自動分析畫面,根據(jù)知識庫的提示語技巧生成音樂描述,調(diào)用Mureka V8創(chuàng)作音樂,最后再把音樂和視頻合成為一個(gè)成品。
整個(gè)過程,我?guī)缀醪恍枰魏稳斯じ深A(yù)。
這讓我想起了音樂制作技術(shù)的發(fā)展史。
最早給電影配樂,需要一個(gè)完整的交響樂團(tuán)在銀幕前同步演奏。后來有了錄音技術(shù),音樂可以被事先錄制好再貼到影片里。
再后來,穆格合成器的出現(xiàn),改變了游戲規(guī)則。它把聲音的各個(gè)元素做成了獨(dú)立的模塊,音樂家可以用跳線把這些模塊以任意方式連接起來,創(chuàng)造出前所未有的聲音。
音樂創(chuàng)作,第一次變成了聲音的工程設(shè)計(jì)。
![]()
![]()
我還做了一個(gè)在線版(15個(gè)按鈕個(gè)個(gè)不一樣),大家可以玩玩試試看,
aistudio.google.com/apps/drive/1n8Vz5KinlOwIvzyIL21JF_EuwxL-LieK?showPreview=true&showAssistant=true
再往后,數(shù)字音頻工作站把模塊化思想帶入了個(gè)人電腦。而現(xiàn)在,能把AI音樂做成Skills,
在我看來,就是音樂創(chuàng)作工具的又一次進(jìn)化。
每一個(gè)強(qiáng)大的AI模型,都在變成一個(gè)標(biāo)準(zhǔn)的模塊,一個(gè)可以通過Skill調(diào)用的功能單元。
我們就像是拿到了新一代的跳線和機(jī)架,
可以把這些能力各異的AI模塊,
自由地連接,編排,構(gòu)建一個(gè)只屬于我們自己的工具鏈。
PS,不用學(xué)了,GPT能控制,
配樂,不用學(xué)了,Mureka V8能做,
編程,也不學(xué)了,Clawdbot能做,
掌握單個(gè)軟件的操作技巧變成了時(shí)間花費(fèi)最少的,
思考如何將各種強(qiáng)大的AI能力,
像指揮一個(gè)樂團(tuán)一樣,編排組織在一起,
成了我們當(dāng)下要去做的事。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評論
如果想要第一時(shí)間收到推送,不妨給我個(gè)星標(biāo)
如果你有更有趣的玩法,歡迎在評論區(qū)和我聊聊
更多的內(nèi)容正在不斷填坑中……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.