網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

我做出了給長視頻AI配樂的Claude Code Skills，Mureka V8新模型上大分

2026-01-28 23:51:35　來源: 卡爾的AI沃茨

北京舉報(bào)

分享至

這兩天在折騰Claude Code Skill，

遇到一個(gè)新問題，長AI視頻的自動配樂。

我的痛點(diǎn)是AI短片段里的音效和音樂是無法徹底分離的。拼起來后每一段自帶的，風(fēng)格迥異的音樂互相沖突，整個(gè)視頻的配樂變得混亂不堪。

于是我開始琢磨，能不能用AI來解決這問題。

我的第一步，是把網(wǎng)上能找到的Suno，Udio，Mureka的官方教程和提示語都通過Claude Code的NotebookLM Skill傳到NotebookLM，這樣我就有了一個(gè)隨時(shí)可以調(diào)用的音樂創(chuàng)作知識庫。

目前想要零背景自己手搓一個(gè)AI音樂提示語還是有一點(diǎn)難度的，比方說是專業(yè)音樂人寫的提示語，

請制作一首歌，需求有

1. Techno曲風(fēng)
2. 歌曲使用Dorian調(diào)式
3. 鼓組使用Dorian調(diào)式
4. Bass使用303音色且要出現(xiàn)Filter Envelope的段落
5. 人聲需要帶有Vocoder效果
6. 歌曲BPM為129

這是我用GPT寫的，

沉穩(wěn)激昂的Techno舞曲，帶有強(qiáng)勁的4/4拍底鼓，滾動貝斯，金屬質(zhì)感合成器以及催眠般的夜店能量。

可以說有耳朵的都能聽出來的差距了，我寫的人聲有種趕著把詞念完的感覺，很長一段時(shí)間我都以為是模型的問題，沒想到是我寫的提示語根本就是在為難模型。

用Claude Code的原因是我可以直接把本地的AI視頻傳給Gemini3分析，文件大了還可以剪輯切片或者壓縮之后再上傳（用的這個(gè)skill mrgoonie/claudekit-skills），搞定后NotebookLM會輸出詳細(xì)的音樂風(fēng)格描述。

這是我想要二次配樂的影片，影片名字是Nefertiti Returns Home｜娜芙蒂蒂回家了，

想要表達(dá)的是埃及文物應(yīng)該回到它的故鄉(xiāng)了。

這是輸出的音樂描述，盡可能還原畫面的氛圍感，以及適合用什么樂器，而不是詳細(xì)描述畫面里都有什么。

最后，我把這段描述喂給了昆侖萬維新上線的Mureka V8模型。

mureka.cn

出來的效果還蠻驚喜的，一次抽卡，在情緒，節(jié)奏和氛圍上，和我用Gemini分析出的畫面描述匹配度非常高，

這段時(shí)間我印象深刻的還有吳愛花，一個(gè)純AI的武打風(fēng)MV，給我拉回去小時(shí)候在TVB看流星蝴蝶劍的感覺

我也想用Mureka V8把這個(gè)MV重新配成中文版聽聽看，會有什么不一樣的。

在處理一些具有中國元素的音樂風(fēng)格時(shí)，Mureka V8的理解力和表現(xiàn)力要比Suno V5更地道。

在生成三分鐘的完整曲目時(shí)，V8能一直保持一個(gè)比較統(tǒng)一的結(jié)構(gòu)和邏輯，人聲的質(zhì)感和器樂的分離度也做得相當(dāng)不錯(cuò)。以后開車想聽什么DJ版，自己做就好了。

AI音樂自成一個(gè)品類，當(dāng)我的AI版Spotify！

比方說daft punk版千年等一回法海版，

BTW，昆侖自己做的AI女團(tuán)MV也很抓耳，

就在我以為這個(gè)工作流已經(jīng)很順暢的時(shí)候，我發(fā)現(xiàn)Mureka V8居然支持MCP，

有四種玩法，純音樂，帶人聲的音樂，生成歌詞，以及根據(jù)歌詞創(chuàng)作音樂。

有MCP就意味著我可以把它做成一個(gè)Skill，一個(gè)可以被其他程序自由調(diào)用的模塊，制作新Skills的思路很簡單，只需要保證Claude Code里面已經(jīng)有skills-creator這個(gè)技能，然后把MCP對應(yīng)的github頁面鏈接也丟給Claude，

幫我把這個(gè)開源工具 https://github.com/SkyworkAI/Mureka-mcp打包成一個(gè)Skill，只要我后續(xù)給出提示語，就可以幫我做出一首純音樂。

一條完全自動化的配樂工作流就這么誕生了。

我只需要把視頻丟進(jìn)去，NoteBookLM就會自動分析畫面，根據(jù)知識庫的提示語技巧生成音樂描述，調(diào)用Mureka V8創(chuàng)作音樂，最后再把音樂和視頻合成為一個(gè)成品。

整個(gè)過程，我?guī)缀醪恍枰魏稳斯じ深A(yù)。

這讓我想起了音樂制作技術(shù)的發(fā)展史。

最早給電影配樂，需要一個(gè)完整的交響樂團(tuán)在銀幕前同步演奏。后來有了錄音技術(shù)，音樂可以被事先錄制好再貼到影片里。

再后來，穆格合成器的出現(xiàn)，改變了游戲規(guī)則。它把聲音的各個(gè)元素做成了獨(dú)立的模塊，音樂家可以用跳線把這些模塊以任意方式連接起來，創(chuàng)造出前所未有的聲音。

音樂創(chuàng)作，第一次變成了聲音的工程設(shè)計(jì)。

我還做了一個(gè)在線版（15個(gè)按鈕個(gè)個(gè)不一樣），大家可以玩玩試試看，

aistudio.google.com/apps/drive/1n8Vz5KinlOwIvzyIL21JF_EuwxL-LieK?showPreview=true&showAssistant=true

再往后，數(shù)字音頻工作站把模塊化思想帶入了個(gè)人電腦。而現(xiàn)在，能把AI音樂做成Skills，

在我看來，就是音樂創(chuàng)作工具的又一次進(jìn)化。

每一個(gè)強(qiáng)大的AI模型，都在變成一個(gè)標(biāo)準(zhǔn)的模塊，一個(gè)可以通過Skill調(diào)用的功能單元。

我們就像是拿到了新一代的跳線和機(jī)架，

可以把這些能力各異的AI模塊，

自由地連接，編排，構(gòu)建一個(gè)只屬于我們自己的工具鏈。

PS，不用學(xué)了，GPT能控制，

配樂，不用學(xué)了，Mureka V8能做，

編程，也不學(xué)了，Clawdbot能做，

掌握單個(gè)軟件的操作技巧變成了時(shí)間花費(fèi)最少的，

思考如何將各種強(qiáng)大的AI能力，

像指揮一個(gè)樂團(tuán)一樣，編排組織在一起，

成了我們當(dāng)下要去做的事。

@ 作者 / 卡爾

最后，感謝你看到這里如果喜歡這篇文章，不妨順手給我們點(diǎn)贊｜在看｜轉(zhuǎn)發(fā)｜評論

如果想要第一時(shí)間收到推送，不妨給我個(gè)星標(biāo)

如果你有更有趣的玩法，歡迎在評論區(qū)和我聊聊

更多的內(nèi)容正在不斷填坑中……

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.