中經記者 李玉洋 上海報道
2月12日,國內音樂大模型初創公司——自由量級正式推出音樂大模型音潮V3.0版本,據悉此次迭代完成了從“編碼—生成—解碼”的全鏈路技術重構,實現音樂性與良品率的雙重突破。
《中國經營報》記者注意到,自由量級有這樣的行業預判:2026年伊始AI音樂賽道正迎來從“野蠻生長”到“專業進階”的關鍵轉折,多家國內外音樂模型相繼完成技術升級,行業從“能生成音樂”向“生成好聽、有溫度的音樂”深度進化。
而在AI音樂生成領域,僅僅增加參數規模已不再是競爭的核心。行業內不再滿足于讓機器一味效仿聲音的波形,而是試圖讓它理解聲音背后的物理空間與情感邏輯。
首先,音潮V3.0通過引入雙軌建模與多階段強化學習,大幅提升了歌曲的演唱質量,不僅學會了哼唱、轉音、氣聲等極其細膩的演唱技巧,更擁有了充沛的情感表達力。
其次,音潮V3.0帶來了旋律悅耳度與記憶性的質變——讓每首歌都擁有“閃光點”。現在的AI音樂或多或少都有“聽起來順暢,但聽完就忘”的通病,而音潮V3.0生成的旋律線條更加流暢,音符間的張力起伏更具設計感。幾乎每一條生成的旋律,都擁有值得被記憶的Hook(記憶點)。
另外,此次音潮V3.0在編曲多樣性與音樂整體性上也實現了顯著增強。V3.0從樂器的音色選擇到段落間的起承轉合,整體性得到了極大的提升。同時,為了重塑聲音的物理質感,音潮V3.0為相位和混響獨立建模,并應用到整體生成鏈路上,這讓我們可以聽到電吉他失真時的顆粒感、鼓點落下時的空氣震動,以及混音中細膩的空間殘響。
“模型如果只是聚焦專業生產場景,在價值層面就會滑向冰冷的工具,很容易忽略了普通人情感表達的需求。所以,音潮模型迭代的出發點,始終關注用技術讓音樂創作的門檻大幅降低。每一項技術重構和突破,都最終指向讓‘音樂平權’從理念落地為現實。”自由量級CTO姜濤表示。
(編輯:吳清 審核:李正豪 校對:顏京寧)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.