數(shù)十秒就能生成一段完整音樂,零基礎(chǔ)的人也能輕松發(fā)歌
AI音樂“狂飆”,行業(yè)正在遭遇怎樣的沖擊?
■AI正在淘汰的不是創(chuàng)作本身,而是低技術(shù)含量、可批量復(fù)制的工作,比如用于短視頻配樂、商業(yè)廣告等的功能性音樂
■在歌曲領(lǐng)域,真實(shí)的表達(dá)來(lái)自人類的情感與經(jīng)歷。AI時(shí)常表現(xiàn)得循規(guī)蹈矩,而真人演繹時(shí)不免會(huì)有一些小瑕疵——而那些瑕疵背后,是很鮮活的東西
■站在平臺(tái)視角,AI也在不斷推動(dòng)行業(yè)發(fā)展、優(yōu)化行業(yè)生態(tài),讓大量過(guò)去沒有專業(yè)音樂創(chuàng)作能力的人也能創(chuàng)作出還不錯(cuò)的音樂,反推更多專業(yè)從業(yè)者去產(chǎn)出比AI創(chuàng)作更好的音樂作品和內(nèi)容
本報(bào)記者 束涵 見習(xí)記者 余敏之
AI音樂,正以驚人的速度涌入市場(chǎng)。數(shù)據(jù)顯示,2025年,僅Suno一個(gè)制作軟件,用戶每天生成的歌曲就超過(guò)700萬(wàn)首,相當(dāng)于兩周就能生成近億首歌曲,體量驚人。
創(chuàng)作的門檻正變得史無(wú)前例地低。不久前,谷歌在旗下億級(jí)用戶產(chǎn)品Gemini中上線音樂生成功能:一句話、一張照片,數(shù)十秒就能生成一段完整音樂。去年年底,騰訊音樂旗下的AI創(chuàng)作工具“VEMUS未音”正式發(fā)布,主打讓零基礎(chǔ)的人也能輕松發(fā)歌。
在這股AI音樂洪流中,大量歌曲被打上“AI感強(qiáng)”“粗糙”的標(biāo)簽,但也有一批作品讓人真假難辨,甚至被認(rèn)為比真人演繹更有味道。當(dāng)人與AI的聽感邊界日漸模糊,音樂制作行業(yè)會(huì)遭遇怎樣的沖擊?
誰(shuí)在被取代?
在傳統(tǒng)音樂創(chuàng)作鏈條上,生成式AI的沖擊并非“平均用力”。
首當(dāng)其沖的,是那些為平臺(tái)量產(chǎn)歌曲的作詞、編曲的工種。“Suno這些平臺(tái)確實(shí)很厲害,比很多詞曲作者高效得多?!睆V東某唱片公司的音樂制作人Rey說(shuō)。他口中的Suno,是目前全球最火的AI音樂生成平臺(tái)之一。用戶只需輸入簡(jiǎn)單的歌詞和風(fēng)格提示,幾十秒就能生成一首包含人聲、旋律、編曲的完整歌曲?!拔艺J(rèn)識(shí)的一些詞曲作者,要不就回老家了,要不就改行學(xué)別的了?!?/p>
音樂制作人莫芷銘身邊也有人因此失業(yè)。他注意到這背后創(chuàng)作模式的變化——以前一個(gè)公司要制作10首歌,需要找5個(gè)編曲人,每人編兩首。現(xiàn)在,公司用Suno10分鐘就能生成10首,快速篩選出兩首有潛力的,再讓人去臨摹和精修?!氨緛?lái)5個(gè)人的活,現(xiàn)在兩個(gè)人就能干?!?/p>
但產(chǎn)業(yè)鏈并非全線遇冷,某些工種反而表現(xiàn)出一定的抗壓性。比如混音。這是將多軌音頻通過(guò)專業(yè)處理,融合成富有層次和空間感的最終成品的環(huán)節(jié)?!捌鋵?shí)混音行情反而更好了,有些人甚至轉(zhuǎn)行去做了混音?!盧ey解釋,由于AI混音技術(shù)不成熟,在詞曲價(jià)格普降的情況下,制作公司更愿意在混音這個(gè)仍需人工精雕細(xì)琢的環(huán)節(jié)上投入更多。
混音為何能守住陣地?Cashmere Studios是一家位于上海靜安區(qū)的專業(yè)音頻制作工作室,主理人卡卡告訴記者,混音涉及極為主觀的感性判斷,難以被算法完全量化?!翱蛻粽一煲魩?,就像買衣服時(shí)找閨蜜參謀,需要的是帶有個(gè)人審美和情感導(dǎo)向的建議,而非標(biāo)準(zhǔn)化的技術(shù)輸出?!?/p>
從技術(shù)角度看,混音這個(gè)環(huán)節(jié)尚未出現(xiàn)強(qiáng)有力的AI工具,其核心在于數(shù)據(jù)壁壘?!昂芏鄽v史數(shù)據(jù)難以獲得,比如某些專業(yè)軟件的混音插件、硬件設(shè)備的具體操作參數(shù),第三方很難批量采集,整個(gè)混音過(guò)程類似一個(gè)‘黑盒’?!笨ń忉?。也就是說(shuō),要訓(xùn)練一個(gè)能媲美頂級(jí)混音師的AI,需要海量、高質(zhì)量且開放的操作數(shù)據(jù),目前很難實(shí)現(xiàn)。
采訪中,幾名音樂人對(duì)AI的共識(shí)是:它正在淘汰的不是創(chuàng)作本身,而是低技術(shù)含量、可批量復(fù)制的工作,比如用于短視頻配樂、商業(yè)廣告等的功能性音樂。按照AI目前的技術(shù)水平,生成的歌曲就像一張大眾臉,工整、合格,但缺少辨識(shí)度與靈魂。而市場(chǎng)對(duì)這部分內(nèi)容的需求,正在被AI高效滿足。
卡卡說(shuō),最近兩年一些獨(dú)立音樂人的收入來(lái)源明顯減少。“因?yàn)楹推髽I(yè)合作的商單少了,比如企業(yè)內(nèi)部的活動(dòng)歌曲制作,企業(yè)改為直接用AI軟件生成。”Cashmere Studios自身的業(yè)務(wù)結(jié)構(gòu)也在發(fā)生變化,與影視、游戲公司的合作也有一定程度的收縮。“以前大多數(shù)公司會(huì)采買一些版權(quán)音樂,或找樂手合作來(lái)做演奏嘗試,現(xiàn)在越來(lái)越多公司直接借助AI找靈感、做小樣?!?/p>
資深玩家進(jìn)化
技術(shù)躍遷的速度,決定著行業(yè)震蕩的程度。資深玩家正在進(jìn)化。Suno V5付費(fèi)使用的Suno Studio專業(yè)模式,能實(shí)現(xiàn)對(duì)生成歌曲的精細(xì)化調(diào)整。用戶能在不影響其他部分的情況下,重新生成歌曲的特定片段,無(wú)論是主歌、副歌還是橋段。同時(shí),模型支持一鍵拆分最多12條原始音軌,可精準(zhǔn)提取生成音頻中吉他、鼓、貝斯、合成器等多種樂器軌道。這大大方便了音樂工作者,無(wú)論是二次編曲,還是后期混音,都能直接應(yīng)用,效率倍增。
更大的變量,在于平臺(tái)方的入局。今年2月,谷歌宣布其Gemini應(yīng)用正式集成DeepMind旗下音樂生成模型Lyria 3。用戶可以“描述一個(gè)想法”,指定某種風(fēng)格、情緒或節(jié)奏,模型就能自動(dòng)生成歌曲;用戶也可以上傳照片或視頻,Lyria 3會(huì)通過(guò)分析畫面氛圍,創(chuàng)作出契合場(chǎng)景的配樂。所有生成的曲目都使用SynthID技術(shù)添加了不易察覺的水印,便于檢測(cè)AI創(chuàng)作內(nèi)容。
谷歌之外,國(guó)內(nèi)音樂平臺(tái)也未缺席這場(chǎng)競(jìng)賽。比如,QQ音樂內(nèi)嵌“AI作歌”功能,用戶可搜索直達(dá),提供“一句話”“填詞”“圖片”“哼唱”等生成方式。“這類用戶有自我表達(dá)的訴求,就像過(guò)去寫日記、拍照一樣,音樂也成了他們的一種記錄方式?!彬v訊音樂VEMUS未音業(yè)務(wù)負(fù)責(zé)人Lillian說(shuō)。
去年年底,騰訊音樂旗下AI創(chuàng)作工具“VEMUS未音”正式發(fā)布,定位與Suno形成微妙錯(cuò)位——Suno逐漸向?qū)I(yè)生產(chǎn)者傾斜,而VEMUS希望降低音樂創(chuàng)作門檻,讓更多人有機(jī)會(huì)用音樂進(jìn)行自我表達(dá)?!昂芏嘤脩魞?nèi)心想寫歌,但不太會(huì)定義風(fēng)格,就像現(xiàn)在很多人不太會(huì)問(wèn)AI問(wèn)題一樣?!盠illian說(shuō)。為此,VEMUS給用戶做了更簡(jiǎn)單的設(shè)計(jì):用戶可以參考自己常聽的歌曲,讓模型從中提取風(fēng)格靈感。系統(tǒng)會(huì)總結(jié)當(dāng)前熱點(diǎn)的風(fēng)格配方,一鍵調(diào)配,甚至可以通過(guò)對(duì)話的方式,聊著聊著就作出一首歌。
隨著AI工具的“狂飆”,有人被迫出局,也有人奮力追趕。莫芷銘將AI用作靈感催化劑,“如果自己要?jiǎng)?chuàng)作一首歌,能想到的元素肯定沒有AI多,速度也沒有AI快,那就讓它生成五六個(gè)版本,來(lái)刺激我的大腦?!倍鳵ey選擇深入技術(shù)的腹地,研究如何“跑本地模型”。從電力系統(tǒng)專業(yè)出身,到轉(zhuǎn)行做音樂,再到如今研究代碼,他一直沒有停下。
重構(gòu)收益規(guī)則
當(dāng)AI生成的海量作品試圖流向市場(chǎng)換取回報(bào)時(shí),它們會(huì)撞上一堵墻——一套尚未適配、仍在重構(gòu)的收益規(guī)則。
曾經(jīng),AI音樂在國(guó)內(nèi)平臺(tái)基本處于零分成狀態(tài)?,F(xiàn)實(shí)正在發(fā)生變化:部分平臺(tái)已開始試水AI音樂商業(yè)分配。比如,網(wǎng)易云音樂推出AI歌曲專屬激勵(lì)金活動(dòng),符合要求的AI作品可參與收益分配;抖音旗下汽水音樂則依托短視頻生態(tài),為AI音樂提供播放收益與BGM使用分成。
即便如此,AI音樂的商業(yè)化仍面臨雙重困境:一是版權(quán)與收益規(guī)則不清,二是內(nèi)容質(zhì)量參差不齊。
業(yè)內(nèi)人士解釋,現(xiàn)有的商業(yè)模式、合作協(xié)議、版權(quán)授權(quán)機(jī)制,都是基于傳統(tǒng)音樂創(chuàng)作模式建立的。AI音樂的出現(xiàn),打破了這一體系。同時(shí),內(nèi)容質(zhì)量也是繞不開的門檻。大量AI生成的歌曲仍帶有明顯的機(jī)器味,難以與真人作品競(jìng)爭(zhēng)主流商業(yè)市場(chǎng)。
實(shí)際上,AI音樂能不能賺錢這個(gè)問(wèn)題,不只在于規(guī)則制定。莫芷銘提出疑問(wèn):“如果一首歌明顯是百分之百AI生成的,為什么要分成?”
在海外,甚至有平臺(tái)明確對(duì)AI音樂說(shuō)“不”。今年1月,知名獨(dú)立音樂平臺(tái)Bandcamp宣布,禁止AI生成的音樂上架,還規(guī)定“完全或主要由AI生成的音樂和音頻”不允許發(fā)布,任何使用AI工具模仿其他藝術(shù)家或風(fēng)格的行為也被嚴(yán)格禁止。Bandcamp在聲明中強(qiáng)調(diào),此舉是為了保護(hù)真實(shí)的人類創(chuàng)作者社群,讓樂迷能夠確信他們?cè)谄脚_(tái)上聽到的音樂“是由人類創(chuàng)作的”。
爭(zhēng)議之下,行業(yè)并未停下腳步。盡管AI音樂收益機(jī)制尚不成熟,仍有不少機(jī)構(gòu)和創(chuàng)作者在持續(xù)布局AI音樂,部分作品進(jìn)入熱門榜單,還有平臺(tái)已經(jīng)捧出了自己的AI音樂人。為什么?
“這背后有幾個(gè)驅(qū)動(dòng)因素?!盠illian分析,一是占位,很多公司或個(gè)人認(rèn)為AI音樂是未來(lái)方向,提前布局,嘗試跑出爆款;二是內(nèi)容試驗(yàn),有些人用AI生成大量歌曲,測(cè)試用戶反饋,甚至有些作品質(zhì)量不錯(cuò);三是自我表達(dá),普通用戶用AI工具創(chuàng)作音樂,更多是情感記錄或社交分享,而非商業(yè)目的。
與此同時(shí),AI音樂的普及也帶來(lái)“洗歌”“刷量”等濫用行為。對(duì)此,平臺(tái)也在不斷升級(jí)技術(shù)能力,來(lái)識(shí)別和治理低質(zhì)量、侵權(quán)內(nèi)容。
“我們正在觀察用戶的選擇和行業(yè)的發(fā)展。如果AI音樂足夠優(yōu)質(zhì),能夠被用戶喜愛,它自然會(huì)進(jìn)入榜單。未來(lái),我們也可能為AI音樂設(shè)立專屬榜單,甚至探索新的廣告模式、商業(yè)化路徑?!盠illian說(shuō)。
回歸人的價(jià)值
這場(chǎng)AI對(duì)音樂行業(yè)的重塑,正觸及一個(gè)更深層的結(jié)構(gòu)性問(wèn)題——職業(yè)階梯的斷裂。
卡卡觀察到:“AI可能會(huì)導(dǎo)致嚴(yán)重的人才斷檔?!边^(guò)去,音樂人可以從接小型項(xiàng)目、寫定制化的商業(yè)歌曲起步,慢慢積累經(jīng)驗(yàn)爬升到金字塔頂端。但現(xiàn)在,這些“練手級(jí)”的機(jī)會(huì)正在被AI生成的音樂大規(guī)模蠶食?!俺蔀閷<业哪菞l路徑變窄了,很多人開始考慮轉(zhuǎn)行,或者加入AI音樂制作的大軍?!?/p>
這意味著,未來(lái)的音樂行業(yè)可能呈現(xiàn)出啞鈴型結(jié)構(gòu)——一端是擁有個(gè)人IP和不可替代審美的少數(shù)人,另一端是使用AI工具批量生產(chǎn)的人,而中間層的生存空間正被急劇壓縮。站在平臺(tái)視角,Lillian則認(rèn)為,AI在不斷推動(dòng)行業(yè)發(fā)展、優(yōu)化行業(yè)生態(tài),讓大量過(guò)去沒有專業(yè)音樂創(chuàng)作能力的人也能創(chuàng)作出還不錯(cuò)的音樂,也反推更多專業(yè)從業(yè)者去產(chǎn)出比AI創(chuàng)作更好的音樂作品和內(nèi)容。
這兩種觀察并非矛盾,而是同一枚硬幣的兩面:傳統(tǒng)的職業(yè)中間層或許在縮小,但一個(gè)由AI賦能的新手和跨界者構(gòu)成的大眾創(chuàng)作中間層正在出現(xiàn)。這背后,指向?qū)I(yè)從業(yè)者角色的深刻遷移——從“如何做”的執(zhí)行者,被推向“做什么、為什么做”的決策者。審美、情感和獨(dú)立品格,正在成為更稀缺的核心能力。正如硅谷著名天使投資人納瓦爾在一檔播客中所言,AI沒有肉身,沒有欲望,沒有生存本能,本質(zhì)上依然是“人類知識(shí)壓縮機(jī)和模仿者”。
“在歌曲領(lǐng)域,真實(shí)的表達(dá)來(lái)自人類的情感與經(jīng)歷。AI時(shí)常表現(xiàn)得循規(guī)蹈矩,而真人演繹時(shí)不免會(huì)有一些小瑕疵——而那些瑕疵背后,是很鮮活的東西。”卡卡說(shuō)。
一個(gè)明顯的趨勢(shì)是,越強(qiáng)調(diào)人的連接性的工種,抗風(fēng)險(xiǎn)能力越強(qiáng)。
身兼多職的音樂人莫芷銘在采訪中展現(xiàn)得很從容,他的主要精力放在需要深度溝通的專輯制作和藝人演唱會(huì)演出上,這類工作高度依賴個(gè)性化溝通?!八嚾擞忻鞔_的表達(dá)意圖,音樂需要與現(xiàn)場(chǎng)的視頻、燈光、特效以及很多工種緊密協(xié)作。像Suno這類工具,目前還處理不了如此細(xì)致、綜合的創(chuàng)作需求。”
卡卡決定將工作室的未來(lái)方向錨定在“人與人的深度交流”上,計(jì)劃打造更大的公共活動(dòng)空間。“當(dāng)套路化音樂充斥市場(chǎng),人們過(guò)度沉浸在虛擬世界中,‘物極必反’的規(guī)律將會(huì)生效?!彼廊幌M?,大家能回歸真實(shí)的、面對(duì)面的線下溝通。
來(lái)源:解放日?qǐng)?bào) 作者:束涵/余敏之