華語樂壇,滿眼都是孫燕姿。
各種音樂平臺中,以“AI孫燕姿”為歌手的歌單和播客正在越來越多,哪怕孫燕姿本人親字回應(yīng)也無法遏制這樣的風潮。
“我想說的是,你跟一個每幾分鐘就推出一張新專輯的人還有什么好爭的......我還是能分辨出區(qū)別的,它沒有情緒,沒有音調(diào)和呼吸(或任何你能想到的術(shù)語)的變化。很抱歉,我懷疑這只是一個非常短期內(nèi)的回應(yīng)?!?/p>
歌手們在擔心,人類是否真的無法敵過AI了?而在“被替代”的恐懼背后,更多問題落在了版權(quán)層面。第三方是否有權(quán)利不經(jīng)許可就復(fù)刻歌手本人的聲音?“孫燕姿們”要如何拿回對自己聲音的控制權(quán)?
近日,一款A(yù)I歌手音樂創(chuàng)作軟件“網(wǎng)易云音樂?X Studio”悄然上線。軟件內(nèi)置12名高度擬人且聲線迥異的AI歌手,其中就包括聲線酷似王菲的AI若溪(代號F970)。網(wǎng)友不禁好奇,若溪與王菲是否有關(guān)?AI歌手的訓(xùn)練數(shù)據(jù)從何而來?
這個問題問向小冰,軟件的出品方之一。
小冰在國產(chǎn)AI歌姬方面的研究歷史可以追溯到2014年,當時小冰公司還是微軟小冰團隊,他們發(fā)布了一款名為"少女小冰"的聊天機器人。隨著技術(shù)的發(fā)展,小冰逐漸擴展了其功能,當中包括AI在音樂領(lǐng)域的應(yīng)用。在2017年,小冰推出了AI歌手的試驗版本,該版本已具備一定的音樂創(chuàng)作和演唱能力。
更清醒的聽眾或許會堅持AI孫燕姿只是人們理解AIGC的又一個俏皮作品,歌迷也并不會真的放棄自己心愛的歌手轉(zhuǎn)而完全把注意力放在一個沒有生命的替代版本上。人們對AI孫燕姿的討論或許最終會轉(zhuǎn)化成:AI究竟能在音樂創(chuàng)作中延伸到什么程度?
這場討論其實早已開始了。
1、“M435”
“虛擬歌手的軟件,其實我們都是有用的,不管是付費的,還是免費的,我們都會去接觸,因為在日常的創(chuàng)作過程中是經(jīng)常會用到的。”
孫玉鏡的回答讓人有些意外。作為幻想動漫音樂的創(chuàng)始人和藝術(shù)總監(jiān),他帶著團隊負責《羅小黑戰(zhàn)記》的全部配樂制作。《羅小黑戰(zhàn)記》是國內(nèi)2D動畫中質(zhì)量頗高的作品,但因為制作十分用心,更新的總是緩慢,追更的粉絲甚至開玩笑說要為這部動畫做好“泡枸杞養(yǎng)生”的準備。
用心和糾結(jié)同樣貫徹在動畫配樂上。為了更理想的創(chuàng)作效果,孫玉鏡的創(chuàng)作過程中已經(jīng)有了很多AI元素滲入,比如“M435”。
“比如說我們做了一首歌——拿搖滾舉例——我們自己制作人去寫這個旋律,我們自己可能拿自己的嗓子去唱。但是制作人可能在音樂的理論方面,制作方面非常專業(yè),但是唱的話,可能就會效果差一些。但是我們還是需要自己去唱一下,然后再做編曲的工作會順利很多。”
“后來我們直接就用M435”——一個搖滾音色的AI歌手——來唱,然后我們就能快速的確定這個旋律,這個詞到底是不是我們想要的東西?!?/p>
“M435”有另外一個名字——AI歌手崔璨。
他當然不是崔健(雖然這個名字讓人浮想聯(lián)翩),但顯然,一個“AI歌手”背后的意義,遠不止“咬字和音色準不準確”那么簡單。
“M435”誕生自人工智能小冰框架,被內(nèi)置于上述AI歌手音樂創(chuàng)作軟件X Studio中。創(chuàng)作者輸入詞曲,3秒內(nèi)可生成專業(yè)歌手水準的AI演唱干聲。
崔璨和軟件中另外11位AI歌手一起,組成*虛擬歌手廠牌 WOWAIDO!出道。首張迷你專輯《WOWAIDO?、竦匦囊Α?月15日在網(wǎng)易云音樂上線。不到24小時,其中《致你》這首歌的評論已達到999+,演唱者為AI何暢(代號F11)和AI徐夢甜(代號F801)。抖音百萬粉絲的AI夏語冰、AI陳水若也在成員名單中出現(xiàn)。
2、永遠在線的歌手
我們一直以聽眾的角度來看待AI歌手的井噴。但其實對于音樂創(chuàng)作者來說,X Studio生產(chǎn)出的不同風格的歌手,填補了音樂創(chuàng)作中的一塊空白,并且這些歌手永遠穩(wěn)定可靠。
X Studio的AI歌手陣營具備高度擬人及多樣化的聲線風格,可適配流行、民謠、國風、電子、搖滾等各種曲風,也包括埋頭兒童音樂的李召洋苦苦尋找的童音。
畢業(yè)于四川音樂學(xué)院的李召洋在老師的身份之外也是一位兒童音樂的制作人,但兒童音樂產(chǎn)業(yè)發(fā)展遠不及成人音樂成熟,他總是感覺一方面家長的需求極高,但適合的童音卻難找——并且哪怕找到了也很難要求一個幾歲的孩子按照要求穩(wěn)定的唱完一首歌。
他開始在AI歌手中尋找這樣的聲音。少女小冰(代號F002)的聲線是他在同類產(chǎn)品中能找到的最接近童聲的聲音。
這是他喜歡使用X Studio的關(guān)鍵原因。他曾使用少女小冰的聲音發(fā)表作品《笠翁對韻》,獲得第5屆唱工委音樂獎*兒童音樂專輯提名。
孫玉鏡從AI歌手何暢開始了解到X Studio。何暢是X Studio中最成熟的一個AI歌手,曾與馬伯騫、卞子嚴、小柯這些音樂人有過合作,演唱Burberry品牌曲《Runaway2.0》、成都大運會推廣曲《在成都等你》、北京冬奧獻禮曲《唯你無他》等。
“對玩家也好,或者是對從業(yè)者,制作人也好,AI歌手如果有成熟作品做得好,他會想,我用這個AI歌手,只要用心調(diào),也能做到這樣,那大家肯定是愿意使用的?!?/p>
在孫玉鏡眼中,AI歌手與人類歌手是一樣的,每個人或“人”都有自己的特色。他們優(yōu)勢互補,能在創(chuàng)作的不同階段幫到自己?!癆I歌手24小時在線且狀態(tài)恒一,在創(chuàng)作初期的詞曲、編曲階段,能幫創(chuàng)作者隨時調(diào)整完善,看到至少80%成品的樣子。在創(chuàng)作末期的錄音階段,由于人與人的交流更直接,人類歌手能按我的示范快速調(diào)整對某處細節(jié)的演繹。”
X Studio也確實給了使用者極大的創(chuàng)作自由度。
它內(nèi)置了小冰歌唱模型、一致性超級自然語音、流式渲染歌聲合成和視覺神經(jīng)網(wǎng)絡(luò)渲染等技術(shù)。創(chuàng)作者能通過調(diào)整參數(shù),實現(xiàn)AI歌手的滑音、轉(zhuǎn)音、顫音、咬字、節(jié)奏、音色、強弱等變化,細膩演繹作品效果。這意味著在標準音色和演唱風格的基礎(chǔ)上,使用者可以將其打磨成更具有個人風格或者更符合自己設(shè)想的AI歌手。
除此之外,X Studio另一個強大的能力在于支持合并AI音軌的數(shù)量高達30軌,也就是說每個音樂人都可以擁有一支“30人”的合唱團。
音樂制作人宋承容的朋友圈
3、消除版權(quán)疑云
最使音樂創(chuàng)作者頭痛的無異于版權(quán)問題,而在X Studio中的AI歌手均無版權(quán)風險。
有網(wǎng)友將自己的AI音樂作品放在網(wǎng)絡(luò)上,使用的聲音原型是小冰的AI歌手若溪,在做了更細節(jié)的調(diào)音后,AI歌手的聲線像極了王菲,它唱了一首《紅豆》。
AI孫燕姿之后,或許會有更多歌手被AI化。理論上只要你有一個你想要訓(xùn)練成的音色的音頻數(shù)據(jù)集——比如兩個小時王菲的唱片或采訪音源——然后根據(jù)這個音頻數(shù)據(jù)集來訓(xùn)練模型,接著用這么訓(xùn)練完的模型去推理和替換另一首歌中聲線——比如刀郎的《情人》,你最終就可以聽到王菲版本的《情人》。
這是一個更麻煩的流程,且伴隨著巨大的版權(quán)風險。
北京大成律師事務(wù)所高級合伙人肖颯在一次采訪中表示,一個翻唱行為要合法化,需要取得權(quán)利人的許可。肖颯指出,一首歌曲的產(chǎn)生,往往涉及諸多權(quán)利人,其著作權(quán)體系較為復(fù)雜。具體而言,可能包含該歌曲詞曲作者的著作權(quán)、該歌曲演唱者作為表演者的權(quán)利以及相關(guān)公司作為錄音錄像制作者的權(quán)利。
“理想情況下需要取得前述所有權(quán)利人的許可,否則其翻唱行為極有可能侵犯前述主體的相應(yīng)權(quán)利,從而需要承擔侵權(quán)責任。即便是AI翻唱,也受到此種規(guī)則的限制?!?/p>
創(chuàng)作者訓(xùn)練了一位知名歌手的聲音來唱一首新歌,這首歌火了,是這個創(chuàng)作者的功勞,還是AI或者那位知名歌手的?創(chuàng)作者要面對的是音樂工業(yè)中復(fù)雜的權(quán)利人體系,知名歌手本人要面對的是無法掌控自己聲音的使用場景以及潛在的取得收益的機會。這是不斷出現(xiàn)的知名歌手AI化背后的普遍問題。
這個問題的解決亟需音樂平臺作為中間一環(huán)進場。后者本身已經(jīng)包含了音樂工業(yè)從創(chuàng)作者到歌手的完整流程。這也是此次X Studio的更新重點。
這或許是“AI孫燕姿們”合法化的*步。小冰公司透露,已有真人歌手主動授權(quán)公司“克隆”自己的聲音,來保留*狀態(tài)。歌手能決定AI聲音的用途并取得相關(guān)收益。經(jīng)過本人訓(xùn)練調(diào)優(yōu),AI聲音將有機會獲得更好的表現(xiàn)。當市場出現(xiàn)越來越多“正版”聲音,良幣驅(qū)逐劣幣,或許能解決“孫燕姿們”的問題,也能給予音樂創(chuàng)作者更多選擇。
官方同時表示,小冰始終倡導(dǎo)AI技術(shù)的安全發(fā)展之路。軟件包含高安全性和隱私保護策略,所有AI歌手均經(jīng)過嚴格的數(shù)據(jù)訓(xùn)練,所有創(chuàng)作均可溯源,希望此舉能為AI創(chuàng)作的未來提供良性發(fā)展參考。
4、尾聲
或許我們可以從音樂合成器的歷史中找到一些對AI歌手的信心。
合成器是一種電聲樂器,原理是以產(chǎn)生的電信號通過放大器推動揚聲器產(chǎn)生聲音。這讓它可以模擬那些真實存在的樂器音色,比如鋼琴、鼓甚至弦樂。另一方面,合成器也可以在調(diào)試過后去形成現(xiàn)實中的環(huán)境采樣聲音,或甚至在現(xiàn)實中根本無法找到的聲音。
合成器在上個世紀60年代從流行音樂切入開始受人關(guān)注。80年代Yamaha推出的數(shù)字合成器DX7以及90年代隨著計算機普及進一步興起的軟件合成器則一步步鞏固了合成器在音樂制作中的角色,甚至圍繞合成器形成了Synthwave這樣的音樂流派。
將AI歌手放在真實歌手的對立面上,不如將AI歌手看作一種繼續(xù)發(fā)展的合成器。
音樂制作過程中,合成器的能力已經(jīng)從最初對于真實樂器的還原進化到對于各種環(huán)境聲音,比如漲潮和蟲鳴的還原,相比之下,變幻莫測的人聲是合成器的*命題。兩者都在經(jīng)歷一個從被質(zhì)疑到被普遍接受的過程。
而合法化后的“AI孫燕姿”們,最終會對未來的音樂創(chuàng)作帶來幫助。