算法推歌20年:從Pandora、Spotify到QQ音樂、網(wǎng)易云音樂
?編輯導(dǎo)讀:在短視頻如此風(fēng)靡的當(dāng)下,算法無時無刻不在控制著我們的生活喜好,讓我們上癮,看到更多我們感興趣的視頻。然而,音樂領(lǐng)域也是如此,也是被算法所推動的。今天我們就來看看,算法是如何推歌的。
從雜志、報紙上的樂評專欄,到音樂流媒體上的用戶評論、算法推薦,人們聽歌的選擇方式一直處于私人化和公開化之間。
近期,音樂軟件Plexamp又進行了一次大規(guī)模的升級,其中最受關(guān)注的,當(dāng)屬新功能“Super Sonic”的上線。
據(jù)Plex介紹,這款只針對會員用戶的新功能將利用龐大的神經(jīng)網(wǎng)絡(luò),從“聲音”上對用戶歌單中的歌曲進行分析,完成新內(nèi)容的個性化推薦。
不過,這一功能“更新需要占用大量的CPU,可能要花費您數(shù)小時甚至數(shù)天的時間。但一旦更新完成,將帶給您全新的音樂體驗?!?/p>
其實,以歌曲本身的要素作為標(biāo)簽,并對歌曲進行分類,“Super Sonic”的個性化推薦思路似乎沒有創(chuàng)新,利用人工智能對歌曲進行分析也并不新鮮。
而從Pandora、Spotify到QQ音樂、網(wǎng)易云音樂,國內(nèi)外音樂流媒體平臺的推薦系統(tǒng)已發(fā)展了20年。
長期以來,“國內(nèi)推薦系統(tǒng)的體驗不如國外”的聲音一直層出不窮,如今“Super Sonic”橫空出世,又掀起了新一輪關(guān)于個性化推薦的討論。
時至今日,“國外的推薦系統(tǒng)好在哪里”這個老問題,是否有了新的答案?
一、算法推歌20年
互聯(lián)網(wǎng)音樂電臺Pandora推出的“音樂基因組計劃”,是最早向用戶個性化推薦歌曲的系統(tǒng)。
2000年,Pandora把一群音樂家和音樂技術(shù)人員聚在一起,他們從流派、節(jié)奏、風(fēng)格等多方面來給歌曲貼“標(biāo)簽”,然后過濾這些標(biāo)簽,以達到分類的效果,最后把不同類型的歌曲推送給自己的用戶。
彼時,Pandora給歌曲貼的標(biāo)簽,基本上取決于音樂家的個人理解,而人工分析一首歌,往往需要15~30分鐘的時間。
如今,Pandora的推薦系統(tǒng)已相當(dāng)強大,它能從超過450個角度理解歌曲——包括流派、歌手、旋律、和聲等,甚至是歌手的鼻音。
歌曲的每個特性被賦予0~5之間的值,通過對特性的描述,推薦系統(tǒng)描繪出了歌曲的DNA圖譜。
同時,構(gòu)建DNA圖譜的過程也在逐漸智能化。
目前,Pandora采用人工+人工智能的組合來為歌曲貼“標(biāo)簽”,對于一些“簡單”的特性。
例如和聲、吉他效果等,人工智能已完全可以勝任。
而對于一些“復(fù)雜”的特性,例如歌詞表達的情感、微妙的旋律變化等,目前仍由音樂工作者來進行判斷。
Spotify的個性化推薦之路則開始得晚一些。
2015年,在收購了音樂個性化數(shù)據(jù)提供商The Echo Nest后,Spotify的推薦系統(tǒng)才開始“登堂入室”。
Discover Weekly是Spotify的首個個性化推薦功能,可以根據(jù)用戶的喜好,每周為用戶推薦30首歌曲。
與The Echo Nest早先的設(shè)計相似,Spotify的推薦系統(tǒng)主要采用協(xié)同過濾、自然語言處理、音頻分析三種推薦模型。
協(xié)同過濾模型主要分析用戶間的關(guān)聯(lián),在其中,Spotify的曲庫與用戶構(gòu)成了一個龐大的二維矩陣,通過對這個矩陣的拆解,得到相似的用戶向量和歌曲向量,以向用戶推薦其他有著相似口味的用戶喜愛的歌曲。
自然語言處理模型則是從人們對歌曲的評價中來提煉每首歌曲被提及時常用的形容表達、句子、名詞等“關(guān)鍵詞”,并給這些關(guān)鍵詞設(shè)定不同的權(quán)重,以量化在人們眼中哪些歌曲是相似的。
由于新歌的播放數(shù)據(jù)和用戶評價都較少,協(xié)同過濾模型和自然語言處理模型難以起到很好的效果。
為此,Spotify在推薦系統(tǒng)中加入了音頻分析模型。
其通過分析原始音軌文件來進行分類過濾,在卷積神經(jīng)網(wǎng)絡(luò)的幫助下,歌曲時間內(nèi)的特征統(tǒng)計量(拍子記號、音調(diào)、調(diào)式、速度等)得以形象化,并被用來分析歌曲間本質(zhì)上的相似性。
要實現(xiàn)對用戶的個性化推薦,除了對內(nèi)容的精準(zhǔn)描述外,精準(zhǔn)的用戶畫像也同樣重要。
2018年,Spotify申請的一項專利被視為其推薦系統(tǒng)2.0版本到來的標(biāo)志。
據(jù)悉,這項專利是一項音頻信號處理技術(shù),能夠?qū)τ脩舻恼Z音內(nèi)容和背景噪音進行處理,以得到用戶的情緒狀態(tài)數(shù)據(jù)。
再加上對年齡、性別、地區(qū)等傳統(tǒng)數(shù)據(jù)的綜合分析,Spotify將為用戶提供更為精準(zhǔn)的推薦內(nèi)容,“把推薦技術(shù)提升到一個新的水平”。
與Spotify和Pandora試圖去深刻理解用戶不同,剛剛上線的“Super Sonic”并沒有在用戶畫像上下功夫——這款僅針對Plex付費用戶推出的功能,只是為了推薦用戶可能喜歡的歌曲。
“Super Sonic”將一首歌曲的“聲音”從旋律、節(jié)拍等50多個維度進行分解,根據(jù)分析結(jié)果,歌曲們被放進了一個以歌曲特性為坐標(biāo)軸的N維空間中,并用不同的點表示。
在N維空間中,兩個點越接近,它們代表的歌曲就越“相似”。
50維空間中的計算需要極大的計算量,這或許是在安裝“Super Sonic”時需要耗費數(shù)小時甚至數(shù)天時間的原因。
盡管運作系統(tǒng)十分龐大,但“Super Sonic”并未帶來多少新意。對歌曲本身進行分析,這與Spotify的音頻分析模型的想法不謀而合;而通過尋找兩個相近的“點”來召回歌曲,則是協(xié)同過濾模型中常用的求解思路。
不過,與各位“前輩”相比,“Super Sonic”也有著自己的亮點——它完全擺脫了對元數(shù)據(jù)的依賴。
盡管Spotify的音頻分析模型也只對歌曲本身進行分析,但最終被端上用戶餐桌的,是由多個模型共同決定的內(nèi)容。
直觀來看,“Super Sonic”這種“不加以辨別”的推薦方式,意味著獨立音樂人有更多被聽見的可能,也給聽眾帶來了更多新的探索。
二、國內(nèi)平臺是怎么做算法推歌的?
眾所周知,用戶對音樂的反饋越多,個性化推薦的內(nèi)容越精準(zhǔn)。
其實這是一種雙向互動的過程——推薦系統(tǒng)學(xué)習(xí)到用戶喜好,用戶也借助算法工具實現(xiàn)了對自己潛在音樂喜好的探索。
在這種推薦系統(tǒng)與用戶的雙向互動中,“標(biāo)簽”是推薦歌曲最重要的依據(jù)。
無論是Pandora“音樂基因組計劃”還是Spotify的三種算法模型,核心目的都在于給一首歌曲貼上足量且準(zhǔn)確的“標(biāo)簽”。
- 在標(biāo)簽的解讀上,QQ音樂的推薦系統(tǒng)給出了一些新的思路:在標(biāo)簽系統(tǒng)中加入了視覺元素,從音視頻和藝人的角度對歌曲進行拆解;
- 流派方面,QQ音樂綜合國情,開發(fā)出了諸多中國獨有的“標(biāo)簽”。
例如例如通行的“電音”“說唱”等流派劃分外,還加入了“國風(fēng)”、“城市民謠”、“大眾流行”等中國特有的“標(biāo)簽”,以照顧到不同受眾的口味與感受。
QQ音樂推薦系統(tǒng)的另一個創(chuàng)新點則是建立了歌曲的知識圖譜。
在采訪中,QQ音樂數(shù)據(jù)算法負(fù)責(zé)人Toro對音樂先聲表示,知識圖譜是由歌曲豐富的知識信息組成的網(wǎng)絡(luò)結(jié)構(gòu)。
在這個網(wǎng)絡(luò)中,每首歌曲就是一個點,具有相同特征(例如專輯、歌手、音色等)的所有歌曲連成線,所有線交織在一起,則構(gòu)成了一張?zhí)N含著歌曲關(guān)聯(lián)信息的網(wǎng)狀知識圖譜。
知識圖譜的應(yīng)用,無疑給分析歌曲之間的相關(guān)性提供了更多的角度。
作為可讀性較高的外部知識載體,歌曲的知識圖譜提供的信息也應(yīng)用到了QQ音樂的個性化推薦板塊(個性電臺、每日30首等)。
在用戶分析方面,QQ音樂主要采用行為序列和語義分析兩種模型。
用戶對每首歌曲的搜索、播放、收藏、切歌等在APP中的所有行為構(gòu)成的行為序列,再結(jié)合從語義分析出的用戶音樂個性,幫助QQ音樂為每位用戶刻畫出了獨有的“音樂肖像”。
可見,在歌曲角度和用戶角度,QQ音樂的算法推薦系統(tǒng)盡可能做到多樣化的數(shù)據(jù)融合和本土化,在新熱歌曲的推薦上表現(xiàn)也比較突出。
而作為國內(nèi)第一個以歌單為底層架構(gòu)的在線音樂平臺,網(wǎng)易云音樂對推薦系統(tǒng)有著自己的理解。
除了用戶對一首歌曲的播放、收藏、轉(zhuǎn)發(fā)等常見的反饋外,社交功能強大的網(wǎng)易云音樂還擁有評論區(qū)這一豐富的“資源”。
為此,網(wǎng)易云音樂專門上線了針對評論語義分析功能,以從評論的語義中判斷用戶對歌曲的偏好程度。
隨著推薦系統(tǒng)近年來的飛速發(fā)展,用戶的要求也在水漲船高,不少用戶表示推薦系統(tǒng)很少給自己帶來“驚喜感”。
這是由于在已有的推薦系統(tǒng)中,用戶畫像方法大都沒有考慮用戶屬性標(biāo)簽的時效性,因此很難刻畫用戶的動態(tài)變化。
網(wǎng)易云音樂對于深度時序網(wǎng)格的引入,在一定程度上解決了這個問題。
深度時序網(wǎng)格對用戶過去一段時間及當(dāng)前的聽歌習(xí)慣進行分析,通過對用戶興趣點的快速更新,不僅實現(xiàn)了對用戶的實時建模推薦,還能幫助用戶發(fā)現(xiàn)潛在喜歡的歌單類型。
網(wǎng)易云音樂相關(guān)負(fù)責(zé)人對音樂先聲表示,這在一定程度上帶來了用戶使用中的”驚喜感”。
但由于深度時序網(wǎng)絡(luò)較為復(fù)雜,推薦系統(tǒng)的可解釋性在一定程度上也會受影響。
- 可解釋性主要分為兩個方面,一方面是算法的可解釋性,算法的可解釋性差意味著在推薦系統(tǒng)出現(xiàn)偏差時,算法工程師更難找到問題所在;
- 另一方面則是推薦結(jié)果的可解釋性,如果一個推薦系統(tǒng)能夠給出推薦這些內(nèi)容的原因,則說明其具有較好的可解釋性。
清華大學(xué)張敏教授在某購物平臺上進行的一項實驗表明:當(dāng)推薦結(jié)果的可解釋性增強時,用戶對其的點擊率也會有所提升。
這就說明,良好的可解釋性意味著更高的用戶接受度,算法推歌也是同樣的道理。
也就是說,在給出精準(zhǔn)推薦的同時,還能給出可靠的解釋,這樣的推薦系統(tǒng)往往能收到更好的推薦效果。
這也是目前國內(nèi)外音樂平臺在個性化推薦系統(tǒng)領(lǐng)域的努力方向——不僅要提高用戶選擇推薦內(nèi)容概率及用戶滿意度,還要提高用戶對系統(tǒng)的信任與接受程度。
三、算法之外,推歌路在何方?
長期以來,國內(nèi)音樂平臺的推薦系統(tǒng)一直被拿來同國外作比較。
不少用戶表示,目前國外音樂平臺推薦系統(tǒng)的使用體驗較好,甚至認(rèn)為這種差距主要來自于推薦技術(shù)上的落后。
但其實,在世界一流的技術(shù)團隊的努力下,從算法到模型,在技術(shù)層面,國內(nèi)的推薦系統(tǒng)并不比國外差。
Toro認(rèn)為:“相比于國外,國內(nèi)的推薦技術(shù)并不處于劣勢,國外的創(chuàng)作者生態(tài)和數(shù)據(jù)結(jié)構(gòu)發(fā)展得比較成熟,這是他們的優(yōu)勢所在。我們處于不同的發(fā)展時代,而時代的發(fā)展是每個音樂產(chǎn)業(yè)都要經(jīng)歷的?!?/p>
以起步較早的Pandora為例,“音樂基因組計劃”在推薦系統(tǒng)領(lǐng)域已深耕超20年,得益于8000萬用戶的龐大基數(shù)。
截止目前,Pandora已處理了超1000億條用戶反饋。在豐富數(shù)據(jù)的“投喂”下,國外音樂平臺的推薦系統(tǒng)起點更高。
正如Toro所說:“國外音樂平臺長時間搭建起的數(shù)據(jù)體系是最寶貴的財富,而這些東西是算法層面無法解決的”。
同樣無法短時間解決的,還有國內(nèi)音樂創(chuàng)作生態(tài)的問題。
在音樂市場尚未成熟的背景下,仍存在不少蹭熱度、濫竽充數(shù)的創(chuàng)作現(xiàn)象,當(dāng)這些歌曲流入推薦歌單中時,無疑會使用戶體驗大打折扣。
當(dāng)然,由于當(dāng)下受眾市場音樂審美的“參差”,確實給了一批“以次充好”的歌曲以生存空間,但并不意味著用戶永遠只能沉迷在“神曲”之中。
當(dāng)被問及音樂平臺是否應(yīng)該肩負(fù)起引導(dǎo)用戶審美的責(zé)任時,Toro認(rèn)為:“毫無疑問是需要的,這是每個平臺都應(yīng)該達到的效果”。
算法其實也是有價值觀的,科技向善不應(yīng)該只是一句口號,我們也樂見于更多不同類型的好音樂被聽到。
與此同時,隨著個性化推薦系統(tǒng)的飛速發(fā)展,不少隱形問題也開始被放上桌面。
比如,推薦系統(tǒng)帶來的“信息繭房”效應(yīng)就一直飽受詬病——如果一直被推送同一種類型的內(nèi)容,用戶的興趣可能會被限制在其中。
有網(wǎng)友曾指出,Spotify推薦音樂類型和風(fēng)格范圍會隨時間推移而逐漸收窄,這意味著如果不去主動尋找其他音樂,Spotify的推薦算法只會強化已推薦音樂的類型。
而在今年4月,Spotify的研發(fā)中心開發(fā)了一種新的動態(tài)模型——用戶喜好過渡模型(Preference Transition Model,PTM)。
通過在音樂流媒體、飯館推薦、電影推薦三個領(lǐng)域的試驗,發(fā)現(xiàn)PTM能夠“揭示一些用戶偏好隨時間變化的顯著規(guī)律”,在一定程度上可以預(yù)測用戶喜好的變化趨勢。
國內(nèi)的推薦系統(tǒng)也上線了深度時序網(wǎng)格來探知用戶興趣的變化,但真實準(zhǔn)確地反映用戶的興趣遷移還很難。
目前,推薦系統(tǒng)更多的是引導(dǎo)用戶進行興趣與品味的探索——基于一定的價值觀,推薦系統(tǒng)會給偏好老歌的用戶推薦一些較新的歌曲,給偏保守的用戶推薦一些較為“先鋒”的歌曲等。
不過,個性化推薦帶來的用戶隱私問題也被重視起來。
自今年1月Spotify獲批從用戶語音來推測情緒的專利以來,這項技術(shù)一直飽受爭議。
不少人擔(dān)心自己的“私密信息”在應(yīng)用軟件的過程中被泄露。
這樣的擔(dān)心并非無中生有,有心之人利用推薦系統(tǒng)侵犯用戶隱私的事件并不少見。
2016年,劍橋分析公司通過小測試的形式獲取了5000萬Facebook用戶的個人信息,進行心理學(xué)分析后,其通過社交媒體向這些用戶“個性化推薦”有利于特朗普競選的內(nèi)容。
據(jù)統(tǒng)計,在民眾沒有察覺的情況下,這些推薦內(nèi)容潛移默化地影響了全美至少四分之一的潛在選民。
由于在面對不同的互聯(lián)網(wǎng)產(chǎn)品時,用戶有著不同的行為表現(xiàn),因此整合不同平臺推薦系統(tǒng)刻畫出的用戶畫像,必然會使用戶畫像更為形象立體。
但這同樣就會帶來侵犯用戶隱私的問題——不同平臺的合作勢必要對用戶身份進行關(guān)聯(lián),打破利用用戶信息與侵犯用戶隱私間微妙的平衡。
而如果不能解決“推薦與隱私的悖論”,用戶將永遠無法安心地享受技術(shù)帶來的便利。
8月27日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布的關(guān)于《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定(征求意見稿)》就提到——
算法推薦服務(wù)提供者“不得將違法和不良信息關(guān)鍵詞記入用戶興趣點或者作為用戶標(biāo)簽并據(jù)以推送信息內(nèi)容,不得設(shè)置歧視性或者偏見性用戶標(biāo)簽”。
同時,“應(yīng)當(dāng)向用戶提供不針對其個人特征的選項,或者向用戶提供便捷的關(guān)閉算法推薦服務(wù)的選項”,以保護用戶的合法權(quán)益。
從Pandora、Spotify到QQ音樂、網(wǎng)易云音樂,我們也會發(fā)現(xiàn),只要給到足夠豐富的內(nèi)容標(biāo)簽和用戶畫像,算法推歌就可以無限趨近于真實甚至驚喜的聽歌需求。
就目前國內(nèi)外的個性化音樂推薦體驗差距來說,技術(shù)本并不是最關(guān)鍵的要素,而在于一個時間積累的用戶數(shù)據(jù)“投喂”,以及更好的創(chuàng)作者生態(tài)與用戶審美。
當(dāng)然,在被動享受算法推歌的技術(shù)便利時,如果我們能夠保持自主發(fā)現(xiàn)好音樂的習(xí)慣,或許能夠更真實地體驗到聽歌的樂趣,在賽博世界多一些儀式感。
作者:魯修修,編輯:范志輝;公眾號:音樂先聲
本文由 @音樂先聲 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議
一直聽風(fēng)格相似的歌很容易失去驚喜感,所以我一般隨便找個歌單聽,聽到有喜歡的就收藏