網(wǎng)易云音樂:如何通過數(shù)據(jù)發(fā)掘音樂品鑒家,進而找到寶藏小眾音樂
編輯導語:在網(wǎng)易云音樂平臺,經(jīng)常能發(fā)現(xiàn)一些冷門但好聽的寶藏歌曲,這是網(wǎng)易云音樂的差異化優(yōu)勢。網(wǎng)易數(shù)據(jù)產(chǎn)品團隊是如何通過定義音樂鑒賞人,實現(xiàn)對小眾高品質(zhì)音樂的批量挖掘和冷啟動呢?一起來看一下吧。
01 長尾內(nèi)容信號缺失,如何發(fā)掘其中的優(yōu)質(zhì)內(nèi)容?
作為網(wǎng)易云的資深用戶,我在網(wǎng)易云上面發(fā)現(xiàn)了不少冷門但是真的很好聽的寶藏歌曲。寶藏小眾歌曲推薦算網(wǎng)易云音樂的差異化優(yōu)勢,在其他音樂平臺很少見到。
今天和大家分享冷門寶藏歌曲背后的故事,看看網(wǎng)易數(shù)據(jù)產(chǎn)品團隊如何通過定義音樂鑒賞人,實現(xiàn)對小眾高品質(zhì)音樂批量挖掘和冷啟動。
首先聊聊為什么大部分情況下我們聽不到小眾歌曲。站在推薦算法的角度看,因為長尾內(nèi)容用戶行為數(shù)據(jù)較為稀疏,算法誤判的概率很大,誤判后推薦一些人氣低而且不好聽的內(nèi)容,是對用戶體驗非常大的傷害。
所以一般情況下,算法會更偏好推薦熱門內(nèi)容,因為數(shù)據(jù)量充足置信度高。這會讓整個平臺追求確定性的中低收益,但這樣會導致畸形的生態(tài)和音樂口味的趨同。
長尾內(nèi)容:可以理解為小眾,冷門,對人群的滲透率低的內(nèi)容。長尾是指在概率分布圖的尾巴位置。
而著重推薦成熟歌曲的算法對新晉創(chuàng)作者很不友好,這樣的機制會讓新作品和細分圈子的小眾作品得不到流量的青睞,沒有露臉的機會,自然無法出頭。而站在平臺側(cè)的角度,如果新內(nèi)容無法很好冷啟動,流量總是集中在頭部熱度高的歌曲,對于長期健康內(nèi)容生態(tài)是很不利。例如快手就因為幾個直播家族流量過于集中,平臺議價權(quán)被擠壓,以及頭部暴雷對生態(tài)打擊嚴重。
為了保持高質(zhì)量的音樂生態(tài),給寶藏小眾歌曲更多機會,網(wǎng)易云團隊一開始的方法是人工撈取小眾歌曲聽,根據(jù)好聽程度打分,把得分高的小眾歌曲交給算法去推薦。但是人工成本高,效果挺差,因為打分人很主觀,他們的音樂喜好并不能代表聽歌用戶,體現(xiàn)在數(shù)據(jù)指標上是人工篩選的歌曲冷啟動成功率(播放等級躍遷成功率)有3%。
所以網(wǎng)易團隊開始用數(shù)據(jù)產(chǎn)品的方式來解決這個問題,問題的成功指標是:
- 短期:小眾高質(zhì)量歌曲的冷啟動成功率
- 長期:音樂流量分布健康,不過分集中于頭部
02 先(用數(shù)據(jù))找伯樂,再找千里馬
小眾歌曲的投票權(quán),不應該集中在審核人員,而是應該下放到廣大聽歌的人民群眾手中。用良好品味和代表性的聽眾的投票行為,來作為高質(zhì)量音樂的信號,傳遞給推薦系統(tǒng)。找到高質(zhì)量音樂鑒賞人十分關(guān)鍵。
音樂鑒賞人的典型畫像是這樣的,深夜emo的你,打開網(wǎng)易云,恰好聽到一首小眾冷門的歌,但是越聽越好聽,你點亮了小紅心,一遍又一遍的循環(huán)播放,這點黑夜里的點贊小火星被推薦系統(tǒng)敏銳的捕捉到,讓枯竭的流量之水開始流淌,最終讓這首埋藏已有的歌得見天日。
那如何用數(shù)據(jù)發(fā)掘音樂鑒賞人呢?
音樂鑒賞人是能在高質(zhì)量歌曲早期就點贊收藏這些音樂的人:
- 發(fā)現(xiàn)時間早:「發(fā)現(xiàn)歌曲時間權(quán)重分」,對用戶收藏某首歌曲的時間先后進行加權(quán)處理。在某首歌曲播放到達最高等級的成長周期中,對歌曲進行較早收藏的用戶得分更高,以表現(xiàn)該用戶更好的鑒賞能力
- 升級幅度大:計算當前歌曲等級(ground truth)與收藏時等級差值、播放次數(shù)差值,找出收藏行為對應的后驗熱度Lift
定義音樂鑒賞人時,要注意到在國風音樂鑒賞能力強的人,不見得能鑒賞英文Rap。所以音樂鑒賞人也需要分類,按照音樂垂類劃分,例如搖滾、R&B、日語、電子、民謠鄉(xiāng)村、爵士古典等等,給各個音樂鑒賞人在這個音樂垂類進行打分。
結(jié)果:音樂鑒賞人成功地發(fā)現(xiàn)了許多優(yōu)質(zhì)小歌,這些小歌被扶持后的冷啟動成功率(播放等級越遷成功率)超過40%,比例遠高于之前人工打分的3%。優(yōu)化了平臺生態(tài)和長尾內(nèi)容撈取不足的問題。
網(wǎng)易云團隊還提供了個品鑒人發(fā)現(xiàn)小眾歌曲的栗子:「多喝熱水」這首歌自上線以來長期處于只有極少數(shù)人在聽的狀態(tài),4月3日被鑒賞者發(fā)現(xiàn)并紅心收藏,鑒賞者對該歌曲的背書被算法立即識別到,進行流量扶持分發(fā),之后退出扶持再讓其自然成長。經(jīng)過2-3天的加量扶持后,歌曲有了一定的人群受眾,之后逐漸快速成長,因各項指標一直良好,被算法再次加量扶持,最終沖上了站內(nèi)排行榜。
網(wǎng)易云是通過研究小眾歌曲的走紅,找到了音樂鑒賞家,實現(xiàn)對更多小眾歌曲的高效發(fā)掘。通過數(shù)據(jù)實現(xiàn)內(nèi)容找人,人找內(nèi)容,是數(shù)據(jù)產(chǎn)品的常見核心實踐。
Web3.0的數(shù)據(jù)公司Nansen旗下的數(shù)據(jù)產(chǎn)品Nansen.ai也是如此,通過對交易記錄的分析,給部分錢包地址打上了“smart money”的標簽。這些地址在過去的交易中低買高賣,收益頗豐,地址背后往往是懂行且信息多的Crypto fund,smart LP等“聰明”的機構(gòu)和個人投資者。
用戶在尋找和研究區(qū)塊鏈項目時,可以看這些smart money買了哪些,買了多少,什么時候入場,跟著聰明的人走,比自己摸著石頭過河要好一點。
03 延伸思考
網(wǎng)易云的音樂品鑒人可以考慮在C端產(chǎn)品上公開,變成鼓勵用戶的榮耀機制(例如 “古典音樂專業(yè)品鑒人”認證)。也能放到網(wǎng)易云的年度報告里面。告訴用戶這一年幫助多少小眾歌曲被更多人發(fā)現(xiàn),是一件很有價值的事情。
公開后,也要防止品鑒人的認證信息對用戶行為造成扭曲。上面舉的nansen的例子中,nansen.ai公布了smart money后,會有項目方向smart money地址直接發(fā)幣,營造出站臺的假象,這些都造成了一定程度的信息擾亂。需要進行規(guī)則打壓和治理。
本文由 @元小浩Yohann 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
網(wǎng)易云確實是小眾音樂愛好者的天堂哈哈哈哈哈哈
不得不說,網(wǎng)易云這個APP有時候真的是讓人愛不釋手,還有每次節(jié)日的H5瘋狂刷爆朋友圈。
不得不說網(wǎng)易云的大數(shù)據(jù)還是很不錯的,尤其是使用體驗讓用戶覺得很棒
以前用網(wǎng)易云是里面的氛圍好點,現(xiàn)在離不開是因為用戶推送每次都讓人很驚喜
網(wǎng)易云的用戶推薦我太喜歡了,有很多以前聽過的歌想不起名字也可以推送過來
以前是用酷狗,剛開始用網(wǎng)易云是沖著它的評論來的,現(xiàn)在好喜歡網(wǎng)易云,給我推的歌都是我喜歡的
我覺得網(wǎng)易云根據(jù)用戶風格推的歌單就很不錯啊,推給我的歌單風格都是我喜歡的
很多自己喜歡的寶藏歌曲根本不想它走紅,有些歌一旦走紅以后就會產(chǎn)生聽覺疲勞
很有意思的分析!感謝作者分享!
網(wǎng)易云雖然大熱歌的版權(quán)不多,不過在小眾音樂這塊儲備量還是蠻大的。
看了文章后了解了很多,原來推送給用戶的寶藏小眾音樂背后也立足于數(shù)據(jù)。