如何解決熱門推薦的3大難題?
個性化推薦強調于精準性,要求在這個信息過載的互聯網世界中能夠精準推薦出符合用戶感興趣的產品。那么如何將熱門有效的融入到推薦系統呢?
自豆瓣在個性化推薦的嘗試,到現在新起之秀的今日頭條、電商巨頭的亞馬遜利用個性化推薦成為行業中的佼佼者。很多互聯網企業開始將目光開始聚焦在個性化推薦,希望通過個性化推薦贏得市場。
熱門是互聯網產品中最常見的功能之一,如“大家都在看”,“今日爆款”等字眼隨處可見。熱門結合了眾多渠道,發揮著提供最熱優質的內容服務的作用。
個性化推薦強調于精準性,要求在這個信息過載的互聯網世界中能夠精準推薦出符合用戶感興趣的產品。而熱門具有統一性,不管個體用戶的行為,熱門的數據都是統一的。
這兩者看似相悖,但試想一下,若周圍的朋友都在討論熱點事件時,你卻一無所知,是否感覺與整個社會脫節了呢?因此,在追求精準性和個性化的同時,也需要考慮社會統一性。
那么如何將熱門有效的融入到推薦系統呢?
接下來,帶您開啟個性化推薦的宇宙飛行之旅,該班次出發于分析熱門的優劣;小憩于如何解決熱門劣勢;中轉至個性化推薦與熱門的結合;到站于精準性與統一性共存的“推薦星球”。
熱門的闡述
每個人對熱門都會聯想到很多詞語,如熱銷榜、暢銷書籍、網紅等等,熱門在日常生活中扮演著越來越重要的角色。同樣,在互聯網中,熱門也占據著重要的地位。熱門的應用場景十分廣泛,下圖展示了部分領域中的熱門應用:淘寶(電商)、愛奇藝(視頻)、微博(社交)、酷狗(音樂)。
接下來從三個方面深入了解熱門:熱門的影響因素、熱門的優勢以及熱門的弊端。
圖熱門的應用場景
1. 熱門的影響因素
結合現實來說,熱門主要受三個部分的影響:物品自身的屬性、用戶的反饋以及時間。
物品自身的屬性:
若兩部電影同時首映:《少年的你》和《半個喜劇》,相信絕大部分觀眾都會選擇《少年的你》。因為《少年的你》是由流量小旦(易烊千璽)和實力演員(周冬雨)飾演,且經過了前期大量的宣傳。因此,從物品自身屬性來看,兩部電影是無法相提并論的。
用戶的反饋:
物品自身的屬性雖然看上去屬于天然優勢,但是在實際的算法中也不會占據主要的地位。內容是否真的好,還需要真實用戶的檢驗。在推薦星球中,用戶的行為(瀏覽、點贊、分享、評論、轉發等等)也是重要的考慮因素。
時間因素:
很多物品屬于一次性消費,用戶看過也就是看過了,很少進行二次消費。若熱門的數據是一成不變的,或者更換周期不合理的話,用戶會感受到乏味無趣,從而造成了用戶的流失。所以,不管何種平臺都希望熱門能夠按照合理的周期進行更新,時間成為不可缺少的考慮因素。
2. 熱門的優勢
熱門在互聯網市場上扮演著重要的角色,其主要原因如下:
新用戶冷啟動問題:
當用戶行為數據量少且用戶信息獲取不準確(用戶冷啟動問題)等現狀下,熱門反而比個性化推薦更加適用。舉個列子,若某一個用戶剛剛注冊某知名APP時,試問一下有多少人會尋著耐心注冊性別、年齡、職業等信息呢?又有多少人會注冊其真實的信息呢?
所以,在絕大多數用戶冷啟動情況下,選擇熱門進行推薦比根據用戶社會信息進行推薦更加具有保障。
對物品要求小:
當物品數量級小或者物品的差異性小的情況下,熱門推薦比個性化推薦更加合適。當物品少或者類目聚集時,個性化推薦總是推薦同一類的物品,那么個性化推薦也失去了個性化的特性了,且個性化的計算成本遠大于熱門計算。
3. 熱門的劣勢
不可否認,熱門也具有很大的弊端,其主要有如下三點:
無法滿足個性化需求:
當用戶存在行為數據時,若一味推薦熱門數據,那么個性化變得黯然失色,千人千面的推薦最終演變為千人一面的推薦,個性化也從推薦星球的舞臺上褪去。
長尾效應:
長尾(The Long Tail)效應,是指那些原來不受到重視的銷量小但種類多的產品或服務由于總量巨大,累積起來的總收益超過主流產品的現象。
如下展示的是熱門的長尾效應趨勢圖,圖中表示20%的商品占據的市場份額超過了80%的商品占據的市場份額。顯然易見,熱門越流行,長尾效應越明顯。
圖:長尾效應趨勢圖(來自百度百科)
更新周期慢:
熱門的生產邏輯如下圖所示:根據用戶行為數據和物品自身的內容,結合某種計算公式(點擊率、購買轉化率等)計算出每個物品的數值、排序,從而得到熱門數據。
從上面的熱門邏輯來看,其更新速度主要與用戶行為以及物品的數據量有關。在目前數據量如此劇增的互聯網環境中,熱門的更新速度不得不慢下來了。
圖-熱門的生產邏輯
如何用好熱門推薦
如何用好熱門推薦呢?主要從兩個部分出發:首先從熱門自身的短板出發,著手于解決熱門的弊端;其次,具體闡述個性化推薦中其他武器與熱門的結合,從而達到推薦星球的運行理念——統一與個性共存。
1. 解決熱門弊端的方法
結合上文提出的熱門弊端,此處針對性的提出相應的解決辦法。
用戶的個性化需求:
如何滿足用戶的個性化需求呢?相信標題和市場已經告訴你答案了,即引入個性化推薦,具體的做法參考下文提到的內容與熱門的結合。
巧妙利用長尾效應:
如何解決長尾效應呢?解決這個問題的關鍵是如何將冷門物品曝光,其中常見的做法是通過熱門的熱度帶動冷門物品,電商巨頭亞馬遜成功運用了該方法。
熱門產品為《進入空氣稀薄地帶》,向購買過該書的用戶推薦了冷門書籍《觸摸巔峰》,通過內容將兩個物品關聯起來,當其中一個物品進入熱門后,帶動了另一個冷門物品的暢銷,最終創造了《觸摸巔峰》的榜單逆行現象。
加快更新周期:
如何加快熱門更新周期呢?其關鍵在于縮小計算的數量級。俗話說:一口吃不掉一個饅頭,那一般怎么做呢?我們把饅頭切成幾塊,問題迎刃而解。因此面對如此龐大的數據量級,通過對物品和用戶人群的劃分,從而加快熱門的更新周期。
2. 和其他武器的結合
目前市場上賦予智能推薦系統的武器有協同過濾、用戶畫像、社交關系、物品畫像、熱門數據以及召回排序模型。面對日益豐富的武器庫,很多人感到迷茫,該選擇何種武器贏得推薦市場?
圖 推薦星球的武器庫
- 協同過濾:無論是基于用戶還是基于物品的協同過濾,其根本思想需要找到人或者物關聯性較大的對象,然后基于此作出推薦。若需提高協同過濾的方法的精準性,特殊處理熱門物品/人的數據,從而才能保證協同過濾中計算的物品/人是真正意義上的相似。
- 用戶畫像:提到個性化推薦,用戶畫像自動躍入腦海中。很多人對推薦的認知是用戶畫像越精準,則推薦越精準。對于這點,我們并不否認,但是用戶畫像提煉出的是什么呢?是該用戶側重于哪一方面,或是類目、或是地域、或是話題等等。根據用戶畫像提煉出的信息,從熱門中取出相匹配的數據,自動化的生成高質量的推薦結果。所以,結合用戶畫像和熱門,使推薦星球能夠召回更加有效的推薦結果。
- 召回排序模型:該武器在市場上扮演著神秘的角色,其殺傷力以及射程范圍無法預估。該武器依賴于用戶的行為數據,通過一種或幾種模型的混合,從而預測用戶對物品的評分。
圖-熱門與其他武器的關聯性
社交關系:基于社交關系的推薦是給用戶賦予其社會屬性,若某用戶是另一用戶的閨蜜或家庭成員,針對某用戶的推薦會考慮另一用戶的行為數據??吹竭@里大家不禁疑惑?是不是和基于用戶的協同過濾有異曲同工之妙呢?答案確實如此,只不過基于社交關系的用戶關系屬于強關聯,而基于用戶的協同過濾中得到的相似用戶屬于弱關聯。因此,社交關系比基于用戶協同更直接。
物品畫像:物品畫像在解決長尾現象以及物品冷啟動問題中不可或缺。通過文本處理、內容關聯、模型等方式計算兩兩物品之間的相關性,通過熱門巧妙帶動冷門物品/冷啟動物品,緩解長尾以及物品冷啟動問題。
熱門數據:熱門數據必不可少,熱門賦予了推薦星球的共性。熱門與推薦星球相結合,具備了熱門的時效性、統一性,又具備了推薦的個性化,同時緩解了物品冷啟動、長尾效應、新用戶冷啟動等問題,提高推薦精準,推動了推薦星球的發展。
推薦案例
在不同的場景下,選擇其中幾種武器進行合理組裝,最大化的推薦出符合用戶興趣偏好的物品。接下來我們通過案例中詳細闡述在具體的場景下,當面臨實際問題時,我們該如何選擇武器并使用該武器。
1. 資訊推薦行業
眾所周知,資訊行業中最考究的是時效性。我們選擇綜合熱點、高時效性召回、物品畫像、用戶畫像、排序策略(時間倒排)、后處理策略(時效性限制)這幾種方式。
Step1:根據用戶畫像、高時效性、物品畫像,分別召回符合用戶興趣偏好的高時效性物品、符合用戶歷史行為的相關物品;為保證推薦的多樣性,選擇綜合熱點召回當下熱點
Step2:對上述召回結果進行后處理—如不符合時效的item進行過濾處理
Step3:對處理后的召回結果按照某種方式(如時間倒排)排序,生成推薦結果。
2. 電商推薦行業
電商推薦的時效性不是很強,但其在物品的使用周期需要進行特殊處理。在電商推薦中常常遇到的且令人頭大的是:若用戶短期內購買了洗發水,若和其他場景邏輯相似,推薦系統向該用戶推薦不同品牌同功效的洗發水,但是這種推薦令絕大部分客戶感到反感。
我們選擇高關注量物品召回、關聯規則訓練出的物品相關、用戶畫像、后處理(同物品限制)、排序策略這幾種武器。具體使用說明如下:
Step1:根據用戶有行為的物品和關聯規則得到的物品相關召回相關武物品;根據用戶畫像和高關注量物品召回召回符合用戶興趣偏好的物品
Step2:對上述召回結果進行后處理(同細分類目下一定周期限制),也許類目無法做到如此精確的細分處理,那可以通過文本分析,過濾產品相似性過大的物品
Step3:對處理后的召回結果按照某種召回方式(購買率、關注度等復雜排序),從而生成推薦結果。
3. 總結
在競爭日益激烈的互聯網時代,誰更能抓住用戶的興趣,推薦出符合用戶興趣的物品,誰更容易贏得市場。僅僅只依賴熱門,將無法滿足用戶個性化需求;若僅僅依賴個性化(不考慮熱門),又可能面臨與時代脫節的風險。
因此,只有將熱門巧妙的融入到推薦星球中,結合用戶畫像、物品畫像等方法召回推薦侯選集;通過后處理方式對侯選集進行過濾處理;通過模型、評估指標等生成有序物品結合,即個性化與共性共存、時效性與場景特殊性共存的推薦結果。
本文由 @達觀數據 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
- 目前還沒評論,等你發揮!