推薦策略:如何解決重復推薦問題

7 評論 14897 瀏覽 103 收藏 10 分鐘

你是否有這樣的體會:信息流推薦的內容我已經看過。這是由于推薦算法存在重復推薦的問題,那么,針對不同的信息流,是否有改善該問題的方法?

前段時間接觸了與推薦策略相關的工作,如今產品也順利走上“正確的道路”。關于常見推薦算法規(guī)則及原理,網上有很多不錯的相關文章,大家可以去搜索瀏覽。

下面主要聊聊推薦算法實驗和常見推薦算法優(yōu)缺點,以及內容重復推薦相關話題。

評測算法的方法

好的算法模型并不是一蹴而就的,而是不斷訓練慢慢打磨出來的。

那么,在打磨的路上如何評測推薦算法效果以及不同算法之間的優(yōu)劣呢?

這里有3種實驗方法供你參考。

1. 模擬實驗

模擬實驗主要通過用戶產生的行為日志,比如對該條內容進行瀏覽、收藏、點贊等用戶行為來生成推薦標準的數(shù)據(jù)集,再把數(shù)據(jù)集按規(guī)則分成“訓練組”和“測試組”,在“訓練組”上調教用戶興趣模型,在“測試組”上進行預測。

該實驗好處在于,不需要真實用戶參與,只需要從日志系統(tǒng)提取用戶行為數(shù)據(jù)就可以快速計算出推薦效果。但缺點是無法得知用戶真實轉化指標,比如推薦點擊率。

2. 用戶調研

監(jiān)控一批已體驗推薦相關的用戶,持續(xù)觀察分析用戶行為。

針對用戶行為羅列相關問題,在調研中進行詢問,最后根據(jù)問題及答案來了解推薦效果及滿意度。

值得關注的是,準確率高不等于用戶滿意度高,更應該留意一些由推薦產生的內容有沒有給他帶來一些“驚喜”,更多偏向于用戶主觀感受。

也正因如此,從行為觀察到問題歸納、用戶邀約、最后調研結果分析等,實驗調查流程及成本都比較高。

3. A/B測試

通過劃分用戶群,針對不同用戶群采用不同推薦算法,統(tǒng)計出不同用戶群體轉化指標生成測試報告,謹記該實驗唯一的變量就是算法規(guī)則,不允許有其它變量。

還有一點需要考慮清楚的是,滿足什么樣的條件用戶去跑測試流程,A/B測試缺點在于周期長,短期迸發(fā)的測試結果無法保證真實性。所以,該實驗適用于模擬實驗和用戶調研中效果比較好的算法模型,并不適用于跑所有算法,那樣效率實在太差。

一類算法只能解決一部分問題,單一的算法難以達到真正的個性化,還需要算法與算法之間打組合拳,接下來聊聊目前常見推薦算法一些優(yōu)缺點。

熱度算法

1. 優(yōu)點

能夠有效過濾掉低質量內容,呈現(xiàn)給到用戶都是大部分人都“喜歡過”的。對新用戶相對友好,無需產生任何交互也能產生推薦列表;不存在推薦列表為空的情況,并且熱度是相對的,熱點不會一直都是熱點,具有一定時效性。

基礎熱度分可以人為干預,比如,今天的熱點新聞基礎熱度分要比今天普通新聞的基礎熱度分要高。

2. 缺點

針對用戶層面精準觸達精確度不是很夠。

因為推薦列表是按熱度進行排序,并不是基于個人興趣喜好排序,單一的熱度算法可以被“刷榜”,因此要做好相對措施。

采用熱度算法典型例子:抖音

游客登錄瀏覽前面幾條視頻多數(shù)為近期熱度值為Top5內的,且上熱門推薦是需要經過多個熱度池大量用戶檢驗,最后還要人工審核才能上首頁推薦。

但不會持續(xù)超過1周,除非有大量的用戶進行模仿跟拍,反推用戶行為視頻熱度權重,用戶“跟拍”行為的熱度權重遠大于收藏、點贊及分享。

基于內容推薦算法

1. 優(yōu)點

對產品用戶體量沒有要求,不會因產品用戶數(shù)的大小影響到該算法。因為每個用戶產生行為相互獨立,用戶行為特征都是由自己的來決定,不存在干擾之說。

另外,該算法有較強的實時性,每當有一條新的內容就可以立馬“被推薦”,推薦機會和舊內容是一樣的,與時間新舊無必然聯(lián)系。

2. 缺點

無法為新用戶產生推薦列表,新用戶沒有歷史行為數(shù)據(jù)也無法預測。

當沒有用戶行為特征,無法與內容進行匹配推薦。所以,多數(shù)產品會利用注冊預填信息、首次登錄成功著陸頁的彈窗選擇等手段,并結合熱度推薦來進行冷啟動。

但要注意這些動作是否會過分地打擾到用戶,權衡用戶流失和推薦精準度問題。

其次,基于內容推薦確定性非常強,所有推薦的內容都是由用戶的瀏覽歷史決定。單獨使用該算法難以挖掘用戶的潛在興趣,所以該算法一般會與其他算法并存的原因也在這。

基于用戶協(xié)同算法

1. 優(yōu)點

在于能挖掘用戶潛在興趣,不斷調整給用戶制造驚喜。同時也有較強的實時性,有新內容同樣立馬能“被推薦”。

但與基于內容推薦差異在于,該算法除了平臺本身產生的新內容外,還包含了用戶交互行為所產生的新內容。

2. 缺點

啟動門檻相對較高,對產品用戶數(shù)以及平臺內容有一定數(shù)量要求,并且對用戶學習樣本要求也高,學習樣本書不足時推薦效果不理想,容易成為人工智障。

在KANO模型的需求分析上屬于興奮需求,所以在產品冷啟動時一般不會優(yōu)先考慮該算法。但在算法冷啟動時,應該主動調教用戶,如果能把用戶圈到不同推薦雛形,對該算法會有一定幫助。

最后聊聊關于重復推薦問題

推薦算法最根本的意義,在于解決信息過載。如果推薦給到用戶,是千篇一律的內容,那將毫無意義。

解決重復推薦可以從根源上壓制,比如“閱后即焚”,當用戶看過該條內容后即標記為已讀,已讀狀態(tài)的內容不再推薦給該用戶。

要定義清楚用戶產生什么行為才定義為“看過”,是點擊詳情頁就算,還是點開了“查看剩余全文”等行為,需要根據(jù)自身業(yè)務進行考慮。

上述的“閱后即焚”可以解決內容單條重復,但還無法解決同質化的問題。

以信息流產品為例,有A和B兩篇文章:

1)A和B屬于列表頁和詳情頁都一致的文章

對用戶而言只需要看A和B其中一篇就可以。所以,應該展示其中一篇適當?shù)膬热萁o予推薦,這里面的“適當”可以有兩個維度:如發(fā)文時間(過濾搬運)、發(fā)布者信息(如果是新聞機構號權威一般大于個人號)。

2)A和B兩篇文章屬于列表頁相同,但詳情頁不相同的情況

那么用戶點擊過A文章,短時間內大概率不會再看B文章。因為在用戶的視角,他認為A和B是重復的,所以會大概率錯過B文章,對于這類情況應該拉開推薦間隔。

3)A和B兩篇文章屬于列表頁不同,但詳情頁相同的情況

需要考慮用戶是否有“看過”其中一篇文章。如果看過A文就沒必要再推B文;但如果都沒有看過,那么可以進行推薦。因為列表頁的差異會影響用戶行為,一個標題一張封面都會導致用戶是否會查看文章,所以這種情況A和B都有推薦的必要性。

#專欄作家#

動物園園長,微信公眾號:首席吹牛官,人人都是產品經理專欄作家?;ヂ?lián)網圈十八線作詞人,國家一級退堂鼓表演藝術家。顏良而文丑,歡迎交流。

本文原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 同問,列表頁a和b相同是指什么意思?

    來自浙江 回復
  2. 想問一下,如何解決推薦類別過于集中的問題,比如有些用戶的推薦列表里可能出現(xiàn)連續(xù)10多個搞笑類別的內容

    來自上海 回復
    1. 可以通過類目打散進行調整,比如精排之后,通過設置‘連續(xù)10個視頻,同一類型的視頻不超過2個’類似這種規(guī)則

      來自浙江 回復
  3. 最近在學習推薦相關內容,學習了

    來自北京 回復
  4. 事先把用戶框進推薦雛形里 這點不是很理解,求詳

    回復
  5. 列表頁是指什么呢?

    來自廣東 回復
    1. 列表頁標題? 詳情頁內容?

      回復