推薦策略:如何解決重復推薦問題
你是否有這樣的體會:信息流推薦的內容我已經看過。這是由于推薦算法存在重復推薦的問題,那么,針對不同的信息流,是否有改善該問題的方法?
前段時間接觸了與推薦策略相關的工作,如今產品也順利走上“正確的道路”。關于常見推薦算法規(guī)則及原理,網上有很多不錯的相關文章,大家可以去搜索瀏覽。
下面主要聊聊推薦算法實驗和常見推薦算法優(yōu)缺點,以及內容重復推薦相關話題。
評測算法的方法
好的算法模型并不是一蹴而就的,而是不斷訓練慢慢打磨出來的。
那么,在打磨的路上如何評測推薦算法效果以及不同算法之間的優(yōu)劣呢?
這里有3種實驗方法供你參考。
1. 模擬實驗
模擬實驗主要通過用戶產生的行為日志,比如對該條內容進行瀏覽、收藏、點贊等用戶行為來生成推薦標準的數(shù)據(jù)集,再把數(shù)據(jù)集按規(guī)則分成“訓練組”和“測試組”,在“訓練組”上調教用戶興趣模型,在“測試組”上進行預測。
該實驗好處在于,不需要真實用戶參與,只需要從日志系統(tǒng)提取用戶行為數(shù)據(jù)就可以快速計算出推薦效果。但缺點是無法得知用戶真實轉化指標,比如推薦點擊率。
2. 用戶調研
監(jiān)控一批已體驗推薦相關的用戶,持續(xù)觀察分析用戶行為。
針對用戶行為羅列相關問題,在調研中進行詢問,最后根據(jù)問題及答案來了解推薦效果及滿意度。
值得關注的是,準確率高不等于用戶滿意度高,更應該留意一些由推薦產生的內容有沒有給他帶來一些“驚喜”,更多偏向于用戶主觀感受。
也正因如此,從行為觀察到問題歸納、用戶邀約、最后調研結果分析等,實驗調查流程及成本都比較高。
3. A/B測試
通過劃分用戶群,針對不同用戶群采用不同推薦算法,統(tǒng)計出不同用戶群體轉化指標生成測試報告,謹記該實驗唯一的變量就是算法規(guī)則,不允許有其它變量。
還有一點需要考慮清楚的是,滿足什么樣的條件用戶去跑測試流程,A/B測試缺點在于周期長,短期迸發(fā)的測試結果無法保證真實性。所以,該實驗適用于模擬實驗和用戶調研中效果比較好的算法模型,并不適用于跑所有算法,那樣效率實在太差。
一類算法只能解決一部分問題,單一的算法難以達到真正的個性化,還需要算法與算法之間打組合拳,接下來聊聊目前常見推薦算法一些優(yōu)缺點。
熱度算法
1. 優(yōu)點
能夠有效過濾掉低質量內容,呈現(xiàn)給到用戶都是大部分人都“喜歡過”的。對新用戶相對友好,無需產生任何交互也能產生推薦列表;不存在推薦列表為空的情況,并且熱度是相對的,熱點不會一直都是熱點,具有一定時效性。
基礎熱度分可以人為干預,比如,今天的熱點新聞基礎熱度分要比今天普通新聞的基礎熱度分要高。
2. 缺點
針對用戶層面精準觸達精確度不是很夠。
因為推薦列表是按熱度進行排序,并不是基于個人興趣喜好排序,單一的熱度算法可以被“刷榜”,因此要做好相對措施。
采用熱度算法典型例子:抖音
游客登錄瀏覽前面幾條視頻多數(shù)為近期熱度值為Top5內的,且上熱門推薦是需要經過多個熱度池大量用戶檢驗,最后還要人工審核才能上首頁推薦。
但不會持續(xù)超過1周,除非有大量的用戶進行模仿跟拍,反推用戶行為視頻熱度權重,用戶“跟拍”行為的熱度權重遠大于收藏、點贊及分享。
基于內容推薦算法
1. 優(yōu)點
對產品用戶體量沒有要求,不會因產品用戶數(shù)的大小影響到該算法。因為每個用戶產生行為相互獨立,用戶行為特征都是由自己的來決定,不存在干擾之說。
另外,該算法有較強的實時性,每當有一條新的內容就可以立馬“被推薦”,推薦機會和舊內容是一樣的,與時間新舊無必然聯(lián)系。
2. 缺點
無法為新用戶產生推薦列表,新用戶沒有歷史行為數(shù)據(jù)也無法預測。
當沒有用戶行為特征,無法與內容進行匹配推薦。所以,多數(shù)產品會利用注冊預填信息、首次登錄成功著陸頁的彈窗選擇等手段,并結合熱度推薦來進行冷啟動。
但要注意這些動作是否會過分地打擾到用戶,權衡用戶流失和推薦精準度問題。
其次,基于內容推薦確定性非常強,所有推薦的內容都是由用戶的瀏覽歷史決定。單獨使用該算法難以挖掘用戶的潛在興趣,所以該算法一般會與其他算法并存的原因也在這。
基于用戶協(xié)同算法
1. 優(yōu)點
在于能挖掘用戶潛在興趣,不斷調整給用戶制造驚喜。同時也有較強的實時性,有新內容同樣立馬能“被推薦”。
但與基于內容推薦差異在于,該算法除了平臺本身產生的新內容外,還包含了用戶交互行為所產生的新內容。
2. 缺點
啟動門檻相對較高,對產品用戶數(shù)以及平臺內容有一定數(shù)量要求,并且對用戶學習樣本要求也高,學習樣本書不足時推薦效果不理想,容易成為人工智障。
在KANO模型的需求分析上屬于興奮需求,所以在產品冷啟動時一般不會優(yōu)先考慮該算法。但在算法冷啟動時,應該主動調教用戶,如果能把用戶圈到不同推薦雛形,對該算法會有一定幫助。
最后聊聊關于重復推薦問題
推薦算法最根本的意義,在于解決信息過載。如果推薦給到用戶,是千篇一律的內容,那將毫無意義。
解決重復推薦可以從根源上壓制,比如“閱后即焚”,當用戶看過該條內容后即標記為已讀,已讀狀態(tài)的內容不再推薦給該用戶。
要定義清楚用戶產生什么行為才定義為“看過”,是點擊詳情頁就算,還是點開了“查看剩余全文”等行為,需要根據(jù)自身業(yè)務進行考慮。
上述的“閱后即焚”可以解決內容單條重復,但還無法解決同質化的問題。
以信息流產品為例,有A和B兩篇文章:
1)A和B屬于列表頁和詳情頁都一致的文章
對用戶而言只需要看A和B其中一篇就可以。所以,應該展示其中一篇適當?shù)膬热萁o予推薦,這里面的“適當”可以有兩個維度:如發(fā)文時間(過濾搬運)、發(fā)布者信息(如果是新聞機構號權威一般大于個人號)。
2)A和B兩篇文章屬于列表頁相同,但詳情頁不相同的情況
那么用戶點擊過A文章,短時間內大概率不會再看B文章。因為在用戶的視角,他認為A和B是重復的,所以會大概率錯過B文章,對于這類情況應該拉開推薦間隔。
3)A和B兩篇文章屬于列表頁不同,但詳情頁相同的情況
需要考慮用戶是否有“看過”其中一篇文章。如果看過A文就沒必要再推B文;但如果都沒有看過,那么可以進行推薦。因為列表頁的差異會影響用戶行為,一個標題一張封面都會導致用戶是否會查看文章,所以這種情況A和B都有推薦的必要性。
#專欄作家#
動物園園長,微信公眾號:首席吹牛官,人人都是產品經理專欄作家?;ヂ?lián)網圈十八線作詞人,國家一級退堂鼓表演藝術家。顏良而文丑,歡迎交流。
本文原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
同問,列表頁a和b相同是指什么意思?
想問一下,如何解決推薦類別過于集中的問題,比如有些用戶的推薦列表里可能出現(xiàn)連續(xù)10多個搞笑類別的內容
可以通過類目打散進行調整,比如精排之后,通過設置‘連續(xù)10個視頻,同一類型的視頻不超過2個’類似這種規(guī)則
最近在學習推薦相關內容,學習了
事先把用戶框進推薦雛形里 這點不是很理解,求詳
列表頁是指什么呢?
列表頁標題? 詳情頁內容?