豆瓣圖書推薦策略調研與問題歸納
筆者列出相關指標,對豆瓣圖書的推薦策略進行了調研,歸納總結了幾個問題,針對問題給出了相應的改進方案。你的豆瓣給你推薦了什么書?
一、定義理想態
1.1 理想態定義
豆瓣推薦的書籍與用戶興趣相關(書籍查看率大于等于80%),令用戶滿意(書籍想讀率大于等于80%)并且能夠拓寬用戶興趣邊界(多樣性、時效性、新穎性)。
1.2 理想態指標
用戶滿意度,涉及指標定義如下:
- 書籍查看率:用戶點擊推薦書籍數/推薦書籍數;
- 書籍想讀率:用戶標記推薦書籍想讀數/推薦書籍數;
- 書籍評價率:用戶評價(包括標記讀過、在讀、評分)推薦書籍數/推薦書籍數。
預測準確度,涉及指標定義如下:
- 預測準確度:點擊查看書籍數/推薦書籍數;
- 覆蓋率;
- 多樣性;
- 時效性;
- 新穎性。
二、抽樣分析
2.1 Case選擇
5~10本書籍的case選擇覆蓋面太窄,因此目前將書籍從內容類型角度分為9種類型,每種類型選擇一本書,具體選擇如下圖所示。
2.2 Case匯總
9種case匯總如下圖所示(由于表格較長,一張表格拆成兩張圖展示)。
2.3 問題分析
案例1
【推薦書籍5、6、7、9、10】
問題說明:多樣性不足-同一個作者推薦太多。
從文學小說這個類型的書籍出發,雖然大家對同一個作者的書籍更有可能感興趣,但是查看書籍為同一作者的推薦項占比超過50%還是過高了。因此這5本書籍的主要問題都是同一個作者推薦太多。
原因:不管從作者角度,還是內容類型角度出發,該書籍都不可能屬于冷門書籍。因此推薦多樣性不足的原因就不可能是收錄的書籍數目太少,而應當是權重有問題,導致同一個作者的書籍占據了推薦書籍的90%。
可能的原因有三種:
- 有可能是作者標簽過重;
- 用戶協同過濾算法權重過大;
- 用戶畫像中用戶對該作者的喜好程度極高,且權重大,導致推薦90%為同一作者書籍。
改進方案:
- 推薦邏輯中,降低作者標簽權重;
- 推薦邏輯中,降低用戶協同過濾算法權重;
- 推薦邏輯中,當用戶畫像中,用戶對某一標簽(作者)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。
案例3
【推薦書籍2、3】
問題說明:推薦準確度太低-幾乎無相關性。
這兩本書相關性過于弱了,對于查看5+3的用戶來說,很有可能是學生家長,也很難會對這兩本書感到滿意。
原因:從該case其他推薦書籍來看,豆瓣雖然可能對教輔書的收錄和標簽管理不足,但也有其他通識教育類的書籍可以推薦,因此出現該問題的原因應當是標簽不準確。
改進方案:
- 增加收錄該類目書籍;
- 調整優化書籍標簽。
【推薦書籍4、5、8、10】
問題說明:推薦準確度太低-屬于同一大類型,但細分類差別太大。
這4本書從內容角度來看具有一定相關性,可以屬于一個內容類型大類。但是,從細分領域來看,兩類書的差別還是較為明顯,可能能夠探索用戶的興趣邊界,但是用40%的推薦項來探索用戶興趣邊界過多了。
原因:同類型書籍收錄過少,標簽不準確,推薦目的錯誤。
改進方案:
- 增加收錄該類目書籍;
- 調整優化書籍標簽。
【推薦書籍6、7】
問題說明:推薦準確度太低-幾乎無相關性。
相關性過弱,而作為探索用戶的興趣邊界的推薦項,與上一個問題加起來占比超過60%,顯然不是正確的策略。
原因:同類型書籍收錄過少,標簽不準確,推薦目的錯誤。
改進方案:
- 增加收錄該類目書籍;
- 調整優化書籍標簽。
案例4
【整體問題】
問題:推薦準確度太低-沒有推薦該作者的其他書籍。
沒有推薦該作者的其他書籍。單個推薦書籍沒有問題,但是整體來看該作者推薦書籍太少?!度蛲ㄊ贰纷鳛闊衢T書籍,作者也并不是只有這一本代表作的情況,存在一定明星效應,因此可以多推薦1、2本該作者的其他書籍。
原因:標簽權重有問題。
改進方案:推薦邏輯中,提高作者標簽權重。
案例6
【推薦書籍1】
問題說明:時效性考慮不足。
時效性不足,書籍作者有更新的攝影書籍《長皺了的小孩》,該書豆瓣已有收錄,但是豆瓣并沒有推薦。
原因:標簽權重有問題。
改進方案:推薦邏輯中,提高時效性標簽權重。
【推薦書籍4、10】
問題說明:多樣性不足-同一個作者推薦太多。
算上書籍2、3,推薦阮義忠的書籍共有4本。阮義忠不是該書籍的作者,但他的書籍占推薦項的40%,顯然過多了。
原因:
- 標簽權重有問題;
- 用戶畫像中用戶對該作者的喜好程度極高,且權重大,導致推薦40%為同一作者書籍。
改進方案:
- 優化推薦規則,減少同一作者的推薦書籍;
- 推薦邏輯中,當用戶畫像中,用戶對某一標簽(作者)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。
案例7
【推薦書籍10】
問題說明:展現順序不合理。
該書籍與查看的書籍相關性很高,但是卻排在推薦書籍末尾,排序有問題。
原因:標簽權重有問題。
改進方案:排序邏輯中,提高內容相關性標簽權重。
案例8
【整體問題】
問題說明:多樣性不足-同一套書籍推薦太多。
所有推薦書籍均為火影忍者,沒有多樣性可言,很難讓用戶滿意。
原因:
- 標簽權重有問題;
- 用戶畫像中用戶對該套書籍的喜好程度極高,且權重大,導致推薦40%為同一作者書籍。
改進方案:
- 推薦邏輯中,降低成套書籍相關性標簽權重;
- 推薦邏輯中,當用戶畫像中,用戶對某一標簽(成套書籍)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。
案例9
【推薦書籍2】
問題說明:展現順序不合理。
該書籍與查看的書籍相關性并沒有其他推薦書籍高,但是排在推薦書籍第二位,排序有問題。
原因:標簽權重有問題。
改進方案:排序邏輯中,提高內容相關性標簽權重。
【推薦書籍8】
問題說明:重復推薦。
該書籍與推薦書籍7重復,這本應該是一個非常容易避免的錯誤。
原因:排序規則有問題。
改進方案:優化推薦規則,過濾重復書籍。
三、改進方案
3.1 改進方案匯總
影響面計算說明:問題涉及案例推薦書籍數/總案例推薦書籍數=x/90。
本文由 @misbone 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
- 目前還沒評論,等你發揮!