豆瓣圖書推薦策略調研與問題歸納

0 評論 6826 瀏覽 49 收藏 10 分鐘

筆者列出相關指標,對豆瓣圖書的推薦策略進行了調研,歸納總結了幾個問題,針對問題給出了相應的改進方案。你的豆瓣給你推薦了什么書?

一、定義理想態

1.1 理想態定義

豆瓣推薦的書籍與用戶興趣相關(書籍查看率大于等于80%),令用戶滿意(書籍想讀率大于等于80%)并且能夠拓寬用戶興趣邊界(多樣性、時效性、新穎性)。

1.2 理想態指標

用戶滿意度,涉及指標定義如下:

  • 書籍查看率:用戶點擊推薦書籍數/推薦書籍數;
  • 書籍想讀率:用戶標記推薦書籍想讀數/推薦書籍數;
  • 書籍評價率:用戶評價(包括標記讀過、在讀、評分)推薦書籍數/推薦書籍數。

預測準確度,涉及指標定義如下:

  • 預測準確度:點擊查看書籍數/推薦書籍數;
  • 覆蓋率;
  • 多樣性;
  • 時效性;
  • 新穎性。

二、抽樣分析

2.1 Case選擇

5~10本書籍的case選擇覆蓋面太窄,因此目前將書籍從內容類型角度分為9種類型,每種類型選擇一本書,具體選擇如下圖所示。

2.2 Case匯總

9種case匯總如下圖所示(由于表格較長,一張表格拆成兩張圖展示)。

2.3 問題分析

案例1

【推薦書籍5、6、7、9、10】

問題說明:多樣性不足-同一個作者推薦太多。

從文學小說這個類型的書籍出發,雖然大家對同一個作者的書籍更有可能感興趣,但是查看書籍為同一作者的推薦項占比超過50%還是過高了。因此這5本書籍的主要問題都是同一個作者推薦太多。

原因:不管從作者角度,還是內容類型角度出發,該書籍都不可能屬于冷門書籍。因此推薦多樣性不足的原因就不可能是收錄的書籍數目太少,而應當是權重有問題,導致同一個作者的書籍占據了推薦書籍的90%。

可能的原因有三種:

  1. 有可能是作者標簽過重;
  2. 用戶協同過濾算法權重過大;
  3. 用戶畫像中用戶對該作者的喜好程度極高,且權重大,導致推薦90%為同一作者書籍。

改進方案:

  1. 推薦邏輯中,降低作者標簽權重;
  2. 推薦邏輯中,降低用戶協同過濾算法權重;
  3. 推薦邏輯中,當用戶畫像中,用戶對某一標簽(作者)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。

案例3

【推薦書籍2、3】

問題說明:推薦準確度太低-幾乎無相關性。

這兩本書相關性過于弱了,對于查看5+3的用戶來說,很有可能是學生家長,也很難會對這兩本書感到滿意。

原因:從該case其他推薦書籍來看,豆瓣雖然可能對教輔書的收錄和標簽管理不足,但也有其他通識教育類的書籍可以推薦,因此出現該問題的原因應當是標簽不準確。

改進方案:

  1. 增加收錄該類目書籍;
  2. 調整優化書籍標簽。

【推薦書籍4、5、8、10】

問題說明:推薦準確度太低-屬于同一大類型,但細分類差別太大。

這4本書從內容角度來看具有一定相關性,可以屬于一個內容類型大類。但是,從細分領域來看,兩類書的差別還是較為明顯,可能能夠探索用戶的興趣邊界,但是用40%的推薦項來探索用戶興趣邊界過多了。

原因:同類型書籍收錄過少,標簽不準確,推薦目的錯誤。

改進方案:

  1. 增加收錄該類目書籍;
  2. 調整優化書籍標簽。

【推薦書籍6、7】

問題說明:推薦準確度太低-幾乎無相關性。

相關性過弱,而作為探索用戶的興趣邊界的推薦項,與上一個問題加起來占比超過60%,顯然不是正確的策略。

原因:同類型書籍收錄過少,標簽不準確,推薦目的錯誤。

改進方案:

  1. 增加收錄該類目書籍;
  2. 調整優化書籍標簽。

案例4

【整體問題】

問題:推薦準確度太低-沒有推薦該作者的其他書籍。

沒有推薦該作者的其他書籍。單個推薦書籍沒有問題,但是整體來看該作者推薦書籍太少?!度蛲ㄊ贰纷鳛闊衢T書籍,作者也并不是只有這一本代表作的情況,存在一定明星效應,因此可以多推薦1、2本該作者的其他書籍。

原因:標簽權重有問題。

改進方案:推薦邏輯中,提高作者標簽權重。

案例6

【推薦書籍1】

問題說明:時效性考慮不足。

時效性不足,書籍作者有更新的攝影書籍《長皺了的小孩》,該書豆瓣已有收錄,但是豆瓣并沒有推薦。

原因:標簽權重有問題。

改進方案:推薦邏輯中,提高時效性標簽權重。

【推薦書籍4、10】

問題說明:多樣性不足-同一個作者推薦太多。

算上書籍2、3,推薦阮義忠的書籍共有4本。阮義忠不是該書籍的作者,但他的書籍占推薦項的40%,顯然過多了。

原因:

  • 標簽權重有問題;
  • 用戶畫像中用戶對該作者的喜好程度極高,且權重大,導致推薦40%為同一作者書籍。

改進方案:

  1. 優化推薦規則,減少同一作者的推薦書籍;
  2. 推薦邏輯中,當用戶畫像中,用戶對某一標簽(作者)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。

案例7

【推薦書籍10】

問題說明:展現順序不合理。

該書籍與查看的書籍相關性很高,但是卻排在推薦書籍末尾,排序有問題。

原因:標簽權重有問題。

改進方案:排序邏輯中,提高內容相關性標簽權重。

案例8

【整體問題】

問題說明:多樣性不足-同一套書籍推薦太多。

所有推薦書籍均為火影忍者,沒有多樣性可言,很難讓用戶滿意。

原因:

  • 標簽權重有問題;
  • 用戶畫像中用戶對該套書籍的喜好程度極高,且權重大,導致推薦40%為同一作者書籍。

改進方案:

  1. 推薦邏輯中,降低成套書籍相關性標簽權重;
  2. 推薦邏輯中,當用戶畫像中,用戶對某一標簽(成套書籍)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。

案例9

【推薦書籍2】

問題說明:展現順序不合理。

該書籍與查看的書籍相關性并沒有其他推薦書籍高,但是排在推薦書籍第二位,排序有問題。

原因:標簽權重有問題。

改進方案:排序邏輯中,提高內容相關性標簽權重。

【推薦書籍8】

問題說明:重復推薦。

該書籍與推薦書籍7重復,這本應該是一個非常容易避免的錯誤。

原因:排序規則有問題。

改進方案:優化推薦規則,過濾重復書籍。

三、改進方案

3.1 改進方案匯總

影響面計算說明:問題涉及案例推薦書籍數/總案例推薦書籍數=x/90。

 

本文由 @misbone 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!