豆瓣讀書推薦策略的階段性調(diào)研

0 評(píng)論 6266 瀏覽 53 收藏 13 分鐘

調(diào)研豆瓣讀書的書籍詳情頁,【喜歡這本書的人也喜歡這個(gè)】推薦模塊的效果,一起來看看~

一、理想態(tài)

1.1?定義理想態(tài)

給用戶推薦相關(guān)且用戶潛在感興趣的書籍,吸引用戶進(jìn)行深層次互動(dòng)行為,包括點(diǎn)擊、評(píng)論、收藏等,提高用戶在平臺(tái)的留存。

1.2?核心指標(biāo)拆解

(1)用戶基本行為分析

用戶對(duì)于【喜歡這本書的人也喜歡】推薦列表的操作如下所示。

用戶不點(diǎn)擊推薦書籍,表明用戶不滿足,不是用戶喜歡的;用戶點(diǎn)擊推薦書籍,但是存在跳出行為,表明用戶對(duì)于該推薦一般;而存在查看行為,表明用戶對(duì)于推薦的書籍存在一定的興趣,較滿足;若用戶產(chǎn)生互動(dòng)行為和購買行為,則認(rèn)為用戶被滿足,達(dá)到較為理想的推薦效果。

Ps:對(duì)于已登入用戶,假設(shè)推薦列表都是推薦給用戶沒有看過的書籍,如果用戶后續(xù)操作標(biāo)記“在讀”,“讀過”等,表明用戶雖然看了此書但是并未在平臺(tái)上有過相應(yīng)的操作,平臺(tái)并未識(shí)別到,那么后續(xù)推薦便可不再推薦。但是此次推薦,用戶產(chǎn)生了互動(dòng)行為所以依然可以被認(rèn)為得到滿足,因?yàn)榉侠硐霊B(tài)的定義。

(2)核心指標(biāo)量化

一般來說推薦系統(tǒng)理想態(tài)的衡量指標(biāo)是準(zhǔn)確率和召回率。準(zhǔn)確率是針對(duì)我們預(yù)測(cè)結(jié)果而言的,它表示的是預(yù)測(cè)為正的樣本中有多少是真正的正樣本。而召回率是針對(duì)我們?cè)瓉淼臉颖径缘模硎镜氖菢颖局械恼卸嗌俦活A(yù)測(cè)正確了。

因此本次設(shè)定指標(biāo)如下:

準(zhǔn)確率=每本推薦書籍的點(diǎn)擊uv /推薦列表的總點(diǎn)擊uv

例如我們給用戶推薦了10本書籍,對(duì)其中2本,用戶產(chǎn)生了點(diǎn)擊,那么準(zhǔn)確率為2/10= 0.2。推薦列表準(zhǔn)確率=每本推薦書籍的求和平均值,可橫向?qū)Ρ人型扑]書籍的轉(zhuǎn)化情況,可以重點(diǎn)觀察過高或過低的異常值。

召回率=用戶在推薦列表的點(diǎn)擊書籍?dāng)?shù)/用戶在平臺(tái)的總點(diǎn)擊書籍?dāng)?shù)

例如我們給用戶推薦了10本書籍,其中1本用戶產(chǎn)生了點(diǎn)擊,而用戶最終在平臺(tái)上總共點(diǎn)擊了20本數(shù),那么召回率為1 / 20 = 0.05, 表示的是推薦系統(tǒng)推薦的那些符合用戶興趣并產(chǎn)生點(diǎn)擊的書籍占了用戶實(shí)際總共點(diǎn)擊的書籍有多少比例。

推薦位置轉(zhuǎn)化率=第N個(gè)位置的點(diǎn)擊UV/推薦列表的總點(diǎn)擊UV

一般而言,越靠前位置的推薦書籍越該是用戶最感興趣,且與本書相關(guān)性高的,因此用戶點(diǎn)擊的可能性越大,推薦位置轉(zhuǎn)化率越高;隨著位置靠后,推薦轉(zhuǎn)化率下降;可以縱向比較,不同書籍的同位置的轉(zhuǎn)化率;可以橫向比較同一個(gè)推薦列表的不同位置的轉(zhuǎn)化率,一般而言推薦位置的轉(zhuǎn)化率。

用戶滿足程度=采用對(duì)應(yīng)路徑進(jìn)入的uv/通過推薦進(jìn)入書籍詳情頁的總uv

如上圖所示,將用戶的交互行為路徑分類,并進(jìn)行量化。

二、抽樣分析

由于數(shù)據(jù)獲取較難,因此采取抽樣調(diào)查的方法,檢查核心指標(biāo)是否達(dá)到理想態(tài),從而探索豆瓣讀書的推薦策略及是否存在問題。

2.1?分析維度及字段選擇

一般而言,推薦策略的輸入主要有兩個(gè)特征,用戶特征和書籍特征,將用戶與書籍做匹配,但是調(diào)查發(fā)現(xiàn):

(1)選取的指標(biāo)需滿足符合常理同時(shí)可量化,數(shù)據(jù)可獲取的條件,用戶特征無法獲取。

(2)游客狀態(tài)和登錄狀態(tài),登錄與多次操作后,該推薦模塊都沒有變化,也佐證用戶特征沒有作為輸入。

因此此次主要從書籍特征進(jìn)行分析,標(biāo)記星號(hào)的為可用字段。

2.2?書籍選擇

書籍選擇如下,方便從不同維度進(jìn)行分析。

2.3?樣本分析

(1)增長黑客

(2)運(yùn)營之光2.0

(3)哈利波特與密室

(4)截句詩叢冷門

(5)聰明女人說話辦事108個(gè)細(xì)節(jié)

2.4?推薦策略猜測(cè)

(1)推薦策略的基本情況

游客與會(huì)員對(duì)比:在退出登錄后,以游客身份重新搜索一遍相同的書籍,發(fā)現(xiàn)游客和會(huì)員看到的推薦書籍是一樣的,由此猜測(cè):豆瓣讀書沒有按用戶類別做個(gè)性化推薦。

同身份多次操作對(duì)比:再次登錄,在書籍詳情頁做了想讀、在讀、讀過、評(píng)價(jià)、取消在讀、取消讀過等交互操作,推薦列表的書籍沒有變化;點(diǎn)開推薦書籍詳情頁后,又返回原書籍詳情頁,推薦列表的書籍依然沒有變化。

同身份隔天登入對(duì)比:發(fā)現(xiàn)該模塊的部分書籍進(jìn)行了替換,位置也進(jìn)行了調(diào)整,如《增長黑客》替換了4本書,未被替換的6本位置也有所調(diào)整,表明該模塊的推薦策略以天為單位進(jìn)行重新推薦。

(2)是否進(jìn)行推薦

通過對(duì)冷門書籍進(jìn)行比對(duì),發(fā)現(xiàn)是否進(jìn)行推薦與評(píng)分人數(shù)和評(píng)分高低密切相關(guān)。

(3)推薦策略的關(guān)鍵輸入

對(duì)于評(píng)分人數(shù)10人以上,評(píng)分6分以上的書籍進(jìn)行推薦策略的猜測(cè),根據(jù)抽樣的結(jié)果整理可知:按照樣本的情況,可知,比較書籍與對(duì)應(yīng)推薦書籍的情況,推薦策略的關(guān)鍵輸入根據(jù)相關(guān)性的優(yōu)先級(jí)確定,排序依次為豆列,標(biāo)簽,評(píng)分,出版時(shí)間,出版公司等。

因此猜測(cè)對(duì)于評(píng)分人數(shù)10人以上,評(píng)分6分以上的書籍,大概率根據(jù)豆列,標(biāo)簽,評(píng)分,出版時(shí)間,出版公司等字段進(jìn)行加權(quán)計(jì)算,得出候選內(nèi)容池并進(jìn)行排序,與本書籍相關(guān)性最高,得分最高的排在前面。

三、問題匯總

3.1?發(fā)現(xiàn)問題

(1)沒有考慮用戶類別和用戶行為做個(gè)性化推薦

(2)無評(píng)分或評(píng)分人數(shù)少,評(píng)分低的書籍無推薦模塊

(3)關(guān)鍵輸入“豆列”涵蓋性過廣——準(zhǔn)確性不夠,推薦不準(zhǔn)

《哈利波特與密室》,《增長黑客》等前三的豆列收錄書籍過千,各種類型的書都有,泛而不精;依據(jù)此進(jìn)行推薦,容易出現(xiàn)推薦錯(cuò)誤。

《哈利波特與密室》前二豆列

《增長黑客》前三豆列

如《范志紅:吃出健康好身材》推薦《如何學(xué)習(xí)》,因?yàn)閮烧叩亩沽杏邢嗨疲窍嗨贫沽芯鶠槭珍洈?shù)過千,泛而不精的豆列(37°暖書單(二) (37°暖))。

(4)標(biāo)簽寬泛不準(zhǔn)確,標(biāo)簽在推薦中的權(quán)重不夠——準(zhǔn)確性不夠,推薦不準(zhǔn)

《范志紅:吃出健康好身材》推薦《如何學(xué)習(xí)》,因?yàn)閮烧叩臉?biāo)簽都命中“學(xué)習(xí)”,而學(xué)習(xí)這個(gè)標(biāo)簽過于寬大。

《截句詩叢冷門》的標(biāo)簽為“詩歌?? 哲思?? =i226+227=?? *合肥·黃山書社*”,《聰明女人說話辦事108個(gè)細(xì)節(jié)》的標(biāo)簽為“聰明女人說話辦事108個(gè)細(xì)節(jié).pdf、說話的藝術(shù)、女人、女人說話、還湊合、智慧、很好?? 社科”,標(biāo)簽管理不到位,書迷貼上的稀奇古怪的標(biāo)簽限制了小眾圖書的推薦和曝光。

《增長黑客》推薦《賦能》,標(biāo)簽不相同但是被推薦,通過閱讀發(fā)現(xiàn)兩者書籍分別屬于互聯(lián)網(wǎng)運(yùn)營類和領(lǐng)導(dǎo)思維類,與其他被推薦書籍相比,類型差距較大,推薦由于標(biāo)簽權(quán)重不夠,沒有被剔除。

(5)內(nèi)容強(qiáng)相關(guān)的書籍并未排在前面——排序問題

《運(yùn)營之光》屬于運(yùn)營類書籍,《增長黑客》比《精益數(shù)據(jù)分析》的類型,關(guān)聯(lián)豆列,熱度(讀過、在讀、想讀、評(píng)論數(shù)加總)都要高,但是卻排在后面。

(6)書籍之間相互推薦——多樣性不夠,推薦冗余

書籍與被推薦書籍之間:《增長黑客》和《運(yùn)營之光2.0》的推薦書目重合6個(gè);《哈利波特與密室》與《海底兩萬里》的推薦書目重合4個(gè);與《魯濱遜漂流記》的推薦書目重合5個(gè)。

系列書籍之間:《哈利波特與密室》中推薦了兩本哈利波特系列書籍;《截句詩叢冷門》的推薦書目全是同系列書籍,其對(duì)應(yīng)的推薦書籍也推薦本書。

(7)新版本的經(jīng)典書籍和小眾冷門書籍得不到曝光——時(shí)效性缺乏

通過抽樣可知,一般都會(huì)推薦年份差距不大的書籍,但是經(jīng)典書籍的新版本和相關(guān)性較高的小眾冷門書籍,猜測(cè)因?yàn)樵u(píng)分,評(píng)論數(shù)等不夠,并沒有被推薦,得不到該途徑的曝光。

3.2?優(yōu)先級(jí)判斷

 

本文由 @宋夏天 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!