產(chǎn)品視角下推薦/排序系統(tǒng)的冷啟動(dòng)問題(一)
對(duì)做排序或者推薦功能相關(guān)的產(chǎn)品經(jīng)理來說,機(jī)器學(xué)習(xí)不是什么陌生的概念,大家經(jīng)??吹降母黝惍a(chǎn)品的推薦內(nèi)容也在向用戶傳輸機(jī)器學(xué)習(xí)的概念?!翱催^這件商品的用戶也看過”“聽過這首歌曲的用戶也聽過”“您也許認(rèn)識(shí)XX”“您的好友也關(guān)注了XX”等等這一類的推薦功能大家已經(jīng)非常熟悉,排序上面應(yīng)用這種方式的可能不那么明顯,但是稍加留意,你也會(huì)發(fā)現(xiàn)許多電商平臺(tái)上展現(xiàn)給你的列表中前面的一些內(nèi)容和你曾經(jīng)看過的一些東西好像有些許的關(guān)聯(lián)。如果你恰好是個(gè)愛思考的人,那么大概已經(jīng)猜到了這類功能的實(shí)現(xiàn)方式:通過用戶和item(歌曲、商品、好友關(guān)系)的歷史數(shù)據(jù),(經(jīng)過合適的協(xié)同過濾或其他算法)來給用戶推薦Ta可能感興趣的內(nèi)容。
這種機(jī)器學(xué)習(xí)方式的排序/推薦策略效果是非常明顯,根據(jù)一些公開的數(shù)據(jù),亞馬遜網(wǎng)站通過推薦帶來的銷量比例占到了20%以上,而在筆者的產(chǎn)品實(shí)踐中,也證明了根據(jù)用戶歷史行為對(duì)排序策略進(jìn)行調(diào)整和作出推薦對(duì)提高轉(zhuǎn)化率有明顯的正面作用,因此在排序和推薦等產(chǎn)品的策略制定中,根據(jù)用戶歷史行為做調(diào)整也是大家經(jīng)常會(huì)關(guān)注到的內(nèi)容。從上面的描述中你可能已經(jīng)注意到,這類策略有一個(gè)基本前提就是用戶和Item要有足夠的歷史數(shù)據(jù)來進(jìn)行計(jì)算,如果用戶或Item已經(jīng)有了足夠的歷史數(shù)據(jù),那么只要通過推薦算法就能夠給特定的用戶推薦出合適的內(nèi)容,但當(dāng)用戶和Item沒有歷史數(shù)據(jù)的時(shí)候,直接通過推薦算法出來的內(nèi)容很可能就會(huì)成為Badcase集錦。對(duì)于這類新用戶或新Item在排序/推薦系統(tǒng)中處理,我們稱之為冷啟動(dòng),這個(gè)問題是數(shù)據(jù)工程師和策略產(chǎn)品經(jīng)理經(jīng)常需要討論解決的問題。
什么是冷啟動(dòng)
冷啟動(dòng)研究的是在沒有大量用戶和產(chǎn)品數(shù)據(jù)的情況下,如何給相應(yīng)的用戶做出能夠讓用戶能接受的推薦內(nèi)容。冷啟動(dòng)主要分為三類:用戶冷啟動(dòng)、物品冷啟動(dòng)和系統(tǒng)冷啟動(dòng)。
用戶冷啟動(dòng)主要解決給新用戶做(個(gè)性化)推薦的問題,因?yàn)樾掠脩粼谙到y(tǒng)中還沒有任何歷史數(shù)據(jù),因而很難預(yù)測其喜好并做出相應(yīng)推薦。
物品冷啟動(dòng)主要解決將新的物品推薦給可能對(duì)它感興趣的用戶的問題,因?yàn)樾庐a(chǎn)品同樣是沒有和用戶交互的數(shù)據(jù),常見的推薦系統(tǒng)往往推薦的是數(shù)據(jù)較多較好的物品,而直接忽視這些新物品。在需要用到推薦的產(chǎn)品中,產(chǎn)品覆蓋的物品眾多,馬太效應(yīng)變成不得不考慮的問題,而推薦往往代表著流量入口,是造成馬太效應(yīng)的罪魁之一也是消減馬太效應(yīng)的渠道之一。如果考慮整個(gè)系統(tǒng)中銷量的平衡、考慮推薦的多樣性和覆蓋率,我們需要給新商品一些推薦的機(jī)會(huì),但是如果將新物品強(qiáng)行納入到推薦中,產(chǎn)品經(jīng)理不得不冒轉(zhuǎn)化率降低的風(fēng)險(xiǎn),而且最可怕的是這種風(fēng)險(xiǎn)是無法預(yù)期的。
系統(tǒng)冷啟動(dòng)處理的問題是用戶和物品都沒有沒有足夠的數(shù)據(jù)時(shí)候的推薦,個(gè)人認(rèn)為所研究的內(nèi)容應(yīng)該包括在用戶冷啟動(dòng)和物品冷啟動(dòng)中,不做細(xì)究。
今天主要給大家介紹常見的幾種或已經(jīng)確認(rèn)在實(shí)踐中有效的用戶冷啟動(dòng)處理方式,至于物品冷啟動(dòng),處理起來比用戶冷啟動(dòng)更復(fù)雜,鑒于暫時(shí)還沒有相應(yīng)的實(shí)踐經(jīng)驗(yàn),這部分留到有關(guān)于物品冷啟動(dòng)的成功實(shí)踐案例之后,請(qǐng)大家期待產(chǎn)品視角下推薦/排序冷啟動(dòng)的處理(二)。
利用用戶基礎(chǔ)信息
用戶基礎(chǔ)信息是指用戶不在產(chǎn)品中有任何交互,我們就能夠獲得的信息,這些信息主要分為三類:一是用戶注冊(cè)信息,比如性別、年齡、電話、職業(yè)等等一些可以引導(dǎo)用戶填寫的客觀信息;二是讓用戶做出喜好或分類選擇的主觀信息,比如在一些音樂、視頻和閱讀類看重推薦功能的產(chǎn)品上,用戶在注冊(cè)時(shí)需要填寫一些必要的信息和選擇關(guān)注/喜歡的類型,這些信息很大的一個(gè)作用就是用于用戶個(gè)性化內(nèi)容推薦;三是可以關(guān)聯(lián)外部平臺(tái)獲取的信息,這一類信息是在社會(huì)化登陸興起之后可以提供給推薦的數(shù)據(jù),比如網(wǎng)站通過支持微博登陸可以獲取用戶在微博上注冊(cè)的信息和好友關(guān)系等。
在我們確認(rèn)能夠獲得用戶的這些信息之后,就可以通過直觀或數(shù)據(jù)分析的方式發(fā)現(xiàn)不同類型的用戶的不同特征,進(jìn)而進(jìn)行推薦。有些推薦邏輯的判別是直觀就可以做出來的,比如用戶注冊(cè)信息是男,那么就不要給用戶推薦裙子這一類的產(chǎn)品。而對(duì)于一些其他信息,則可能需要復(fù)雜一些數(shù)據(jù)分析來完成,比如通過手機(jī)號(hào)分析用戶常住地城市,然后分析不同城市的用戶在商品選擇時(shí)的價(jià)格、品類、品牌偏好是否存在差異。
那么如何選擇使用哪些信息來細(xì)分策略呢?我這里有一條簡單的判別方法:不同特征的用戶在主要考察數(shù)據(jù)表現(xiàn)上的差異情況,如果差異大,那就是值得細(xì)分深挖,反之就(暫時(shí))沒有什么必要。比如,你發(fā)現(xiàn)不同性別的用戶在轉(zhuǎn)化率體現(xiàn)下沒有差異,那就不需要區(qū)分性別進(jìn)行策略計(jì)算;而如果發(fā)現(xiàn)不同年齡段的用戶在轉(zhuǎn)化率體現(xiàn)上有很大差異,那就值得區(qū)分年齡做不同的策略。
熱門推薦
用戶存在著從眾的心理,而且大部分人的特征是趨于相似的。因而當(dāng)我們確實(shí)沒法獲取用戶偏好的時(shí)候,我們可以采用熱門推薦的方式進(jìn)行推薦。新聞視頻網(wǎng)站的瀏覽量、音樂網(wǎng)站的收聽量、電商網(wǎng)站的銷量、搜索的頻次、社交網(wǎng)站的關(guān)注度等等都是是否熱門的具體體現(xiàn),熱門的物品表示物品在大范圍是受歡迎,研究發(fā)現(xiàn),新用戶更愿意接受熱門的商品而不愿嘗試新物品,給新用戶推薦熱門商品理論上至少不會(huì)犯太多錯(cuò)。
在處理熱門的時(shí)候,需要注意的是熱門的“范圍”,即物品在什么維度內(nèi)是熱門的。這個(gè)維度包括分類、時(shí)間、地域等等,需要根據(jù)產(chǎn)品的實(shí)際情況進(jìn)行設(shè)置。比如在亞馬遜上,在科技圖書中的熱門,但是可能在所有圖書中不是熱門的。又如在新聞網(wǎng)站中,1小時(shí)內(nèi)的熱門和24小時(shí)以內(nèi)的熱門應(yīng)該是有區(qū)別的,選擇推薦哪個(gè)維度的熱門是需要分析試驗(yàn)的。在微博上,熱門微博甚至直接是按多長時(shí)間內(nèi)熱門分Tab展示的。對(duì)于時(shí)間跨度上的熱門,如果是全局情況下,一般會(huì)采用階梯降權(quán)的方式處理,比如1小時(shí)、24小時(shí)、3天內(nèi)的閱讀量按權(quán)重從大到小做推薦得分計(jì)算,其他維度的也可以嘗試這種階梯降權(quán)的方式做熱門處理。
考慮item質(zhì)量
雖然手頭拿不出確實(shí)的研究數(shù)據(jù),但是根據(jù)合理的猜想,用戶更傾向于選擇質(zhì)量較高的物品,因而當(dāng)新用戶接觸到我們的推薦時(shí),Ta更容易接受(至少看起來)質(zhì)量更高的商品。幾乎每個(gè)產(chǎn)品系統(tǒng)中的物品,都會(huì)有能夠體現(xiàn)物品質(zhì)量的數(shù)據(jù),常見的可獲取數(shù)據(jù)是評(píng)分,我們可以給用戶推薦在評(píng)價(jià)系統(tǒng)處于前列的內(nèi)容。
如果用評(píng)分來作為質(zhì)量的依據(jù),那么我們可能會(huì)面臨的一個(gè)問題就是新用戶并不了解這個(gè)產(chǎn)品中某個(gè)具體評(píng)分的意義,比如在一個(gè)圖書電商網(wǎng)站上,4.8分到底意味著什么?處理這個(gè)問題,除了我們要讓評(píng)分系統(tǒng)盡量靠近用戶認(rèn)知之外(比如,別選個(gè)滿分為7分的系統(tǒng)),還可以用一些輔助信息的展示來給用戶說明,這里有一個(gè)大家熟悉的案例:淘寶中每個(gè)店鋪的頁面都會(huì)展示分維度的評(píng)分,并且在評(píng)分后面注明“高于同行XX%”。在推薦內(nèi)容的展示中,我們可以給新用戶展示評(píng)分的同時(shí)給出評(píng)價(jià)的相對(duì)意義,方便用戶理解我們給Ta推薦的物品到底是什么樣的質(zhì)量水平。
除了評(píng)價(jià)之外,銷量、瀏覽、收藏等等也一定程度上反映除了物品的質(zhì)量,可以作為輔助參數(shù)作為選擇熱門物品的標(biāo)準(zhǔn)。
合理利用上下文信息
除了從用戶和物品上挖掘盡量多可用的信息,對(duì)于新用戶的推薦還可以合理利用上下文信息,有時(shí)候,這些上下文信息的重要程度甚至超過了其他信息。上下文信息是指用戶在接觸到推薦系統(tǒng)時(shí)的時(shí)間、地點(diǎn)、心情、場景等等,這些信息在用戶做出決策中都具有決定性的作用,因而也是推薦系統(tǒng)需要重點(diǎn)考慮的內(nèi)容。比如,音樂產(chǎn)品中對(duì)用戶心情信息的把握,你不能在用戶分手后給Ta推薦一首《今兒個(gè)真高興》吧,同理給12月份進(jìn)入購物網(wǎng)站的新用戶推薦T恤也是不能理解的。
在筆者所在的O2O產(chǎn)品中,用戶地理信息在排序和推薦中都有著重要位置,在機(jī)器學(xué)習(xí)模型中,其重要性甚至遠(yuǎn)遠(yuǎn)超過物品質(zhì)量、用戶偏好所有其他特征,曾經(jīng)在某個(gè)場景中,由于地理信息丟失,轉(zhuǎn)化率和交易額都遭受了嚴(yán)重的損失。因此,一定要關(guān)注和產(chǎn)品緊密相關(guān)的上下文信息,才能給新用戶給出相對(duì)合理的推薦內(nèi)容。
結(jié)語
在排序/推薦策略的設(shè)計(jì)中,對(duì)于那些頻度較高的產(chǎn)品,或者任何產(chǎn)品中的活躍用戶,機(jī)器學(xué)習(xí)的方式能夠根據(jù)大量的歷史數(shù)據(jù)給出用戶滿意的排序方式和推薦內(nèi)容,但對(duì)于新用戶或當(dāng)數(shù)據(jù)稀疏時(shí),機(jī)器學(xué)習(xí)往往達(dá)不到想要的效果。根據(jù)實(shí)踐經(jīng)驗(yàn),在這種情況下,考慮了用戶基礎(chǔ)信息、熱門情況、物品質(zhì)量和上下文的強(qiáng)規(guī)則方式反而有更好的效果。但是,強(qiáng)規(guī)則的處理方式的前提是對(duì)業(yè)務(wù)、用戶、產(chǎn)品有著充分的了解,而且策略本身也應(yīng)該設(shè)計(jì)成可試驗(yàn)可對(duì)比方便迭代的以隨時(shí)根據(jù)試驗(yàn)情況調(diào)整。
同時(shí),這也暗含著一個(gè)策略產(chǎn)品經(jīng)理應(yīng)該掌握的基礎(chǔ)能力,那就是對(duì)特例的識(shí)別。在策略相關(guān)的產(chǎn)品中,許多復(fù)雜的內(nèi)容都是工程師使用機(jī)器學(xué)習(xí)來完成的,但機(jī)器不是萬能的,它只會(huì)處理我們已經(jīng)考慮到的內(nèi)容,而我們需要做的就是思考讓機(jī)器去處理哪些內(nèi)容,這也是一個(gè)策略產(chǎn)品經(jīng)理的價(jià)值之一。
本文由 @hihipm 投稿發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。
寫的超棒,果斷收藏
沒有找到期待的二呢 ??
這才是干貨文章,期待二
?