精品国产性色无码AV网站,久久综合无码,99国产精品无码

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

產(chǎn)品視角下推薦/排序系統(tǒng)的冷啟動(dòng)問題（一）

紙皮小火車

2015-12-21

4 評(píng)論 18071 瀏覽 276 收藏

14 分鐘

對(duì)做排序或者推薦功能相關(guān)的產(chǎn)品經(jīng)理來說，機(jī)器學(xué)習(xí)不是什么陌生的概念，大家經(jīng)?？吹降母黝惍a(chǎn)品的推薦內(nèi)容也在向用戶傳輸機(jī)器學(xué)習(xí)的概念?！翱催^這件商品的用戶也看過”“聽過這首歌曲的用戶也聽過”“您也許認(rèn)識(shí)XX”“您的好友也關(guān)注了XX”等等這一類的推薦功能大家已經(jīng)非常熟悉，排序上面應(yīng)用這種方式的可能不那么明顯，但是稍加留意，你也會(huì)發(fā)現(xiàn)許多電商平臺(tái)上展現(xiàn)給你的列表中前面的一些內(nèi)容和你曾經(jīng)看過的一些東西好像有些許的關(guān)聯(lián)。如果你恰好是個(gè)愛思考的人，那么大概已經(jīng)猜到了這類功能的實(shí)現(xiàn)方式：通過用戶和item（歌曲、商品、好友關(guān)系）的歷史數(shù)據(jù)，（經(jīng)過合適的協(xié)同過濾或其他算法）來給用戶推薦Ta可能感興趣的內(nèi)容。

這種機(jī)器學(xué)習(xí)方式的排序/推薦策略效果是非常明顯，根據(jù)一些公開的數(shù)據(jù)，亞馬遜網(wǎng)站通過推薦帶來的銷量比例占到了20%以上，而在筆者的產(chǎn)品實(shí)踐中，也證明了根據(jù)用戶歷史行為對(duì)排序策略進(jìn)行調(diào)整和作出推薦對(duì)提高轉(zhuǎn)化率有明顯的正面作用，因此在排序和推薦等產(chǎn)品的策略制定中，根據(jù)用戶歷史行為做調(diào)整也是大家經(jīng)常會(huì)關(guān)注到的內(nèi)容。從上面的描述中你可能已經(jīng)注意到，這類策略有一個(gè)基本前提就是用戶和Item要有足夠的歷史數(shù)據(jù)來進(jìn)行計(jì)算，如果用戶或Item已經(jīng)有了足夠的歷史數(shù)據(jù)，那么只要通過推薦算法就能夠給特定的用戶推薦出合適的內(nèi)容，但當(dāng)用戶和Item沒有歷史數(shù)據(jù)的時(shí)候，直接通過推薦算法出來的內(nèi)容很可能就會(huì)成為Badcase集錦。對(duì)于這類新用戶或新Item在排序/推薦系統(tǒng)中處理，我們稱之為冷啟動(dòng)，這個(gè)問題是數(shù)據(jù)工程師和策略產(chǎn)品經(jīng)理經(jīng)常需要討論解決的問題。

什么是冷啟動(dòng)

冷啟動(dòng)研究的是在沒有大量用戶和產(chǎn)品數(shù)據(jù)的情況下，如何給相應(yīng)的用戶做出能夠讓用戶能接受的推薦內(nèi)容。冷啟動(dòng)主要分為三類：用戶冷啟動(dòng)、物品冷啟動(dòng)和系統(tǒng)冷啟動(dòng)。

用戶冷啟動(dòng)主要解決給新用戶做（個(gè)性化）推薦的問題，因?yàn)樾掠脩粼谙到y(tǒng)中還沒有任何歷史數(shù)據(jù)，因而很難預(yù)測其喜好并做出相應(yīng)推薦。

物品冷啟動(dòng)主要解決將新的物品推薦給可能對(duì)它感興趣的用戶的問題，因?yàn)樾庐a(chǎn)品同樣是沒有和用戶交互的數(shù)據(jù)，常見的推薦系統(tǒng)往往推薦的是數(shù)據(jù)較多較好的物品，而直接忽視這些新物品。在需要用到推薦的產(chǎn)品中，產(chǎn)品覆蓋的物品眾多，馬太效應(yīng)變成不得不考慮的問題，而推薦往往代表著流量入口，是造成馬太效應(yīng)的罪魁之一也是消減馬太效應(yīng)的渠道之一。如果考慮整個(gè)系統(tǒng)中銷量的平衡、考慮推薦的多樣性和覆蓋率，我們需要給新商品一些推薦的機(jī)會(huì)，但是如果將新物品強(qiáng)行納入到推薦中，產(chǎn)品經(jīng)理不得不冒轉(zhuǎn)化率降低的風(fēng)險(xiǎn)，而且最可怕的是這種風(fēng)險(xiǎn)是無法預(yù)期的。

系統(tǒng)冷啟動(dòng)處理的問題是用戶和物品都沒有沒有足夠的數(shù)據(jù)時(shí)候的推薦，個(gè)人認(rèn)為所研究的內(nèi)容應(yīng)該包括在用戶冷啟動(dòng)和物品冷啟動(dòng)中，不做細(xì)究。

今天主要給大家介紹常見的幾種或已經(jīng)確認(rèn)在實(shí)踐中有效的用戶冷啟動(dòng)處理方式，至于物品冷啟動(dòng)，處理起來比用戶冷啟動(dòng)更復(fù)雜，鑒于暫時(shí)還沒有相應(yīng)的實(shí)踐經(jīng)驗(yàn)，這部分留到有關(guān)于物品冷啟動(dòng)的成功實(shí)踐案例之后，請(qǐng)大家期待產(chǎn)品視角下推薦/排序冷啟動(dòng)的處理（二）。

利用用戶基礎(chǔ)信息

用戶基礎(chǔ)信息是指用戶不在產(chǎn)品中有任何交互，我們就能夠獲得的信息，這些信息主要分為三類：一是用戶注冊(cè)信息，比如性別、年齡、電話、職業(yè)等等一些可以引導(dǎo)用戶填寫的客觀信息；二是讓用戶做出喜好或分類選擇的主觀信息，比如在一些音樂、視頻和閱讀類看重推薦功能的產(chǎn)品上，用戶在注冊(cè)時(shí)需要填寫一些必要的信息和選擇關(guān)注/喜歡的類型，這些信息很大的一個(gè)作用就是用于用戶個(gè)性化內(nèi)容推薦；三是可以關(guān)聯(lián)外部平臺(tái)獲取的信息，這一類信息是在社會(huì)化登陸興起之后可以提供給推薦的數(shù)據(jù)，比如網(wǎng)站通過支持微博登陸可以獲取用戶在微博上注冊(cè)的信息和好友關(guān)系等。

在我們確認(rèn)能夠獲得用戶的這些信息之后，就可以通過直觀或數(shù)據(jù)分析的方式發(fā)現(xiàn)不同類型的用戶的不同特征，進(jìn)而進(jìn)行推薦。有些推薦邏輯的判別是直觀就可以做出來的，比如用戶注冊(cè)信息是男，那么就不要給用戶推薦裙子這一類的產(chǎn)品。而對(duì)于一些其他信息，則可能需要復(fù)雜一些數(shù)據(jù)分析來完成，比如通過手機(jī)號(hào)分析用戶常住地城市，然后分析不同城市的用戶在商品選擇時(shí)的價(jià)格、品類、品牌偏好是否存在差異。

那么如何選擇使用哪些信息來細(xì)分策略呢？我這里有一條簡單的判別方法：不同特征的用戶在主要考察數(shù)據(jù)表現(xiàn)上的差異情況，如果差異大，那就是值得細(xì)分深挖，反之就（暫時(shí)）沒有什么必要。比如，你發(fā)現(xiàn)不同性別的用戶在轉(zhuǎn)化率體現(xiàn)下沒有差異，那就不需要區(qū)分性別進(jìn)行策略計(jì)算；而如果發(fā)現(xiàn)不同年齡段的用戶在轉(zhuǎn)化率體現(xiàn)上有很大差異，那就值得區(qū)分年齡做不同的策略。

考慮item質(zhì)量

雖然手頭拿不出確實(shí)的研究數(shù)據(jù)，但是根據(jù)合理的猜想，用戶更傾向于選擇質(zhì)量較高的物品，因而當(dāng)新用戶接觸到我們的推薦時(shí)，Ta更容易接受（至少看起來）質(zhì)量更高的商品。幾乎每個(gè)產(chǎn)品系統(tǒng)中的物品，都會(huì)有能夠體現(xiàn)物品質(zhì)量的數(shù)據(jù)，常見的可獲取數(shù)據(jù)是評(píng)分，我們可以給用戶推薦在評(píng)價(jià)系統(tǒng)處于前列的內(nèi)容。

如果用評(píng)分來作為質(zhì)量的依據(jù)，那么我們可能會(huì)面臨的一個(gè)問題就是新用戶并不了解這個(gè)產(chǎn)品中某個(gè)具體評(píng)分的意義，比如在一個(gè)圖書電商網(wǎng)站上，4.8分到底意味著什么？處理這個(gè)問題，除了我們要讓評(píng)分系統(tǒng)盡量靠近用戶認(rèn)知之外（比如，別選個(gè)滿分為7分的系統(tǒng)），還可以用一些輔助信息的展示來給用戶說明，這里有一個(gè)大家熟悉的案例：淘寶中每個(gè)店鋪的頁面都會(huì)展示分維度的評(píng)分，并且在評(píng)分后面注明“高于同行XX%”。在推薦內(nèi)容的展示中，我們可以給新用戶展示評(píng)分的同時(shí)給出評(píng)價(jià)的相對(duì)意義，方便用戶理解我們給Ta推薦的物品到底是什么樣的質(zhì)量水平。

除了評(píng)價(jià)之外，銷量、瀏覽、收藏等等也一定程度上反映除了物品的質(zhì)量，可以作為輔助參數(shù)作為選擇熱門物品的標(biāo)準(zhǔn)。

合理利用上下文信息

除了從用戶和物品上挖掘盡量多可用的信息，對(duì)于新用戶的推薦還可以合理利用上下文信息，有時(shí)候，這些上下文信息的重要程度甚至超過了其他信息。上下文信息是指用戶在接觸到推薦系統(tǒng)時(shí)的時(shí)間、地點(diǎn)、心情、場景等等，這些信息在用戶做出決策中都具有決定性的作用，因而也是推薦系統(tǒng)需要重點(diǎn)考慮的內(nèi)容。比如，音樂產(chǎn)品中對(duì)用戶心情信息的把握，你不能在用戶分手后給Ta推薦一首《今兒個(gè)真高興》吧，同理給12月份進(jìn)入購物網(wǎng)站的新用戶推薦T恤也是不能理解的。

在筆者所在的O2O產(chǎn)品中，用戶地理信息在排序和推薦中都有著重要位置，在機(jī)器學(xué)習(xí)模型中，其重要性甚至遠(yuǎn)遠(yuǎn)超過物品質(zhì)量、用戶偏好所有其他特征，曾經(jīng)在某個(gè)場景中，由于地理信息丟失，轉(zhuǎn)化率和交易額都遭受了嚴(yán)重的損失。因此，一定要關(guān)注和產(chǎn)品緊密相關(guān)的上下文信息，才能給新用戶給出相對(duì)合理的推薦內(nèi)容。

結(jié)語

在排序/推薦策略的設(shè)計(jì)中，對(duì)于那些頻度較高的產(chǎn)品，或者任何產(chǎn)品中的活躍用戶，機(jī)器學(xué)習(xí)的方式能夠根據(jù)大量的歷史數(shù)據(jù)給出用戶滿意的排序方式和推薦內(nèi)容，但對(duì)于新用戶或當(dāng)數(shù)據(jù)稀疏時(shí)，機(jī)器學(xué)習(xí)往往達(dá)不到想要的效果。根據(jù)實(shí)踐經(jīng)驗(yàn)，在這種情況下，考慮了用戶基礎(chǔ)信息、熱門情況、物品質(zhì)量和上下文的強(qiáng)規(guī)則方式反而有更好的效果。但是，強(qiáng)規(guī)則的處理方式的前提是對(duì)業(yè)務(wù)、用戶、產(chǎn)品有著充分的了解，而且策略本身也應(yīng)該設(shè)計(jì)成可試驗(yàn)可對(duì)比方便迭代的以隨時(shí)根據(jù)試驗(yàn)情況調(diào)整。

同時(shí)，這也暗含著一個(gè)策略產(chǎn)品經(jīng)理應(yīng)該掌握的基礎(chǔ)能力，那就是對(duì)特例的識(shí)別。在策略相關(guān)的產(chǎn)品中，許多復(fù)雜的內(nèi)容都是工程師使用機(jī)器學(xué)習(xí)來完成的，但機(jī)器不是萬能的，它只會(huì)處理我們已經(jīng)考慮到的內(nèi)容，而我們需要做的就是思考讓機(jī)器去處理哪些內(nèi)容，這也是一個(gè)策略產(chǎn)品經(jīng)理的價(jià)值之一。

本文由 @hihipm 投稿發(fā)布于人人都是產(chǎn)品經(jīng)理?，未經(jīng)許可，禁止轉(zhuǎn)載。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App