策略產(chǎn)品經(jīng)理面試題:“怎么應(yīng)對(duì)推薦系統(tǒng)的冷啟動(dòng)?”
筆者結(jié)合這道面試題,進(jìn)行了一系列的思考與總結(jié),希望對(duì)你有所啟發(fā)。
怎么應(yīng)對(duì)推薦系統(tǒng)的冷啟動(dòng)?
這是一道很常見(jiàn)的推薦策略產(chǎn)品經(jīng)理面試題。
這個(gè)問(wèn)題無(wú)論是從技術(shù)層面、商業(yè)層面、還是業(yè)務(wù)層面,都會(huì)有不同的解決方法。
最近,在做一個(gè)APP頻道內(nèi)的內(nèi)容feed流,也遇到了冷啟動(dòng)問(wèn)題,下面是最近思考得出的一些可行的思路。
推薦系統(tǒng)冷啟動(dòng)階段其實(shí)也可以不那么的“冷”。
先了解一下什么是冷啟動(dòng)?
沒(méi)有官方的定義。對(duì)于推薦系統(tǒng)來(lái)講,因?yàn)樾枰玫接脩?hù),物品和事件三種數(shù)據(jù),其中任何一種數(shù)據(jù)的缺失都會(huì)導(dǎo)致推薦系統(tǒng)的冷啟動(dòng)。當(dāng)然一般都是缺用戶(hù)數(shù)據(jù)。
所以冷啟動(dòng)最直接的原因就是缺少可用的數(shù)據(jù)。那么,解決問(wèn)題的辦法也是對(duì)癥下藥。
01
排行榜、熱榜等熱門(mén)效應(yīng)應(yīng)對(duì)冷啟動(dòng)。
這個(gè)是最常見(jiàn)的一種應(yīng)對(duì)冷啟思路。推薦系統(tǒng)的本質(zhì)目的是高效連接用戶(hù)和平臺(tái)上的物品,就其能夠達(dá)成的目標(biāo)來(lái)講可以分為兩種:
- 為用戶(hù)發(fā)現(xiàn)“好”的東西
- 為用戶(hù)發(fā)現(xiàn)“喜歡”的東西
那么在不知道用戶(hù)喜歡什么的時(shí)候,最好的辦法就是把平臺(tái)上的“好”東西推給用戶(hù)。
如何衡量,量化一個(gè)東西的好壞。常見(jiàn)的做法就是依據(jù)物品的一些單品特征來(lái)計(jì)算它的熱度得分,然后按照這個(gè)得分進(jìn)行排序。
比如對(duì)于視頻,可以采用視頻的完播量/率、轉(zhuǎn)發(fā)量/率、點(diǎn)贊量/率、評(píng)論量/率等維度的特征進(jìn)行計(jì)算;對(duì)于商品,可以采用商品的銷(xiāo)量、關(guān)注量、收藏量、加購(gòu)量等維度的特征進(jìn)行計(jì)算。
熱門(mén)推薦適合大多數(shù)的冷啟動(dòng)場(chǎng)景,但是需要注意品類(lèi)的多樣性和差異性。常見(jiàn)的加入隨機(jī)性、干預(yù)穿插、品類(lèi)配比等等方式來(lái)保證最后給用戶(hù)呈現(xiàn)結(jié)果的豐富度。
02
有一些平時(shí)看似沒(méi)有用的數(shù)據(jù),實(shí)則蘊(yùn)含很豐富的信息,上下文信息就是這其中的一類(lèi)。
無(wú)論你是否注冊(cè)、是否登錄,在你打開(kāi)瀏覽器,或者打開(kāi)APP的時(shí)候,包括你的設(shè)備信息、瀏覽器信息、環(huán)境信息、語(yǔ)言信息等等都已經(jīng)自動(dòng)上傳到應(yīng)用的數(shù)據(jù)后臺(tái)了。
不同的領(lǐng)域?qū)ι舷挛男畔⒌亩x不同,但大意都是指和用戶(hù)當(dāng)前所處環(huán)境,場(chǎng)景相關(guān)的數(shù)據(jù)。
一個(gè)人在固定的設(shè)備、瀏覽器、環(huán)境、語(yǔ)言信息下的行為可能不能說(shuō)明什么問(wèn)題,但是當(dāng)有幾萬(wàn)、幾十萬(wàn)甚至上百萬(wàn)的這樣的數(shù)據(jù)的時(shí)候,那么它顯現(xiàn)出來(lái)的一些規(guī)律性就有很大的價(jià)值了。
比如:有相關(guān)數(shù)據(jù)表明,一般在下午早上8點(diǎn)和下午4點(diǎn)上傳的抖音視頻會(huì)更容易獲得傳播。
另外,之前國(guó)外一家公司做的一個(gè)音樂(lè)推薦系統(tǒng)就是基于用戶(hù)的國(guó)家信息來(lái)推薦不同風(fēng)格的歌曲,這其實(shí)也是一種上下文信息的應(yīng)用。
這可能就是統(tǒng)計(jì)學(xué)意義所在。
03
拿來(lái)主義在推薦系統(tǒng)的冷啟動(dòng)階段同樣適用,分為對(duì)內(nèi)和對(duì)外兩種:
對(duì)內(nèi)
一般稍微大點(diǎn)企業(yè)都不會(huì)只有一條業(yè)務(wù)線,所以當(dāng)面臨冷啟動(dòng)問(wèn)題的時(shí)候,不妨把眼界拓寬,看看其他業(yè)務(wù)是否有現(xiàn)成的數(shù)據(jù)可供對(duì)接,尤其是成熟的業(yè)務(wù)線。
在奉行拿來(lái)主義的適合,特別需要注意下面幾點(diǎn):
- 業(yè)務(wù)形態(tài)是否一致。比如同屬電商業(yè)務(wù),同屬內(nèi)容社區(qū)業(yè)務(wù)。
- 用戶(hù)重合度是否足夠高,這樣才能保證你拿來(lái)的標(biāo)簽是可靠,可用的。尤其是在一個(gè)核心業(yè)務(wù)下面的垂直業(yè)務(wù),一般用戶(hù)重合度都很高。
拿來(lái)主義其實(shí)就是一種標(biāo)簽對(duì)接的思路,用相似的成熟業(yè)務(wù)標(biāo)簽來(lái)支持新業(yè)務(wù)的冷啟動(dòng),這在背靠大樹(shù)的企業(yè)是一種很常見(jiàn)的思路。比如淘寶APP、京東APP下的部分垂直頻道。
對(duì)外
對(duì)外的話一般是指標(biāo)簽采買(mǎi)。需要關(guān)注兩點(diǎn):
- 采買(mǎi)標(biāo)簽的渠道需要足夠垂直,盡量保證業(yè)務(wù)范疇一致;
- 需要驗(yàn)證標(biāo)簽的的準(zhǔn)確性。比如之前我們給租房業(yè)務(wù)搭建房源推薦系統(tǒng),需要用戶(hù)的地理位置和購(gòu)買(mǎi)力標(biāo)簽,對(duì)接了一家專(zhuān)門(mén)做租房線上交易企業(yè)的標(biāo)簽。在標(biāo)簽驗(yàn)證環(huán)節(jié),把地理位置標(biāo)簽與用戶(hù)常用的收貨地址標(biāo)簽進(jìn)行比對(duì),購(gòu)買(mǎi)力標(biāo)簽與用戶(hù)經(jīng)常購(gòu)買(mǎi)的品類(lèi)的價(jià)格進(jìn)行比對(duì),在一定程度上可以剔除臟數(shù)據(jù)。
04
提升推薦系統(tǒng)的時(shí)效性。
這種嚴(yán)格來(lái)說(shuō)不屬于解決冷啟的一種思路,但是,一定程度上能夠縮短冷啟的周期。
不知道大家有沒(méi)有注意到當(dāng)你從淘寶APP首頁(yè)猜你喜歡區(qū)域點(diǎn)擊一個(gè)商品,進(jìn)入該商品的詳情頁(yè),并且瀏覽時(shí)間比較長(zhǎng)的時(shí)候,再返回的時(shí)候,會(huì)有一個(gè)與你剛剛瀏覽商品相似的商品移動(dòng)上來(lái)。
我第一次發(fā)現(xiàn)的時(shí)候,著實(shí)被驚艷到了。
如果能提升推薦系統(tǒng)的時(shí)效性,甚至做到實(shí)時(shí),那么在用戶(hù)打開(kāi)應(yīng)用,第一次與平臺(tái)的物品進(jìn)行有效交互的時(shí)候,就已經(jīng)能夠產(chǎn)生新的推薦列表了。
這個(gè)策略的背后需要考慮的因素很多,比如有效交互的定義、接口的性能、計(jì)算的能力。
05
歷史數(shù)據(jù)的復(fù)用。
成熟的業(yè)務(wù)推薦系統(tǒng)一般都會(huì)有一個(gè)冷啟動(dòng)數(shù)據(jù)池,會(huì)選擇過(guò)往冷啟效果比較好的物品加入到數(shù)據(jù)池以備下次冷啟。
歷史數(shù)據(jù)不能簡(jiǎn)單的全盤(pán)復(fù)用,需要考慮一定的過(guò)濾策略。比如當(dāng)下的環(huán)境政策、業(yè)務(wù)規(guī)劃、平臺(tái)計(jì)劃等等,盡量能夠保證各方權(quán)益的平衡。
以上大概就是最近思考所得一些冷啟策略,隨便聊聊,希望你能有所獲,也歡迎大家補(bǔ)充交流。
#專(zhuān)欄作家#
夏唬人,公眾號(hào):夏唬人,人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家。某廠策略產(chǎn)品經(jīng)理,關(guān)注推薦,搜索,AI策略方向,用數(shù)據(jù)來(lái)賦能業(yè)務(wù)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
言簡(jiǎn)意賅,關(guān)注了
怎樣應(yīng)對(duì)
沒(méi)干貨啊
到我的公眾號(hào)看干貨