OTA推薦系統(tǒng)之用戶體系
這篇文章是《OTA推薦系統(tǒng)之實(shí)時(shí)用戶意圖》的姐妹篇,實(shí)時(shí)用戶意圖是基于短期的用戶行為,找到用戶的偏好,作為個(gè)性化推薦的策略之一,強(qiáng)調(diào)即時(shí)性。
OTA行業(yè)是一個(gè)低頻的行業(yè),對(duì)于老用戶如何利用他的歷史行為數(shù)據(jù),建立更全面的用戶體系,進(jìn)一步提高個(gè)性化服務(wù)的準(zhǔn)確率?對(duì)于新用戶,因?yàn)闆](méi)有短期用戶行為數(shù)據(jù)也就沒(méi)有實(shí)時(shí)用戶意圖了,該如何找到這些用戶的特征,從而為這些用戶提供個(gè)性化服務(wù)呢?本文將從WHAT和HOW(至于WHY就參考姐妹篇了)兩個(gè)方面結(jié)合自己的經(jīng)驗(yàn)給出建立用戶體系的思路。
WHAT(是什么)?
本文的用戶體系主要定義為:利用歷史數(shù)據(jù)及外部數(shù)據(jù),結(jié)合算法模型,為用戶(新用戶或者近期無(wú)行為的老用戶)建立的用戶特征圖譜。針對(duì)新老用戶舉兩個(gè)例子:
示例1:一個(gè)老用戶在過(guò)去一年時(shí)間購(gòu)買過(guò)一個(gè)帶孩子去塞班島的自由行產(chǎn)品,那么基于這樣的訂單行為,我們可以預(yù)測(cè)該用戶下次出行的偏好特征包括:帶小孩子,去海島,偏好自由行產(chǎn)品。同時(shí)基于他的多次訂單以及他的瀏覽歷史,結(jié)合算法可以對(duì)預(yù)測(cè)的可信度進(jìn)行修正,從而得到他的長(zhǎng)期偏好。
示例2:一個(gè)上海的用戶打開(kāi)App,可以獲取到這個(gè)用戶的用戶特征包括:用戶當(dāng)前位置上海,手機(jī)型號(hào)iPhone 7等特征。
用戶體系主要是利用用戶的行為數(shù)據(jù),結(jié)合大數(shù)據(jù)技術(shù)來(lái)建立更加全面的用戶畫(huà)像,從而可以更好的為用戶做個(gè)性化推薦服務(wù)。
HOW(怎么做)?
我們?cè)诮⒂脩籼卣鲌D譜是依賴于下面的假設(shè):
- 用戶對(duì)自己感興趣的內(nèi)容會(huì)多次瀏覽或搜索,且用戶的興趣不會(huì)輕易發(fā)生改變
- 用戶對(duì)和自己相似的人群喜歡的物品有同樣的品味
如上午的兩個(gè)示例所示,不同人群可利用的數(shù)據(jù)資源不一樣,所以針對(duì)不同的人群所采用的思路,方法也是不同的。下面通過(guò)將人群分成兩大類:老用戶群和新用戶群來(lái)給出它們的思路。
1. 老用戶
老用戶的定義:指的那些已經(jīng)安裝過(guò)App,并且進(jìn)行過(guò)搜索,瀏覽等相關(guān)操作的用戶,那些安裝卻在指定的時(shí)間段(一般是2年,不同的公司定義不一樣)從來(lái)未打開(kāi)過(guò)App的用戶排除在外(對(duì)于這些用戶群本文作為新用戶處理)。老用戶用戶體系的建立同樣依賴于用戶的行為數(shù)據(jù),包括他的瀏覽,搜索,收藏,購(gòu)買等,相比實(shí)時(shí)用戶意圖,這里用到的用戶的行為數(shù)據(jù)的時(shí)間緯度上更長(zhǎng)(一般2年,不同的公司定義不一樣)。
下面講論述一下上圖中的特征偏好的設(shè)計(jì)思路:
興趣點(diǎn)的偏好
一個(gè)用戶的旅游興趣是可以基于他的行為來(lái)獲取的,主要思路:利用算法從他所關(guān)注的城市集的景點(diǎn)特征預(yù)測(cè)出該用戶的興趣特征。舉例來(lái)說(shuō):一個(gè)人在一定時(shí)間中曾經(jīng)瀏覽過(guò)塞班島,普吉島,馬爾代夫,三亞等目的地城市,并且下單去過(guò)普吉島。基于用戶訪問(wèn)城市集的所有景點(diǎn),通過(guò)算法模型得到這些城市景點(diǎn)的公共特征為休閑,海島,沙灘等,并且每個(gè)特征有置信權(quán)重,從而得到該用戶的用戶特征為:休閑,海島,沙灘,并且每個(gè)興趣特征有一個(gè)置信權(quán)重。
目的地的偏好
獲取目的地偏好的主要思路:通過(guò)匯總他關(guān)注過(guò)的城市,排除已經(jīng)去過(guò)的城市,從而得到用戶有興趣的目的地集。這里基于的假設(shè)是用戶關(guān)注的目的地之所以沒(méi)有去成是因?yàn)槟撤N原因?qū)е?,那么這些目的地相比其它未關(guān)注的目的地對(duì)用戶的吸引度度會(huì)更高,更容易被用戶作為下次旅游的候選集。
產(chǎn)品的偏好
獲取產(chǎn)品偏好的主要思路:通過(guò)匯總他關(guān)注過(guò)的產(chǎn)品(尤其是度假類的產(chǎn)品),排除歸屬于已經(jīng)去過(guò)的城市的產(chǎn)品,從而匯總得到用戶有興趣的產(chǎn)品集。這里基于的假設(shè)同目的地的偏好中的假設(shè),用戶會(huì)對(duì)關(guān)注過(guò)的內(nèi)容更感興趣。
常去地的偏好
獲取常去地偏好的主要思路:基于用戶的訂單產(chǎn)品,分析出用戶在半年時(shí)間內(nèi)購(gòu)買過(guò)同一個(gè)目的地不同時(shí)間端的三個(gè)產(chǎn)品,從而得到該用戶的常去目的地偏好。
建立了用戶的這些特征偏好,在進(jìn)行個(gè)性化推薦時(shí)就可以基于不同的業(yè)務(wù)場(chǎng)景需求來(lái)獲取用戶不同的策略來(lái)進(jìn)行推薦,從而達(dá)到推薦的結(jié)果
2. 新用戶
新用戶的定義:指那些第一次安裝App后使用的用戶或者那些安裝卻在指定的時(shí)間段(一般是2年,不同的公司定義不一樣)從來(lái)未打開(kāi)過(guò)App的用戶。建立這類用戶的特征集有兩種方法:利用外部數(shù)據(jù);利用相似人群。
利用外部數(shù)據(jù)
公司為了拉新客或老客再營(yíng)銷,會(huì)進(jìn)行站外的廣告投放,目前計(jì)算廣告的數(shù)據(jù)源包括下面三塊:
- 第一方數(shù)據(jù):為服務(wù)消費(fèi)者(廣告主,媒體方)自由數(shù)據(jù)
- 第二方數(shù)據(jù):營(yíng)銷服務(wù)提供者所擁有的數(shù)據(jù),如當(dāng)百度作為服務(wù)提供者時(shí),百度自己擁有的搜索數(shù)據(jù)。
- 第三方數(shù)據(jù):為非直接合作的雙方(例如:其他數(shù)據(jù)服務(wù)商)所擁有的數(shù)據(jù)
通過(guò)和站外的合作可以獲取合作伙伴獲取的用戶特征集,結(jié)合這些特征集可以用來(lái)為新用戶做合適的推薦。
相似人群
通過(guò)對(duì)已有用戶特征的用戶群按照地域,性別,年齡段等多維度來(lái)對(duì)人群進(jìn)行分類,然后通過(guò)算法模型分析出不同類型人群的共同特征,得到千人千面的用戶特征。當(dāng)一個(gè)新用戶訪問(wèn)App的時(shí)候,結(jié)合已知的用戶特征(如當(dāng)前位置,注冊(cè)提供的信息等),通過(guò)算法模型找到匹配的人群,然后通過(guò)該人群的同樣特征作為該新用戶的用戶特征。
綜述
個(gè)性化推薦系統(tǒng)要建立用戶和產(chǎn)品的特征,那么越全面的了解一個(gè)用戶就越可以準(zhǔn)確的預(yù)測(cè)出用戶喜愛(ài)的物品。而更全面的了解一個(gè)用戶依賴于可用的數(shù)據(jù)和算法模型的準(zhǔn)確性,兩篇文章給出了如何獲取數(shù)據(jù),獲取怎樣的數(shù)據(jù),以及利用這些數(shù)據(jù)來(lái)建立用戶畫(huà)像的產(chǎn)品思路,希望能過(guò)給到大家以一點(diǎn)啟發(fā)。
相關(guān)閱讀
OTA推薦系統(tǒng)之實(shí)時(shí)用戶意圖
本文由 @中子奇 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自PEXELS,基于CC0協(xié)議
- 目前還沒(méi)評(píng)論,等你發(fā)揮!