OTA推薦系統(tǒng)之實(shí)時(shí)用戶(hù)意圖
實(shí)時(shí)用戶(hù)意圖是個(gè)性化推薦系統(tǒng)中的一個(gè)重要組成部分,本文通過(guò)WHAT,WHY,HOW三個(gè)方面討論了實(shí)時(shí)用戶(hù)意圖,希望給大家以啟示。
之前的一篇文章《常見(jiàn)推薦策略及其在OTA上的應(yīng)用》給出了常見(jiàn)的推薦系統(tǒng)的一些常見(jiàn)推薦策略,以及OTA公司如何利用這些策略來(lái)進(jìn)行產(chǎn)品推薦。
而為了提高推薦的準(zhǔn)確率,需要了解用戶(hù),尤其是在OTA行業(yè),獲取實(shí)時(shí)用戶(hù)意圖對(duì)個(gè)性化推薦起著非常重要的作用,在做產(chǎn)品分析和設(shè)計(jì)的時(shí)候應(yīng)該按照黃金圈(WHY,HOW,WHAT)的順序來(lái)進(jìn)行,但是為了讀者理解的方便,本文改變了一下順序,首先給出WHAT,然后從WHY和HOW二個(gè)方面分享一下構(gòu)建OTA實(shí)時(shí)用戶(hù)意圖的思路。
WHAT(是什么)?
不同公司的定義可能不一樣,這里首先解釋一下什么是實(shí)時(shí)用戶(hù)意圖。本文實(shí)時(shí)用戶(hù)意圖是基于旅游行業(yè),它的定義為:結(jié)合用戶(hù)短期內(nèi)的用戶(hù)行為,通過(guò)個(gè)性化推薦算法預(yù)測(cè)得到的用戶(hù)實(shí)時(shí)旅游偏好。下面給出兩個(gè)實(shí)時(shí)用戶(hù)意圖的例子:
示例1:一個(gè)用戶(hù)搜索了12月1日從上海到北京的機(jī)票,并且查看了多次航班,那么該用戶(hù)的實(shí)時(shí)意圖包含:該用戶(hù)處于行程探索期,對(duì)北京有興趣,并且交通工具偏好坐飛機(jī),艙位偏好經(jīng)濟(jì)艙,預(yù)計(jì)出行時(shí)間是12月1日。同時(shí)通過(guò)瀏覽交叉規(guī)則,可以預(yù)測(cè)用戶(hù)可以有酒店偏好,自由行偏好,門(mén)票玩樂(lè)等多種產(chǎn)品類(lèi)型偏好,依據(jù)大數(shù)據(jù)的分析,可以得到用戶(hù)對(duì)不同產(chǎn)品類(lèi)型的偏好程度會(huì)不一樣。
示例2:一個(gè)用戶(hù)訂了一張12月1日從上海到北京的機(jī)票,那么該用戶(hù)的實(shí)時(shí)意圖包含:該用戶(hù)處于行程出發(fā)前,將要去北京,有去北京的機(jī)票訂單,艙位是經(jīng)濟(jì)艙,出行時(shí)間是12月1日。同時(shí)通過(guò)訂單交叉規(guī)則,可以預(yù)測(cè)用戶(hù)可以有酒店偏好,門(mén)票玩樂(lè)等多種產(chǎn)品類(lèi)型偏好,依據(jù)大數(shù)據(jù)的分析,可以得到用戶(hù)對(duì)不同產(chǎn)品類(lèi)型的偏好程度會(huì)不一樣。
通過(guò)以上兩個(gè)例子可以了解實(shí)時(shí)用戶(hù)意圖里面包含什么內(nèi)容,格式如下圖所示,在具體的個(gè)性化推薦應(yīng)用中,在不同的欄位就可以知道進(jìn)行怎樣的推薦了,可以參考《常見(jiàn)推薦策略及其在OTA上的應(yīng)用》里面的案例。
WHY(為什么)?
了解了什么是實(shí)時(shí)用戶(hù)意圖,從產(chǎn)品的目標(biāo)和用戶(hù)的需求兩個(gè)方面分析一下為什么要做實(shí)時(shí)用戶(hù)意圖。
產(chǎn)品的目標(biāo)
引入個(gè)性化推薦的目標(biāo)是為了提高OTA平臺(tái)上的產(chǎn)品轉(zhuǎn)化率以及產(chǎn)品的連帶率,因?yàn)檗D(zhuǎn)化率及連帶率的提升企業(yè)可以獲得更多的商業(yè)價(jià)值
用戶(hù)的需求
用戶(hù)的主要需求在于可以通過(guò)OTA平臺(tái)快速,方便地找到自己想要的產(chǎn)品,主要體現(xiàn)在:購(gòu)物路徑不用太長(zhǎng);有輔助決策內(nèi)容來(lái)降低決策的費(fèi)力度;有交叉推薦的內(nèi)容等等
一言概之:用戶(hù)通過(guò)平臺(tái)找到適合自己的產(chǎn)品來(lái)得到產(chǎn)品的使用價(jià)值,而平臺(tái)通過(guò)用戶(hù)購(gòu)買(mǎi)產(chǎn)品獲得傭金而得到產(chǎn)品的商業(yè)價(jià)值。
HOW(怎么做)?
實(shí)時(shí)用戶(hù)意圖是怎么做到可以滿(mǎn)足用戶(hù)需求的呢?它基于的假設(shè)是:用戶(hù)對(duì)自己感興趣的內(nèi)容會(huì)多次瀏覽或搜索,舉例來(lái)說(shuō),在OTA行業(yè),如果一個(gè)用戶(hù)相去馬爾代夫度假,那么他會(huì)查看馬爾代夫的攻略,機(jī)票,酒店或者度假產(chǎn)品等等,通過(guò)用戶(hù)的實(shí)時(shí)行為操作,我們可以預(yù)測(cè)用戶(hù)的目的地偏好是馬爾代夫。
實(shí)時(shí)用戶(hù)意圖是依賴(lài)于用戶(hù)的近實(shí)時(shí)用戶(hù)行為,生成實(shí)時(shí)用戶(hù)意圖的流程如下:
以上流程又可以分成幾大塊內(nèi)容:
數(shù)據(jù)獲取
通過(guò)前端埋點(diǎn)獲取用戶(hù)的實(shí)時(shí)行為數(shù)據(jù),這些埋點(diǎn)數(shù)據(jù)被送到流處理(如Storm或Spark等)進(jìn)行埋點(diǎn)內(nèi)容的解析,并且做實(shí)時(shí)數(shù)據(jù)清洗,輸出標(biāo)準(zhǔn)格式的用戶(hù)行為數(shù)據(jù)。數(shù)據(jù)來(lái)源主要包括:
- 用戶(hù)的搜索及搜索條件
- 用戶(hù)的瀏覽產(chǎn)品及瀏覽產(chǎn)品的特征
- 用戶(hù)的搜藏產(chǎn)品及搜藏產(chǎn)品的特征
算法模型
算法模型分成兩個(gè)部分:離線(xiàn)算法模型和實(shí)時(shí)算法模型。離線(xiàn)算法對(duì)時(shí)效性要求不高,所以算法模型一方面可以采用更多的數(shù)據(jù)內(nèi)容,不管是從數(shù)據(jù)的廣度還是深度,另一方面算法模型的復(fù)雜度也可以很高,這樣可以輸出高質(zhì)量的數(shù)據(jù)結(jié)構(gòu);實(shí)時(shí)算法模型因?yàn)闀r(shí)效性要求很高,所以在使用數(shù)據(jù)方面和算法模型方面都會(huì)比離線(xiàn)算法模型差很多。
離線(xiàn)算法模型以日為單位對(duì)全站的用戶(hù)行為進(jìn)行迭代計(jì)算,得到瀏覽交叉系數(shù)及訂單交叉系數(shù)(其實(shí)離線(xiàn)算法模型還提供了其它方面的內(nèi)容,在后下一篇《OTA推薦系統(tǒng)之用戶(hù)體系》中介紹)。實(shí)時(shí)算法模型實(shí)時(shí)對(duì)用戶(hù)的每一次操作進(jìn)行迭代算法計(jì)算,結(jié)合離線(xiàn)提供交叉系數(shù),實(shí)時(shí)更新用戶(hù)意圖,以便提供給推薦系統(tǒng)使用(一般采用Redis存儲(chǔ))。
實(shí)時(shí)用戶(hù)意圖是個(gè)性化推薦系統(tǒng)中的一個(gè)重要組成部分,本文通過(guò)WHAT,WHY,HOW三個(gè)方面討論了實(shí)時(shí)用戶(hù)意圖,希望給大家以啟示。
相關(guān)閱讀
本文由 @中子奇 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自PEXELS,基于CC0協(xié)議
- 目前還沒(méi)評(píng)論,等你發(fā)揮!