個(gè)性化場(chǎng)景推薦并不神秘,帶你讀懂推薦計(jì)算模型
許多產(chǎn)品里都設(shè)置了推薦模型系統(tǒng),比如結(jié)合推薦模型,購(gòu)物平臺(tái)可能會(huì)更知道用戶更想要什么,從而讓相關(guān)產(chǎn)品出現(xiàn)在用戶瀏覽首頁(yè)。那么,推薦模型是如何“起效”和“運(yùn)轉(zhuǎn)”的?個(gè)性化推薦,又有哪些存在意義?本篇文章里,作者便發(fā)表了他的看法,一起來(lái)看。
一款應(yīng)用軟件或系統(tǒng)設(shè)計(jì),為了更好地迎合市場(chǎng)用戶,一定逃離不了對(duì)用戶的推薦模型,而推薦的目的是為了更好地解決用戶痛點(diǎn),觸達(dá)用戶目標(biāo),從而達(dá)到用戶的留存,提高用戶與產(chǎn)品之間的粘度,比如在日常購(gòu)物場(chǎng)景中,打開(kāi)同一款購(gòu)物應(yīng)用可能會(huì)遇到若干種情形:
- 和好友同時(shí)打開(kāi)app后發(fā)現(xiàn),為什么兩個(gè)人首頁(yè)各個(gè)頻道入口的圖片以及文字不一致?
- 為什么同樣搜索相同關(guān)鍵詞,你和好友竟然出現(xiàn)不一樣的商品列表?
- 為什么我剛剛瀏覽了褲子以后,首頁(yè)各個(gè)頻道的展現(xiàn)變了?
一、購(gòu)物平臺(tái)是如何知道我需要什么?
- 是如何知道我喜歡什么并且可能想要買(mǎi)什么的?
- 為什么它能做到每個(gè)人都不一樣?
- 為什么它要這么做?
從這里會(huì)產(chǎn)生一個(gè)機(jī)器人模型學(xué)習(xí)概念,機(jī)器學(xué)習(xí)就是將主體換為機(jī)器,并且它通過(guò)某種途徑來(lái)獲取知識(shí)或者技能的過(guò)程,并應(yīng)用于未來(lái)的生活工作,人獲取知識(shí)的外化載體是書(shū)本、音頻、視頻等,傳輸通道是人的感官,處理中心是大腦,而對(duì)應(yīng)于機(jī)器外化載體也同樣可以有以上各類信息源,并且使用各類外放設(shè)備收集信息,處理中心是CPU與存儲(chǔ)共同維護(hù)。
一個(gè)是演繹法,一個(gè)是歸納法,這兩種方法分別對(duì)應(yīng)人工智能中的兩種系統(tǒng):專家系統(tǒng)和機(jī)器學(xué)習(xí)系統(tǒng)。
所謂演繹法,是從已知的規(guī)則和事實(shí)出發(fā),推導(dǎo)新的規(guī)則、新的事實(shí),這對(duì)應(yīng)于專家系統(tǒng)。
專家系統(tǒng)也是早期的人工智能系統(tǒng),它也稱為規(guī)則系統(tǒng),找一組某個(gè)領(lǐng)域的專家,如醫(yī)學(xué)領(lǐng)域的專家,他們會(huì)將自己的知識(shí)或經(jīng)驗(yàn)總結(jié)成某一條條規(guī)則、事實(shí),例如某個(gè)人體溫超過(guò)37度、流鼻涕、流眼淚,那么他就是感冒,這是一條規(guī)則。
當(dāng)這些專家將自己的知識(shí)、經(jīng)驗(yàn)輸入到系統(tǒng)中,這個(gè)系統(tǒng)便開(kāi)始運(yùn)行,每遇到一些新情況,會(huì)將之變?yōu)橐粭l條事實(shí)。當(dāng)將事實(shí)輸入到專家系統(tǒng)時(shí),專家會(huì)根據(jù)規(guī)則或事實(shí)進(jìn)行推導(dǎo)、梳理,并得到最終結(jié)論,這便是專家系統(tǒng)。
而歸納法是從現(xiàn)有樣本數(shù)據(jù)中不斷地觀察、歸納、總結(jié)出規(guī)律和事實(shí),對(duì)應(yīng)機(jī)器學(xué)習(xí)系統(tǒng)或統(tǒng)計(jì)學(xué)習(xí)系統(tǒng),側(cè)重于統(tǒng)計(jì)學(xué)習(xí),從大量的樣本中統(tǒng)計(jì)、挖掘、發(fā)現(xiàn)潛在的規(guī)律和事實(shí)。
二、機(jī)器學(xué)習(xí)過(guò)程數(shù)據(jù)維度
可以大致推算出購(gòu)物app為什么能夠知道你喜歡什么,是基于一個(gè)假設(shè)條件的:一個(gè)人歷史的購(gòu)物行為及偏好,會(huì)在未來(lái)的行為中也有跡可循。
所以利用機(jī)器學(xué)習(xí)我們通過(guò)用戶歷史交互數(shù)據(jù)(特征包括:誰(shuí)在什么時(shí)間買(mǎi)了什么東西,這個(gè)東西的名字叫什么,什么顏色,價(jià)格多少等等)。 比較有用的可以對(duì)未來(lái)推薦有指導(dǎo)意義的特征包括:
1)購(gòu)買(mǎi)力
一個(gè)平時(shí)只買(mǎi)100元左右牛仔褲的用戶,未來(lái)短期內(nèi)買(mǎi)10000元和10元的褲子的概率遠(yuǎn)遠(yuǎn)低于買(mǎi)100左右或者200左右的概率,所以推薦的時(shí)候會(huì)更優(yōu)先給你看到100-200左右的褲子。
2)性別
平時(shí)在淘寶上只買(mǎi)男性或男女通用商品的用戶,未來(lái)短期內(nèi)買(mǎi)女性商品概率遠(yuǎn)遠(yuǎn)低于男性和男女通用商品的概率。
3)年齡
一個(gè)一直購(gòu)買(mǎi)20-25歲左右服飾的用戶,未來(lái)短期內(nèi)購(gòu)買(mǎi)其它年齡段的概率遠(yuǎn)遠(yuǎn)小于20-25歲年齡段的概率。
三、為什么能夠做到每個(gè)人不一樣?
根據(jù)學(xué)習(xí)邏輯歸類,如果在機(jī)器學(xué)習(xí)階段考慮一些跟人相關(guān)的因素(特征),那這個(gè)因素的不同值就會(huì)影響結(jié)果輸出。
比如我們現(xiàn)在根據(jù)用戶對(duì)他購(gòu)物的商品的評(píng)分?jǐn)?shù)據(jù),來(lái)預(yù)測(cè)一個(gè)他從未買(mǎi)過(guò)的商品的評(píng)分,背后影響用戶評(píng)分的因素可能包括以下幾個(gè):價(jià)格,售前/后,物流,商家主營(yíng)類目是否和用戶購(gòu)買(mǎi)的類目相同,其它用戶的評(píng)分(如果其他用戶評(píng)分高則一定程度上代表了這個(gè)商品的好壞)等等。
比如物流和價(jià)格這類因素(特征),如果和用戶這個(gè)特征做交叉后,其實(shí)會(huì)有非常迥異的權(quán)重值,而這一切是每個(gè)用戶的購(gòu)買(mǎi)力和用戶體驗(yàn)?zāi)褪芰Φ炔煌瑤?lái)的。所以如果你考慮了用戶的特征則這就會(huì)影響每個(gè)人的推薦結(jié)果不一樣。
四、個(gè)性化推薦的核心使命
可以打破80%的用戶只買(mǎi)20%的商品的規(guī)律,更好地降低長(zhǎng)尾商品的比例,因?yàn)樵陔娚坍a(chǎn)品中,在非個(gè)性化的商品展示過(guò)程中,往往爆款商品擁有更多的流量,這樣其實(shí)不能很好的照顧到高質(zhì)量長(zhǎng)尾用戶和高質(zhì)量長(zhǎng)尾商品。
舉個(gè)例子,在淘寶的某個(gè)頻道,有很多褲子,A褲子100元近5天的銷量可能1w件,B褲子1000元近5天的銷量是100件,在不考慮其它因素的情況下,非個(gè)性化模型(或運(yùn)營(yíng)排序)一般會(huì)偏向于A褲子在B褲子前面,但是如果這個(gè)用戶在平臺(tái)歷史購(gòu)物行為都是集中在高價(jià)格商品(名牌包包等),則如果你個(gè)性化的考慮每個(gè)人的這個(gè)偏好,那么有可能B褲子就在前面了,而且用戶可能真的更喜歡B褲子。
1. 流量均衡曝光
在APP或網(wǎng)站有限的商品曝光機(jī)會(huì)下,為每個(gè)展現(xiàn)的商品爭(zhēng)取最大的點(diǎn)擊/成交等,因?yàn)橛脩粼谄脚_(tái)上的時(shí)間是有限的,如果能在海量的商品中,為用戶找到他感興趣的商品,那么平臺(tái)將在這有限的流量資源下收獲更大的價(jià)值。
舉個(gè)例子,有可能用戶在某個(gè)頻道下,看了A,然后看了B,再看了C,最終買(mǎi)了D,并且ABCD這四個(gè)商品都是有一定關(guān)系的商品,那么平臺(tái)能否在一開(kāi)始在我看完A以后就幫我找到C,并在A下面推薦D商品。在最大限度挖掘用戶購(gòu)物需求的情況下,最大限度縮短用戶購(gòu)物的時(shí)間。
2. 提升極速流暢的購(gòu)物體驗(yàn)
可以給用戶創(chuàng)造極致的用戶體驗(yàn),極致的用戶體驗(yàn)是用戶信任依賴平臺(tái),在每次購(gòu)物過(guò)程中,希望平臺(tái)能夠幫助其快速,準(zhǔn)確地找到其想要的商品,其中包括了基于用戶歷史興趣的再延伸,也有基于用戶角色的行為探索。
比如用戶每隔25-30天會(huì)購(gòu)買(mǎi)尿不濕,未來(lái)平臺(tái)是否能夠在23-33之間快速捕捉用戶購(gòu)買(mǎi)尿不濕的需求;再比如用戶在平臺(tái)上第一次瀏覽電腦,我基于用戶的其它購(gòu)物行為(比如用戶之前在平臺(tái)上經(jīng)常買(mǎi)20-25歲的衣服,并且大部分郵寄的地址為大學(xué)宿舍),是否平臺(tái)可以在接下來(lái)的瀏覽中為用戶呈現(xiàn)適合學(xué)生族高性價(jià)的電腦。
穩(wěn)定的流量與穩(wěn)定的交互、比例可以保證數(shù)據(jù)的稠密性,單用戶和單商品有足夠的數(shù)據(jù)可以完成機(jī)器學(xué)習(xí),并且保證一定的置信度;當(dāng)有新用戶(新商品)加入系統(tǒng)時(shí),由于系統(tǒng)中缺乏用戶(商品)歷史反饋信息,所以完全無(wú)法推斷用戶的偏好,也就無(wú)法做出預(yù)測(cè),信息匹配量級(jí)差異過(guò)大。
在人機(jī)交互過(guò)程中不斷拓展用戶行為模型,補(bǔ)充足夠的產(chǎn)品信息庫(kù),根據(jù)不同人群瀏覽行為進(jìn)行精準(zhǔn)推薦與展示,實(shí)現(xiàn)把不同價(jià)格產(chǎn)品根據(jù)不同的流量池分布給需要的用戶,這個(gè)過(guò)程可以稱為從廣泛匹配到精準(zhǔn)匹配,使購(gòu)物的推薦運(yùn)算模型得到個(gè)性化的具象呈現(xiàn)。
也俗稱千人千面的搜索個(gè)性化,千人千面并不神秘,只不過(guò)是統(tǒng)計(jì)學(xué)的應(yīng)用,
簡(jiǎn)單的來(lái)說(shuō),展現(xiàn)在用戶面前的是產(chǎn)品合集,從用戶到產(chǎn)品展示合集分四步曲。
第一步:用戶進(jìn)入產(chǎn)品應(yīng)用,產(chǎn)品立即識(shí)別用戶的標(biāo)簽,這些標(biāo)簽叫做抽樣條件。
第二步:根據(jù)該用戶標(biāo)簽找到相似人群,這叫做根據(jù)條件抽樣。
第三步:根據(jù)相似人群找到他們共同喜歡的產(chǎn)品,叫做對(duì)比樣品共性。
第四步:在系統(tǒng)所有同類型的產(chǎn)品中,找到與樣品庫(kù)相似的產(chǎn)品,形成產(chǎn)品合集,這些產(chǎn)品合集會(huì)展示在該用戶的面前,相似度越高,權(quán)重越高,排名越靠前。
專欄作家
小鑷子,人人都是產(chǎn)品經(jīng)理專欄作家。養(yǎng)成挖掘性的思考習(xí)慣、綜合、市場(chǎng)、運(yùn)營(yíng)、技術(shù)、設(shè)計(jì)、數(shù)據(jù)、擅長(zhǎng)跨境電商,綜合電商與商業(yè)模型。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!