從0-1搭建用戶畫像系統(tǒng)的設(shè)計(jì)思路
編輯導(dǎo)語:如今在這個(gè)大數(shù)據(jù)時(shí)代,我們經(jīng)常會(huì)被“標(biāo)簽化”,最常見的就是你逛淘寶時(shí),會(huì)根據(jù)你的興趣愛好等等特征進(jìn)行推薦;本文是作者分享的關(guān)于從0到1搭建用戶畫像系統(tǒng)的設(shè)計(jì)思路,我們一起來學(xué)習(xí)一下。
一、需求目的
1)商城已上線2周年,已有10萬+在售物品;數(shù)據(jù)倉庫中積累著大量的業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù)及埋點(diǎn)數(shù)據(jù);如何充分挖掘沉淀在數(shù)據(jù)倉庫中的數(shù)據(jù)的價(jià)值,有效的支持用戶畫像的建設(shè),成為當(dāng)前的重要工作。
2)在保證用戶規(guī)模不斷增長的目標(biāo)下,運(yùn)營方考慮建立用戶流失預(yù)警機(jī)制,及時(shí)識(shí)別將要流失的用戶群體,及時(shí)采取運(yùn)營策略換回用戶。
二、產(chǎn)品結(jié)構(gòu)
三、用戶畫像系統(tǒng)搭建流程
目前團(tuán)隊(duì)已經(jīng)搭建了比較成熟的數(shù)據(jù)倉庫。也就是說已經(jīng)有結(jié)構(gòu)化的、清晰的用戶屬性、用戶行為相關(guān)數(shù)據(jù)。
在此基礎(chǔ)上,搭建用戶畫像系統(tǒng),需要:
四、數(shù)據(jù)建模
對(duì)人、貨、場進(jìn)行分析,對(duì)用戶個(gè)體的性質(zhì)和特征做出概括,形成相應(yīng)的用戶屬性標(biāo)簽、用戶行為標(biāo)簽后。才可以開始建模。
建模需要分別從定性、定量,兩個(gè)方面入手:
- 定性:在從已有數(shù)據(jù)中心,選擇特征;假設(shè)這些特征與你要預(yù)測的值有一個(gè)關(guān)系,這個(gè)關(guān)系就是一個(gè)原始的模型。
- 定量:確定模型中涉及到的所有未知系數(shù)。
模型計(jì)算完成后,需要計(jì)算模型的置信度;此時(shí)根據(jù)測試數(shù)據(jù)(可以是團(tuán)隊(duì)內(nèi)部測試、灰度測試等方式),來判斷模型計(jì)算的結(jié)果,與預(yù)期是否相符。
如果相符,就可以用這個(gè)模型來預(yù)測用戶喜歡什么;如果與預(yù)期不相符,那么久需要重復(fù)上述過程。
比如商城系統(tǒng)中,有以下數(shù)據(jù)項(xiàng):
用戶忠誠度指標(biāo)(L),與用戶活躍度、購物車商品數(shù)、收藏?cái)?shù)、下單數(shù)、在線時(shí)長的用戶行為指標(biāo)有一定的關(guān)系;將這5項(xiàng)數(shù)據(jù)指標(biāo)的熵權(quán)值,定義為用戶忠誠度指標(biāo),可以用以下公式表示:
其中a表示上表中A2-A6的歸一化值,歸一化計(jì)算公式如下:
w表示權(quán)重。權(quán)重系數(shù)計(jì)算公式如下:
其中,e為行為數(shù)據(jù)信息熵,計(jì)算公式如下:
最終計(jì)算所有的用戶的指標(biāo)L后,例如可以取前25%為高忠誠用戶,25-50%為普通忠誠用戶,剩余為低忠誠用戶,取值范圍可以根據(jù)業(yè)務(wù)實(shí)際情況調(diào)整。
另外,由于權(quán)重系數(shù),有可能隨時(shí)間的增加而衰減;所以如果需要,還需要定義衰減因子r;加入衰減因子后,標(biāo)簽權(quán)重=衰減因子*行為權(quán)重。
五、梳理用戶畫像維度
設(shè)計(jì)用戶畫像維度時(shí),建議使用MECE(Mutually Exclusive Collectively Exhaustive)準(zhǔn)則;也就是對(duì)于一個(gè)重大的議題,能夠做到不重疊、不遺漏的分類,而且能夠借此有效把握問題的核心,并成為有效解決問題的方法。
比如初步搭建用戶畫像維度,可以參考下圖:
上圖為商城系統(tǒng),初步的用戶畫像維度。圖中的數(shù)據(jù),按照獲取的方式,可以分為:統(tǒng)計(jì)類標(biāo)簽、規(guī)則類標(biāo)簽、挖掘類標(biāo)簽。
統(tǒng)計(jì)類標(biāo)簽:這類標(biāo)簽是最為基礎(chǔ)也最為常見的標(biāo)簽類型,例如對(duì)于某個(gè)用戶來說,他的性別、年齡、城市、星座、近7日活躍時(shí)長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)、用戶訪問、消費(fèi)類數(shù)據(jù)中統(tǒng)計(jì)得出;該類標(biāo)簽構(gòu)成了用戶畫像的基礎(chǔ)。
規(guī)則類標(biāo)簽:該類標(biāo)簽基于用戶行為及確定的規(guī)則產(chǎn)生;例如對(duì)平臺(tái)上“消費(fèi)活躍”用戶這一口徑的定義為近30天交易次數(shù)>=2,在實(shí)際開發(fā)畫像的過程中,由于運(yùn)營人員對(duì)業(yè)務(wù)更為熟悉、而數(shù)據(jù)人員對(duì)數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉;因此規(guī)則類標(biāo)簽的規(guī)則確定由運(yùn)營人員和數(shù)據(jù)人員共同協(xié)商確定。
挖掘類標(biāo)簽:該類標(biāo)簽通過數(shù)據(jù)挖掘產(chǎn)生,應(yīng)用在對(duì)用戶的某些屬性或某些行為進(jìn)行預(yù)測判斷;例如根據(jù)一個(gè)用戶的行為習(xí)慣判斷該用戶是男性還是女性,根據(jù)一個(gè)用戶的消費(fèi)習(xí)慣判斷其對(duì)某商品的偏好程度;該類標(biāo)簽需要通過算法挖掘產(chǎn)生。
六、形成初步用戶畫像
基于用戶畫像數(shù)據(jù),可以使運(yùn)營人員、營銷人員,有更好的用戶認(rèn)識(shí),帶來更佳的用戶服務(wù)質(zhì)量,實(shí)現(xiàn)精準(zhǔn)運(yùn)營、精準(zhǔn)營銷。
設(shè)計(jì)用戶畫像的可視化展現(xiàn)時(shí),可以使用以下工具:
其中tableau、powerbi等自助式數(shù)據(jù)分析工具,可以讓沒有編程經(jīng)驗(yàn)的業(yè)務(wù)人員、運(yùn)營人員等進(jìn)行自我數(shù)據(jù)分析,不需要依賴IT人員。
七、評(píng)估用戶畫像效果
在初步形成了用戶畫像后,并不能直接交給運(yùn)營、業(yè)務(wù)人員實(shí)際使用,還需要評(píng)估用戶畫像的準(zhǔn)確性。
評(píng)估方式主要分為3種:邏輯驗(yàn)證、A/B test、用戶回訪。
邏輯驗(yàn)證:也叫做交叉驗(yàn)證;在完整的用戶畫像標(biāo)簽體系中,一些標(biāo)簽往往會(huì)存在一些相關(guān)性;比如用戶的累計(jì)在線時(shí)長越長,訂單量通常會(huì)越高;比如購買3C產(chǎn)品的用戶群中,男性用戶數(shù)通常大于女性用戶數(shù);另外,如果公司購買了第三方機(jī)構(gòu)的數(shù)據(jù),也可用于交叉驗(yàn)證。
A/B test:也叫做灰度測試;以上述的忠誠度為例,保證對(duì)照組、實(shí)驗(yàn)組的流量相同;對(duì)實(shí)驗(yàn)組的用戶,進(jìn)行提升忠誠度的運(yùn)營策略(促銷活動(dòng)、積分獎(jiǎng)勵(lì)等);如果實(shí)驗(yàn)組的用戶,忠誠度相比對(duì)照組用戶,有一定提升,則可以認(rèn)為用戶畫像比較精確。
用戶回訪:最樸實(shí)的評(píng)估方法,比如用戶畫像系統(tǒng),定義了10萬用戶為低忠誠度用戶;此時(shí)從中隨機(jī)抽取1000人,交給客服,進(jìn)行回訪。根據(jù)回訪結(jié)果,判斷用戶畫像結(jié)果是否準(zhǔn)確;甚至可以對(duì)回訪結(jié)果進(jìn)行文本挖掘,形成詞云,查看消極詞的占比。
八、總結(jié)
當(dāng)公司業(yè)務(wù)規(guī)模,用戶體量上升到一定量級(jí);業(yè)務(wù)、運(yùn)營團(tuán)隊(duì),往往會(huì)提出對(duì)用戶精準(zhǔn)運(yùn)營的想法;此時(shí)就需要用戶畫像系統(tǒng),在支持業(yè)務(wù)運(yùn)營的同時(shí),也可以幫助產(chǎn)品經(jīng)理更好的了解用戶。
0-1搭建用戶畫像系統(tǒng),需要在已有比較成熟的數(shù)據(jù)倉庫的前提下進(jìn)行:
- 數(shù)據(jù)建模:根據(jù)業(yè)務(wù)模式,設(shè)計(jì)相應(yīng)的數(shù)據(jù)模型
- 梳理用戶畫像維度:不重疊、不遺漏的梳理用戶標(biāo)簽體系
- 形成初步用戶畫像:可以使用tableau、powerBI、echarts等多種工具,生成可視化的用戶畫像
- 評(píng)估用戶畫像效果;通過邏輯驗(yàn)證、A/B測試、用戶回訪等方式,驗(yàn)證用戶畫像系統(tǒng)中的標(biāo)簽是否準(zhǔn)確
- 根據(jù)評(píng)估效果,持續(xù)優(yōu)化用戶標(biāo)簽系統(tǒng)
本文由 @16哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 unsplash,基于 CC0 協(xié)議
贊~