用戶畫像系統(tǒng)搭建思路
“本篇文章主要講解精細(xì)化運(yùn)營中不可或缺的核心功能——用戶畫像系統(tǒng),并將介紹如何從 0 到 1 的進(jìn)行系統(tǒng)的搭建,思路和功能點(diǎn)的設(shè)計(jì)?!?/p>
一、數(shù)據(jù)分析的本質(zhì)是什么
首先,我們需要自己明確一個(gè)問題的答案,就是數(shù)據(jù)分析的本質(zhì)是什么?數(shù)據(jù)分析的本質(zhì)是獲得信息和知識(shí),從而在判斷和決策中使用。我們設(shè)計(jì)林林總總的分析模型、可視化方案,實(shí)際上都是為了得到一個(gè)最好的方法進(jìn)行信息的展示。
當(dāng)我們通過數(shù)據(jù)分析,得到了信息和知識(shí)后,最后都是需要落地的,這個(gè)落地的操作可能是我們改進(jìn)了自己的產(chǎn)品,也可能是我們在運(yùn)營中優(yōu)化了策略……
從目標(biāo)上劃分,數(shù)據(jù)分析又可以分為三類:描述式分析、預(yù)測式分析和決策式分析。
- 描述式分析:將數(shù)據(jù)信息進(jìn)行整合,選擇一個(gè)最優(yōu)的可視化方案,進(jìn)行事實(shí)的陳述;
- 預(yù)測式分析:通過已有的沉淀數(shù)據(jù),進(jìn)行后續(xù)的預(yù)測,預(yù)測式分析是有探索性,他的目標(biāo)是輔助我們的判斷;
- 決策式分析:通過對(duì)比、實(shí)驗(yàn)等手段,直接反應(yīng)情況,給出明確的好壞,從而直接進(jìn)行決策。
所以說,一個(gè)分析系統(tǒng),至少要包含描述式分析的能力,這樣信息的獲取是不成問題。再進(jìn)階就是增加預(yù)測式和決策式的分析能力,讓分析師可以更高效、更準(zhǔn)確的解決問題。
二、什么是畫像系統(tǒng)
什么是畫像系統(tǒng)?畫像系統(tǒng)是一個(gè)以用戶為分析對(duì)象,通過各種方法將用戶信息進(jìn)行展示,提供給分析人員全面、準(zhǔn)確并具有指導(dǎo)意義的信息,從而優(yōu)化運(yùn)營的策略。
畫像系統(tǒng)最為核心的三個(gè)能力,分別是:信息的加工生產(chǎn)能力、信息的分析展示能力和信息的傳遞能力。我們將其比作一次烹飪流程:信息加工生產(chǎn)就是我們的原材料,他決定了我們可以做哪些菜;信息的分析展示就是我們做出來的菜,技巧、順序都會(huì)影響我們的菜品口感;信息的傳遞是我們最后裝菜的容器,如果沒有盤子,菜品也就無法被品嘗。
畫像系統(tǒng)可以做什么?掌握用戶特征,更好的進(jìn)行用戶群選定,提升運(yùn)營效果。
三、如何搭建畫像系統(tǒng)
抓住畫像系統(tǒng)最核心的三個(gè)能力,我們的搭建思路也圍繞這三點(diǎn)進(jìn)行展開。分別是:內(nèi)容生產(chǎn)、畫像分析和對(duì)外輸出。
數(shù)據(jù)的采集、加工和生產(chǎn):
數(shù)據(jù)的采集可以參考市面上主流的大數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)的采集和治理即可。通過埋點(diǎn)的方式,我們需要將用戶在產(chǎn)品中的行為進(jìn)行記錄上報(bào)。盡可能準(zhǔn)確、全面的采集核心鏈路的數(shù)據(jù)。
數(shù)據(jù)的的加工和生產(chǎn),實(shí)際上就是我們標(biāo)簽體系的搭建。文章后半段會(huì)單獨(dú)講述如何搭建一個(gè)標(biāo)簽體系。
在實(shí)際的操作中,還需再額外考慮幾個(gè)點(diǎn):
歷史的記錄:因?yàn)槲覀冊跒橛脩舢嬒褡鰯?shù)據(jù)儲(chǔ)備,所以在預(yù)想范圍內(nèi)是無法避免對(duì)一個(gè)用戶的歷史狀態(tài)進(jìn)行分析的。我們需要在每次標(biāo)簽的加工時(shí),考慮到歷史數(shù)據(jù)的備份存儲(chǔ)。
靈活的更新:同時(shí)數(shù)據(jù)的更新機(jī)制,可以提供不僅僅只有調(diào)度器調(diào)度一種,還可以使用觸發(fā)型的數(shù)據(jù)更新,用以滿足更多的業(yè)務(wù)場景。
豐富的配置:如果系統(tǒng)的面向?qū)ο笫俏覀兊臉I(yè)務(wù)人員,那么隨著產(chǎn)品的發(fā)展,標(biāo)簽的規(guī)則修改在所難免。那么如果能做到快速響應(yīng),順應(yīng)業(yè)務(wù)的變化,就是需要考慮的一個(gè)問題。
多視角的分析模型:
分析模型是畫像系統(tǒng)中的精髓所在。從分析的體量劃分,分為群體和單體;從分析的狀態(tài)劃分,分為靜態(tài)和動(dòng)態(tài);從分析的路徑劃分,分為探索分析和目標(biāo)倒推。
群體和單體:
群體分析,也就是我們平常說的用戶群畫像,用戶群畫像承載的目標(biāo)是:體現(xiàn)人群的特征。我們由淺入深的來思考,如何完成這個(gè)目標(biāo)。
首先,我們要把基礎(chǔ)的信息展示出來。
- 人群的體量:人群數(shù)、占全部用戶的占比等信息,反應(yīng)人群的規(guī)模
- 人群的基礎(chǔ)構(gòu)成:人群中新老用戶占比
- 人群的標(biāo)簽分布:人群中,標(biāo)簽值的分布占比,反應(yīng)人群標(biāo)簽值的分布情況,如人群中「性別:男」占比為 70%,那么認(rèn)為人群中男性較多
- 人群的行為指標(biāo):人群完成指定指標(biāo)的總次數(shù)、人均次數(shù)等
有了以上的基礎(chǔ)信息,我們就可以對(duì)人群情況有一個(gè)基礎(chǔ)的的認(rèn)知,了解他們的構(gòu)成和他們的習(xí)慣。光有基礎(chǔ)的認(rèn)知是不夠的,我們還需要知道人群的特征,這個(gè)特征是要有差異化的、突出的、顯著的。普遍的分析方法中,會(huì)引入 TGI 指數(shù)(目標(biāo)群體指數(shù))來進(jìn)行人群的特征判斷。
我們引入一個(gè)對(duì)照組,默認(rèn)的可以是全體用戶,也可以是「最近 7 日活躍用戶」。
人群中標(biāo)簽值的 TGI 指數(shù):用來反映人群中該標(biāo)簽是否是一個(gè)突出的特征,按照 TGI 指數(shù)進(jìn)行排序,我們就可以得到這個(gè)群體與對(duì)照組最大的差異點(diǎn)在哪里
單體分析,也就是單個(gè)用戶畫像,單個(gè)用戶畫像承載的目標(biāo)是:描繪出單個(gè)用戶的使用軌跡以及屬性特征。
這個(gè)分為兩個(gè)部分,在我們分析單個(gè)用戶時(shí),通過觀察行為軌跡來探索用戶的偏好和特征,通過已有的屬性標(biāo)簽全面的觀察總結(jié)性的特征信息。
- 用戶的行為序列:按照時(shí)序展示用戶的每個(gè)行為觸發(fā)情況
- 用戶的標(biāo)簽分布:展示一個(gè)用戶身上的標(biāo)簽情況,并額外展示標(biāo)簽的變更記錄和在整體的分布情況
靜態(tài)和動(dòng)態(tài):
靜態(tài)分析,即我們將人群選擇后,通過增減維度、變換視角來進(jìn)行人群信息的展示,從而獲得信息。靜態(tài)分析的目標(biāo)是,得到一個(gè)人群的當(dāng)前狀態(tài),當(dāng)前特征,然后用于運(yùn)營。
動(dòng)態(tài)分析,人群演進(jìn),引入時(shí)間的概念,由于我們提前準(zhǔn)備好了標(biāo)簽的歷史數(shù)據(jù),那么我們就可以在這里應(yīng)用。選定人群后,可以向前或向后進(jìn)行演進(jìn),觀察同一個(gè)人群中標(biāo)簽的遷移情況。這個(gè)在我們做運(yùn)營活動(dòng)后,觀察活動(dòng)效果的作用上體現(xiàn)尤為明顯。
探索分析和目標(biāo)倒推:
探索分析是個(gè)正向的分析過程,探索觀察這個(gè)用戶群中的特征以及行為情況,來獲取我們想要的信息和知識(shí)。
目標(biāo)倒推,智能預(yù)測,是我們從目標(biāo)出發(fā),提前判斷出人群的特性。我們使用用戶畫像,獲取信息和知識(shí),最后的目標(biāo)是為了進(jìn)行運(yùn)營。運(yùn)營的目標(biāo)可能是完成某個(gè)活動(dòng)或者是個(gè)多維立體的指標(biāo),那么如果我們能在運(yùn)營之前,就先預(yù)測到這個(gè)群體與目標(biāo)是否相匹配,就會(huì)規(guī)避一些效果不理想的風(fēng)險(xiǎn)。
高效穩(wěn)定的對(duì)外輸出:
在我們生成了用戶畫像后,接下來落地的場景就是我們需要去應(yīng)用這個(gè)人群或者特征了。這里主要有兩個(gè)場景,第一個(gè)是使用人群包,第二個(gè)是使用人群的特征。
人群包的使用上,系統(tǒng)中應(yīng)考慮提供多種高效的對(duì)接方式。由于應(yīng)用場景的不同,人群包中攜帶的特征屬性等也可能不盡相同。
人群的特征使用上,應(yīng)考慮到應(yīng)用場景。大部分都是需要支持高 QPS 查詢的在線服務(wù)。盡可能快速的響應(yīng),返回一個(gè)用戶身上的標(biāo)簽情況。
同時(shí),設(shè)計(jì)完善的通知機(jī)制,當(dāng)人群計(jì)算完成、標(biāo)簽計(jì)算完成的狀態(tài),可以快速被獲取到。
四、如何搭建自己的標(biāo)簽體系
搭建一個(gè)標(biāo)簽體系,可以從我們的使用場景里入手。既然我們的目標(biāo)是來做精細(xì)化運(yùn)營,那么我們的搭建也應(yīng)該圍繞著精細(xì)化運(yùn)營的方法進(jìn)行拆解。簡單的概括就是「自上而下的需求梳理」和「自下而上的體系構(gòu)建」。
自上而下的需求梳理
自上而下的需求梳理,可以拆解為幾個(gè)步驟:運(yùn)營的目標(biāo)、運(yùn)營的方案、人群的拆解。
在我們做精細(xì)化運(yùn)營時(shí),是有一個(gè)或者多個(gè)預(yù)期的目標(biāo)的(比如:支付訂單),同時(shí)業(yè)務(wù)也有核心指標(biāo)(比如:頁面通過率),那么為了達(dá)成這個(gè)目標(biāo)者指標(biāo),我們需要進(jìn)行運(yùn)營方案的制定。
制定方案時(shí),第一步就是指標(biāo)拆解,比如「提高盈利額」可以拆解成「提高客單價(jià)」「提高客群數(shù)量」,提高客群數(shù)量又可以二次拆解成「提高頁面通過率」「提高 App 啟動(dòng)人數(shù)」。當(dāng)我們把指標(biāo)進(jìn)行拆解后,我們自然就知道了需要做哪些事情了,同時(shí)我們將場景帶入,也就知道需要對(duì)哪些人做哪些運(yùn)營干預(yù)。
比如「提高頁面通過率」,我們就需要再次進(jìn)行人群的拆解:新老用戶的通過率不同,不同偏好的用戶通過率不同,不同目標(biāo)的用戶通過率不同……在拆解的過程中,我們就會(huì)發(fā)現(xiàn):做這個(gè)運(yùn)營活動(dòng),我們需要「新老用戶標(biāo)簽」「用戶偏好標(biāo)簽」「訪問目標(biāo)標(biāo)簽」……
于是,標(biāo)簽的體系的需求梳理工作,就順理成章的完成了。
自下而上的體系構(gòu)建
當(dāng)我們有了希望創(chuàng)建的標(biāo)簽清單,先別急著創(chuàng)建,我們還需要進(jìn)行一次數(shù)據(jù)的梳理和抽象。
我們會(huì)發(fā)現(xiàn),很多業(yè)務(wù)標(biāo)簽的定義會(huì)有部分重疊,比如:「新老用戶」「活躍用戶」都會(huì)使用最近訪問的時(shí)間進(jìn)行判斷。類似這樣的情況還應(yīng)該會(huì)有很多,這里給出一個(gè)比較通過用的解決辦法。
第一步 事實(shí)標(biāo)簽的搭建:
首先,理解什么叫事實(shí)標(biāo)簽。用戶的屬性、用戶的行為指標(biāo)這些歸類為事實(shí)標(biāo)簽,在事實(shí)標(biāo)簽中,只會(huì)描述「什么時(shí)間」「做了幾次」這類真實(shí)反映事實(shí)的情況。
事實(shí)標(biāo)簽主要的作用,就是用來做行為的概括和描述,并且為更加上層的標(biāo)簽打下數(shù)據(jù)基礎(chǔ)(元標(biāo)簽)。由于事實(shí)標(biāo)簽只描述事實(shí),所以他們的穩(wěn)定性極高,不會(huì)隨業(yè)務(wù)指標(biāo)的改變而變化。
第二步 模型標(biāo)簽的搭建:
模型標(biāo)簽是基于自己的業(yè)務(wù)判斷,或者大數(shù)據(jù)分析,綜合多個(gè)維度產(chǎn)生的標(biāo)簽。舉個(gè)業(yè)內(nèi)最通用的例子,應(yīng)該就是 RFM 模型的標(biāo)簽了。最近一次消費(fèi)時(shí)間 Recency,消費(fèi)頻率Frequency,消費(fèi)金額 Monetary,這三個(gè)指標(biāo)都可以使用事實(shí)標(biāo)簽進(jìn)行描述。
所以,模型標(biāo)簽很依賴業(yè)務(wù)的判斷。當(dāng)然,我們也可以很自由的修改切割方案,所以模型標(biāo)簽是結(jié)合了業(yè)務(wù)經(jīng)驗(yàn),再加上一些主觀判斷得到的一個(gè)可以反映用戶特征的標(biāo)記。他的穩(wěn)定性一般,因?yàn)榕紶枙?huì)結(jié)合不同的產(chǎn)品周期和客群的演變而進(jìn)行調(diào)優(yōu)。
第三步 用戶群標(biāo)簽的搭建:
當(dāng)我們有了事實(shí)標(biāo)簽和模型標(biāo)簽后,其實(shí)已經(jīng)可以開始進(jìn)行精細(xì)化運(yùn)營了。但是對(duì)于某些特定的場景,我們可以固化下來一些有特征的用戶群,比如:高價(jià)值流失客群(使用「消費(fèi)能力」「最近一次訪問時(shí)間」「消費(fèi)意愿」……構(gòu)成)。
這類標(biāo)簽更加貼合業(yè)務(wù),甚至還有一定的時(shí)效性和周期性,有些甚至直接和活動(dòng)掛鉤。用戶群標(biāo)簽更加貼合業(yè)務(wù)場景,基本是不穩(wěn)定的,會(huì)隨著業(yè)務(wù)的變化、運(yùn)營策略的調(diào)整而新增或修改。
總結(jié)
本文主要提供了一個(gè)畫像系統(tǒng)的搭建思路,并從應(yīng)用的場景反向推出大致需要提供哪些分析功能和模塊。難免有些疏漏的情況,請(qǐng)各位結(jié)合自己的業(yè)務(wù)情況進(jìn)行補(bǔ)充,隨著業(yè)務(wù)的發(fā)展和技術(shù)的進(jìn)步,也會(huì)有更多的分析方法加入進(jìn)來。
系統(tǒng)的搭建,最終都是為了完成目標(biāo)而服務(wù),所以,在我們引入新功能的時(shí)候,需要三思一下,這個(gè)功能,能不能很好的幫我完成這個(gè)目標(biāo)?如果答案是肯定的,那么這個(gè)功能就是有價(jià)值的。
作者:宋宋,神策數(shù)據(jù)產(chǎn)品經(jīng)理。
本文由@請(qǐng)叫我宋宋 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash, 基于CC0協(xié)議
謝謝
講的很易懂
我覺得很有用~
已經(jīng)講的很系統(tǒng)了
感覺說的太范了,能不能分享具體實(shí)施的例子,尤其如何從日志數(shù)據(jù)表到一層層的建立標(biāo)簽體系的文檔和舉例
確實(shí)太泛了,沒什么工程實(shí)踐
可以加微信認(rèn)識(shí)下嗎?
對(duì)小白能有個(gè)大概的認(rèn)知
感覺說的太范了
785474747570138885877747487圖片7
http://www.51smt.cn