基于大數(shù)據(jù)的用戶畫像構(gòu)建(理論篇)

4 評論 35276 瀏覽 334 收藏 8 分鐘

什么是用戶畫像?

簡而言之,用戶畫像是根據(jù)用戶社會屬性、生活習(xí)慣和消費行為等信息而抽象出的一個標(biāo)簽化的用戶模型。構(gòu)建用戶畫像的核心工作即是給用戶貼“標(biāo)簽”,而標(biāo)簽是通過對用戶信息分析而來的高度精煉的特征標(biāo)識。

舉例來說,如果你經(jīng)常購買一些玩偶玩具,那么電商網(wǎng)站即可根據(jù)玩具購買的情況替你打上標(biāo)簽“有孩子”,甚至還可以判斷出你孩子大概的年齡,貼上“有5-10歲的孩子”這樣更為具體的標(biāo)簽,而這些所有給你貼的標(biāo)簽統(tǒng)在一次,就成了你的用戶畫像,因此,也可以說用戶畫像就是判斷一個人是什么樣的人。

除去“標(biāo)簽化”,用戶畫像還具有的特點是“低交叉率”,當(dāng)兩組畫像除了權(quán)重較小的標(biāo)簽外其余標(biāo)簽幾乎一致,那就可以將二者合并,弱化低權(quán)重標(biāo)簽的差異。

用戶畫像的作用

羅振宇在《時間的朋友》跨年演講上舉了這樣一個例子:當(dāng)一個壞商家掌握了你的購買數(shù)據(jù),他就可以根據(jù)你平常購買商品的偏好來決定是給你發(fā)正品還是假貨以提高利潤。且不說是否存在這情況,但這也說明了利用用戶畫像可以做到“精準(zhǔn)銷售”,當(dāng)然了,這是極其錯誤的用法。

其作用大體不離以下幾個方面:

  1. 精準(zhǔn)營銷,分析產(chǎn)品潛在用戶,針對特定群體利用短信郵件等方式進(jìn)行營銷;
  2. 用戶統(tǒng)計,比如中國大學(xué)購買書籍人數(shù) TOP10,全國分城市奶爸指數(shù);
  3. 數(shù)據(jù)挖掘,構(gòu)建智能推薦系統(tǒng),利用關(guān)聯(lián)規(guī)則計算,喜歡紅酒的人通常喜歡什么運動品牌,利用聚類算法分析,喜歡紅酒的人年齡段分布情況;
  4. 進(jìn)行效果評估,完善產(chǎn)品運營,提升服務(wù)質(zhì)量,其實這也就相當(dāng)于市場調(diào)研、用戶調(diào)研,迅速下定位服務(wù)群體,提供高水平的服務(wù);
  5. 對服務(wù)或產(chǎn)品進(jìn)行私人定制,即個性化的服務(wù)某類群體甚至每一位用戶(個人認(rèn)為這是目前的發(fā)展趨勢,未來的消費主流)。比如,某公司想推出一款面向5-10歲兒童的玩具,通過用戶畫像進(jìn)行分析,發(fā)現(xiàn)形象=“喜羊羊”、價格區(qū)間=“中等”的偏好比重最大,那么就給新產(chǎn)品提供類非常客觀有效的決策依據(jù)。
  6. 業(yè)務(wù)經(jīng)營分析以及競爭分析,影響企業(yè)發(fā)展戰(zhàn)略

構(gòu)建流程

1

數(shù)據(jù)收集

數(shù)據(jù)收集大致分為網(wǎng)絡(luò)行為數(shù)據(jù)、服務(wù)內(nèi)行為數(shù)據(jù)、用戶內(nèi)容偏好數(shù)據(jù)、用戶交易數(shù)據(jù)這四類。

  • 網(wǎng)絡(luò)行為數(shù)據(jù):活躍人數(shù)、頁面瀏覽量、訪問時長、激活率、外部觸點、社交數(shù)據(jù)等
  • 服務(wù)內(nèi)行為數(shù)據(jù):瀏覽路徑、頁面停留時間、訪問深度、唯一頁面瀏覽次數(shù)等
  • 用戶內(nèi)容便好數(shù)據(jù):瀏覽/收藏內(nèi)容、評論內(nèi)容、互動內(nèi)容、生活形態(tài)偏好、品牌偏好等
  • 用戶交易數(shù)據(jù)(交易類服務(wù)):貢獻(xiàn)率、客單價、連帶率、回頭率、流失率等

當(dāng)然,收集到的數(shù)據(jù)不會是100%準(zhǔn)確的,都具有不確定性,這就需要在后面的階段中建模來再判斷,比如某用戶在性別一欄填的男,但通過其行為偏好可判斷其性別為“女”的概率為80%。

還得一提的是,儲存用戶行為數(shù)據(jù)時最好同時儲存下發(fā)生該行為的場景,以便更好地進(jìn)行數(shù)據(jù)分析。

行為建模

該階段是對上階段收集到數(shù)據(jù)的處理,進(jìn)行行為建模,以抽象出用戶的標(biāo)簽,這個階段注重的應(yīng)是大概率事件,通過數(shù)學(xué)算法模型盡可能地排除用戶的偶然行為。

這時也要用到機(jī)器學(xué)習(xí),對用戶的行為、偏好進(jìn)行猜測,好比一個 y=kx+b 的算法,X 代表已知信息,Y 是用戶偏好,通過不斷的精確k和b來精確Y。

在這個階段,需要用到很多模型來給用戶貼標(biāo)簽。

用戶汽車模型

根據(jù)用戶對“汽車”話題的關(guān)注或購買相關(guān)產(chǎn)品的情況來判斷用戶是否有車、是否準(zhǔn)備買車

用戶忠誠度模型

通過判斷+聚類算法判斷用戶的忠誠度

身高體型模型

根據(jù)用戶購買服裝鞋帽等用品判斷

文藝青年模型

根據(jù)用戶發(fā)言、評論等行為判斷用戶是否為文藝青年

用戶價值模型

判斷用戶對于網(wǎng)站的價值,對于提高用戶留存率非常有用(電商網(wǎng)站一般使用RFM 實現(xiàn))

還有消費能力、違約概率、流失概率等等諸多模型。

用戶畫像基本成型

該階段可以說是二階段的一個深入,要把用戶的基本屬性(年齡、性別、地域)、購買能力、行為特征、興趣愛好、心理特征、社交網(wǎng)絡(luò)大致地標(biāo)簽化。

為什么說是基本成型?因為用戶畫像永遠(yuǎn)也無法100%地描述一個人,只能做到不斷地去逼近一個人,因此,用戶畫像既應(yīng)根據(jù)變化的基礎(chǔ)數(shù)據(jù)不斷修正,又要根據(jù)已知數(shù)據(jù)來抽象出新的標(biāo)簽使用戶畫像越來越立體。

關(guān)于“標(biāo)簽化”,一般采用多級標(biāo)簽、多級分類,比如第一級標(biāo)簽是基本信息(姓名、性別),第二級是消費習(xí)慣、用戶行為;第一級分類有人口屬性,人口屬性又有基本信息、地理位置等二級分類,地理位置又分工作地址和家庭地址的三級分類。

數(shù)據(jù)可視化分析

這是把用戶畫像真正利用起來的一步,在此步驟中一般是針對群體的分析,比如可以根據(jù)用戶價值來細(xì)分出核心用戶、評估某一群體的潛在價值空間,以作出針對性的運營。

如圖:

2

后記

這里只寫了用戶畫像的構(gòu)建流程和一些原理,下次有時間我會寫篇關(guān)于大數(shù)據(jù)平臺的實踐文章,并說一下一些行為模型的算法原理,有興趣的朋友可以關(guān)注下。

 

本文由 @我勒個矗 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 模型的算法和原理的文有出來嗎,求分享

    來自上海 回復(fù)
  2. 模型的算法和原理的文有出來嗎,求分享

    來自廣東 回復(fù)
  3. 模型的算法和原理的文有出來嗎,求分享

    來自四川 回復(fù)