如何從0到1做電商用戶畫像建模?

4 評論 21211 瀏覽 147 收藏 13 分鐘

用戶畫像,其實(shí)就是通過算法聚合成一類實(shí)現(xiàn)用戶信息標(biāo)簽化。而本文就以電商用戶為例,展示了如何從0到1做畫像建模。

一、構(gòu)建用戶畫像

① 用戶畫像信息:基本屬性,購買能力,行為特征,興趣愛好,心理特征,社交網(wǎng)絡(luò)

② 行為建模:文本挖掘,自然語言處理,機(jī)器學(xué)習(xí),預(yù)測算法,聚類算法

③ 數(shù)據(jù)收集:網(wǎng)絡(luò)日志數(shù)據(jù),用戶行為數(shù)據(jù),網(wǎng)站交易數(shù)據(jù)

作用:了解用戶的行為習(xí)慣,個性化營銷及精準(zhǔn)廣告

  • 靜態(tài)數(shù)據(jù)來源:來源于用戶填的個人信息,及算法模型預(yù)測的數(shù)據(jù)
  • 動態(tài)信息數(shù)據(jù): 用戶行為產(chǎn)生的數(shù)據(jù):注冊,瀏覽,點(diǎn)擊,購買,簽收,評價,退貨等

—比較重要的行為:購買商品,瀏覽商品,放入購物車,關(guān)注商品等

根據(jù)行為可以得出標(biāo)簽: 潮媽族,糾結(jié)商品,最大消費(fèi),退貨數(shù)量,敗家指數(shù),品牌偏好,用戶活躍度等
確定標(biāo)簽與根據(jù)算法猜測的標(biāo)簽

  • 確定的標(biāo)簽:比如用戶購買了或者收藏了某個商品等
  • 猜測的標(biāo)簽:比如用戶的性別,是男性的概率0.8。

另外還有很多模型:孕婦模型,潛在汽車用戶模型,用戶價值模型

比如:用戶活躍度(活躍,沉睡,流失,未購買) 用戶分群:電腦達(dá)人,數(shù)碼潮人,家庭用戶,網(wǎng)購達(dá)人,奶爸奶媽,單身貴族,閃購用戶,時尚男女等

二、用戶畫像建模

1. 客戶消費(fèi)訂單表

根據(jù)用戶消費(fèi)的情況來提取的客戶標(biāo)簽,用以了解用戶的消費(fèi)情況,消費(fèi)習(xí)慣。

(1)客戶消費(fèi)訂單表標(biāo)簽

購買信息:

客戶ID,第一次消費(fèi)時間,最近一次消費(fèi)時間,首單距今時間,尾單距今時間,近30/60/90天購買次數(shù)/購買金額(不含退拒),最大/最小消費(fèi)金額,累計消費(fèi)次數(shù)/金額(不含退拒) 累計使用代金券金額,客單價(含退拒),常用收貨地區(qū),常用支付方式,退貨商品數(shù)量,退貨商品金額,拒收商品金額/數(shù)量,最近一次退貨時間,各地點(diǎn)下單總數(shù)/總額,上下午下單總數(shù)/總額。

購物車信息:

最近30天購物車商品件數(shù)/提交商品件數(shù)/購物車成功率/購物車放棄件數(shù)

(2)提取標(biāo)簽的作用

  • 確定用戶什么時候來的,多久沒來了:第一次消費(fèi)時間,最近一次消費(fèi)時間,首單距今時間,尾單距今時間。
  • 最近消費(fèi)能力:近30天購買次數(shù)(不含退拒),近30購買金額(不含退拒),近30天購買次數(shù)(含退拒),近30天購買金額(含退拒)。
  • 總體的消費(fèi)情況:最小/大消費(fèi)金額(可做個性化商品推薦),累計消費(fèi)次數(shù)(不含退拒,可以計算客單價),累計消費(fèi)金額,累計使用代金券金額(代金券愛好。)
  • 消費(fèi)屬性:常用收貨地區(qū),常用支付方式。
  • 購物車習(xí)慣:最近30天購物車次數(shù),最近30天購物車提交商品件數(shù),最近30天購物車商品件數(shù),最近30天購物車放棄件數(shù),最近30天購物車成功率。
  • 退貨和習(xí)慣特征:退貨商品數(shù)量,拒收商品數(shù)量,退貨商品金額,拒收商品金額,最近一次退貨時間 用戶購物時間及地點(diǎn)習(xí)慣:各下單地點(diǎn)總數(shù),各時間段下單總數(shù)。

2. 客戶購買類目表

—根據(jù)客戶購買類目的情況提取的客戶標(biāo)簽,用以了解類目的購買人群情況 。

客戶購買表標(biāo)簽:

客戶ID,一級/二級/三級分類ID/名稱,近30天/90天/180天購買類目次數(shù)/金額,累計購買類目次數(shù)/金額,累計購買類目次數(shù)/金額,近30天/90天/180天購物車某類目次數(shù)/金額,累計購買類目次數(shù)/金額,累計購物車類目次數(shù)/金額,最后一次購買類目時間/距今天數(shù)

3. 客戶購買商店表

根據(jù)客戶購買商店的情況提取的客戶標(biāo)簽,用以了解商店及品牌的購買人群(做品牌營銷等) 客戶。

購買商店表標(biāo)簽:

用戶ID,商店ID/名稱,品牌ID/名稱,最近30天購物車次數(shù)/商品件數(shù)/提交商品件數(shù)/成功率/放棄件數(shù),最后一次購物車時間,最近90天商品排除退拒商品件數(shù)/金額,最近90天貨到付款訂單數(shù),最近90天退換件數(shù)/金額,最近90天拒收件數(shù)/金額.

4. 客戶基本屬性

根據(jù)客戶所填的屬性標(biāo)簽與推算出來的標(biāo)簽,用以了解用戶的基本屬性(可用以個性營銷,生日營銷,星座營銷等)。

客戶基本屬性標(biāo)簽:

客戶ID,客戶登錄名,性別,生日,年齡,星座,大區(qū)域,省份,城市,城市等級,郵箱,郵箱運(yùn)營商,加密手機(jī),手機(jī)運(yùn)營商,注冊時間,登錄ip地址,登錄來源,邀請人,會員積分,已使用積分,會員等級名稱,婚姻狀況,學(xué)歷,月收入,職業(yè),性別模型,是否孕婦,是否有小孩,孩子性別及年齡概率,是否有車,潛在汽車用戶概率,使用手機(jī)品牌/檔次,用戶忠誠度,用戶購物類型,身材,身高。

數(shù)據(jù)來源:

用戶表,用戶調(diào)查表,孕婦模型表,馬甲模型表,用戶價值模型表等 根據(jù)算法得出的標(biāo)簽。

其中模型:

性別模型:用以推算用戶的購買用品的性別傾向(不一定是真實(shí)性別)

(1)性別模型

用戶性別:1男,0女,-1未識別 | 1,商品性別得分,2,用戶購買商品性別得分。

孩子性別:0僅有男孩,1僅有女孩,2,男女均勻,3,無法識別 |1,選擇男童女童商品等

性別驗(yàn)證: 隨機(jī)抽樣調(diào)查 ,與用戶填寫性惡爆匹配。

(2)用戶購物模型

兩種歸類:

用戶購物類型:

  1. 購物沖動型
  2. 海淘猶豫型
  3. 理性比較型
  4. 目標(biāo)明確型
  5. 未識別

構(gòu)建:

  1. 計算用戶在對三級品類購物前流量時間和瀏覽sku數(shù)量
  2. kmeans聚類

用戶忠誠度模型:

用戶忠誠度:

  1. 忠誠型用戶
  2. 偶爾型用戶
  3. 投資型用戶
  4. 瀏覽型用戶
  5. 未識別

構(gòu)建:

  1. 只瀏覽不購買
  2. 購買天數(shù)大于一定天數(shù)
  3. 購買天數(shù)小于一定天數(shù),大部分只有優(yōu)惠彩購買 等

5. 客戶營銷信息表

將用戶營銷相關(guān)的常用標(biāo)簽放到一張表中,方便使用。

  • 客戶營銷信息表: 客戶ID,營銷手機(jī)號,第一個有效訂單來源/地址/手機(jī)號,常用的手機(jī)號,常用的收貨地址,不同收貨地址的數(shù)量,客戶分群,活躍狀態(tài),用戶價值(重要,保持,流失等),糾結(jié)商品,糾結(jié)小時
  • 主要來源表: 用戶表,訂單表,活動表,購物車表。

其中模型:

(1)客戶活躍狀態(tài)模型

客戶一般的活躍狀態(tài):

  1. 注冊未購買(只注冊未購買,多事第三方登錄)
  2. 活躍(可以細(xì)分為高頻,中頻,低頻)
  3. 沉睡(近90天無購買,近60天無購買)
  4. 流失 (近90天無購買,曾經(jīng)購買)

(2)用戶價值模型

體現(xiàn)用戶對網(wǎng)站的價值對提供用戶留存率非常有幫助

使用RFM實(shí)現(xiàn)用戶價值模型參考指標(biāo):

  • 最近一次消費(fèi)時間(Recency)
  • 消費(fèi)頻率(Frequency)
  • 消費(fèi)金額(Monetary)

RFM 實(shí)現(xiàn)用戶價值模型計算方法:

  • 使用指標(biāo):租金一次購買時間,近180天購買訂單量,近180天購買金額,分N段進(jìn)行RFM分?jǐn)?shù)計算
  • 算出Recency_score,Frequency_score,Monetary_score,然后劃分用戶群

? ? 用戶價值分類

6. 客戶活動信息表

根據(jù)客戶參與活動的情況提取的客戶標(biāo)簽,用于了解用戶對活動的參與情況,以進(jìn)行活動的策劃

客戶活動信息表內(nèi)容標(biāo)簽:

客戶ID,用戶促銷明個度,滿減促銷敏感度,打折促銷敏感度,換購促銷敏感度,滿贈促銷敏感度,購買力分段,品牌偏好,品類偏好,顏色偏好,敗家偏好,沖動偏好,累計積分,已用積分,可以積分,累計代金券數(shù)量/金額,已用代金券數(shù)量/金額,過期代金券數(shù)量/金額,可用代金券數(shù)量/金額

標(biāo)簽作用:

確定用戶喜歡那種活動類型:用戶促銷敏感度,滿減促銷敏感度,滿贈敏感度,打折促銷敏感度,換購促銷敏感度,團(tuán)購促銷敏感度等

促銷敏感度模型:

根據(jù)用戶購買的活動類型訂單數(shù)與金額數(shù)已判斷其屬于哪類人群


用戶有什么偏好:店鋪偏好,品牌偏好,品類偏好,顏色偏好 用戶指數(shù):購買力分段,敗家指數(shù),沖動指數(shù) 用戶購買力高中低模型:

—從購物車,客單價來判斷 用戶購買力高中低端模型:

  1. 從購物車來判斷
  2. 從客單價來判斷

指數(shù)模型:

敗家指數(shù):

  • 使用購買特征山炮數(shù)量來識別(剛出的蘋果產(chǎn)品,奢侈品)
  • 結(jié)合用戶的訂單金額

沖動指數(shù) :

  • 使用特征商品(同品類價格較高商品)平均購物車停留時間
  • 結(jié)合特征商品(同品類價格較高商品)的購買數(shù)量

7. 客戶訪問信息表

根據(jù)客戶訪問的情況提取的客戶標(biāo)簽以了解訪問習(xí)慣。

客戶訪問信息標(biāo)簽:

最近一次/第一次pc端訪問日期/session/cookies/pv/使用瀏覽器/操作系統(tǒng)/,最近一次/ 第一次app端訪問日期/操作系統(tǒng),最近一次/第一次訪問ip/訪問城市/省份,近7天/15天/30天/60天/90天app端/pc端訪問次數(shù),近30天pc端/app端訪問天數(shù)/訪問并購買次數(shù)/訪問pv/訪問評價pv/ip數(shù)/,app及pc端各時間段訪問的次數(shù)。

 

本文由 @Ethan 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CCO協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 您好,我想問一下,您是偏數(shù)據(jù)建模研發(fā)崗位還是偏產(chǎn)品崗位的?很認(rèn)真的研讀了這篇文章,我有一點(diǎn)亂,指標(biāo)、數(shù)據(jù)、模型規(guī)則、模型結(jié)果看完之后我沒劃分的很清楚;還有這個過程是算法分析挖掘的過程嘛 對應(yīng)的產(chǎn)品是怎么樣的呢~~可以私信請教一下嘛

    來自廣東 回復(fù)
    1. 我也覺得很亂,全文沒有什么邏輯性

      回復(fù)
    2. 感覺這篇文章不是沒有邏輯性,而是脫敏了,刪了好多關(guān)鍵內(nèi)容

      來自北京 回復(fù)
  2. 數(shù)據(jù)很全了

    回復(fù)