如何從0到1做電商用戶畫像建模?
用戶畫像,其實(shí)就是通過算法聚合成一類實(shí)現(xiàn)用戶信息標(biāo)簽化。而本文就以電商用戶為例,展示了如何從0到1做畫像建模。
一、構(gòu)建用戶畫像
① 用戶畫像信息:基本屬性,購買能力,行為特征,興趣愛好,心理特征,社交網(wǎng)絡(luò)
② 行為建模:文本挖掘,自然語言處理,機(jī)器學(xué)習(xí),預(yù)測算法,聚類算法
③ 數(shù)據(jù)收集:網(wǎng)絡(luò)日志數(shù)據(jù),用戶行為數(shù)據(jù),網(wǎng)站交易數(shù)據(jù)
作用:了解用戶的行為習(xí)慣,個性化營銷及精準(zhǔn)廣告
- 靜態(tài)數(shù)據(jù)來源:來源于用戶填的個人信息,及算法模型預(yù)測的數(shù)據(jù)
- 動態(tài)信息數(shù)據(jù): 用戶行為產(chǎn)生的數(shù)據(jù):注冊,瀏覽,點(diǎn)擊,購買,簽收,評價,退貨等
—比較重要的行為:購買商品,瀏覽商品,放入購物車,關(guān)注商品等
根據(jù)行為可以得出標(biāo)簽: 潮媽族,糾結(jié)商品,最大消費(fèi),退貨數(shù)量,敗家指數(shù),品牌偏好,用戶活躍度等
確定標(biāo)簽與根據(jù)算法猜測的標(biāo)簽
- 確定的標(biāo)簽:比如用戶購買了或者收藏了某個商品等
- 猜測的標(biāo)簽:比如用戶的性別,是男性的概率0.8。
另外還有很多模型:孕婦模型,潛在汽車用戶模型,用戶價值模型
比如:用戶活躍度(活躍,沉睡,流失,未購買) 用戶分群:電腦達(dá)人,數(shù)碼潮人,家庭用戶,網(wǎng)購達(dá)人,奶爸奶媽,單身貴族,閃購用戶,時尚男女等
二、用戶畫像建模
1. 客戶消費(fèi)訂單表
根據(jù)用戶消費(fèi)的情況來提取的客戶標(biāo)簽,用以了解用戶的消費(fèi)情況,消費(fèi)習(xí)慣。
(1)客戶消費(fèi)訂單表標(biāo)簽:
購買信息:
客戶ID,第一次消費(fèi)時間,最近一次消費(fèi)時間,首單距今時間,尾單距今時間,近30/60/90天購買次數(shù)/購買金額(不含退拒),最大/最小消費(fèi)金額,累計消費(fèi)次數(shù)/金額(不含退拒) 累計使用代金券金額,客單價(含退拒),常用收貨地區(qū),常用支付方式,退貨商品數(shù)量,退貨商品金額,拒收商品金額/數(shù)量,最近一次退貨時間,各地點(diǎn)下單總數(shù)/總額,上下午下單總數(shù)/總額。
購物車信息:
最近30天購物車商品件數(shù)/提交商品件數(shù)/購物車成功率/購物車放棄件數(shù)
(2)提取標(biāo)簽的作用
- 確定用戶什么時候來的,多久沒來了:第一次消費(fèi)時間,最近一次消費(fèi)時間,首單距今時間,尾單距今時間。
- 最近消費(fèi)能力:近30天購買次數(shù)(不含退拒),近30購買金額(不含退拒),近30天購買次數(shù)(含退拒),近30天購買金額(含退拒)。
- 總體的消費(fèi)情況:最小/大消費(fèi)金額(可做個性化商品推薦),累計消費(fèi)次數(shù)(不含退拒,可以計算客單價),累計消費(fèi)金額,累計使用代金券金額(代金券愛好。)
- 消費(fèi)屬性:常用收貨地區(qū),常用支付方式。
- 購物車習(xí)慣:最近30天購物車次數(shù),最近30天購物車提交商品件數(shù),最近30天購物車商品件數(shù),最近30天購物車放棄件數(shù),最近30天購物車成功率。
- 退貨和習(xí)慣特征:退貨商品數(shù)量,拒收商品數(shù)量,退貨商品金額,拒收商品金額,最近一次退貨時間 用戶購物時間及地點(diǎn)習(xí)慣:各下單地點(diǎn)總數(shù),各時間段下單總數(shù)。
2. 客戶購買類目表
—根據(jù)客戶購買類目的情況提取的客戶標(biāo)簽,用以了解類目的購買人群情況 。
客戶購買表標(biāo)簽:
客戶ID,一級/二級/三級分類ID/名稱,近30天/90天/180天購買類目次數(shù)/金額,累計購買類目次數(shù)/金額,累計購買類目次數(shù)/金額,近30天/90天/180天購物車某類目次數(shù)/金額,累計購買類目次數(shù)/金額,累計購物車類目次數(shù)/金額,最后一次購買類目時間/距今天數(shù)
3. 客戶購買商店表
根據(jù)客戶購買商店的情況提取的客戶標(biāo)簽,用以了解商店及品牌的購買人群(做品牌營銷等) 客戶。
購買商店表標(biāo)簽:
用戶ID,商店ID/名稱,品牌ID/名稱,最近30天購物車次數(shù)/商品件數(shù)/提交商品件數(shù)/成功率/放棄件數(shù),最后一次購物車時間,最近90天商品排除退拒商品件數(shù)/金額,最近90天貨到付款訂單數(shù),最近90天退換件數(shù)/金額,最近90天拒收件數(shù)/金額.
4. 客戶基本屬性
根據(jù)客戶所填的屬性標(biāo)簽與推算出來的標(biāo)簽,用以了解用戶的基本屬性(可用以個性營銷,生日營銷,星座營銷等)。
客戶基本屬性標(biāo)簽:
客戶ID,客戶登錄名,性別,生日,年齡,星座,大區(qū)域,省份,城市,城市等級,郵箱,郵箱運(yùn)營商,加密手機(jī),手機(jī)運(yùn)營商,注冊時間,登錄ip地址,登錄來源,邀請人,會員積分,已使用積分,會員等級名稱,婚姻狀況,學(xué)歷,月收入,職業(yè),性別模型,是否孕婦,是否有小孩,孩子性別及年齡概率,是否有車,潛在汽車用戶概率,使用手機(jī)品牌/檔次,用戶忠誠度,用戶購物類型,身材,身高。
數(shù)據(jù)來源:
用戶表,用戶調(diào)查表,孕婦模型表,馬甲模型表,用戶價值模型表等 根據(jù)算法得出的標(biāo)簽。
其中模型:
性別模型:用以推算用戶的購買用品的性別傾向(不一定是真實(shí)性別)
(1)性別模型
用戶性別:1男,0女,-1未識別 | 1,商品性別得分,2,用戶購買商品性別得分。
孩子性別:0僅有男孩,1僅有女孩,2,男女均勻,3,無法識別 |1,選擇男童女童商品等
性別驗(yàn)證: 隨機(jī)抽樣調(diào)查 ,與用戶填寫性惡爆匹配。
(2)用戶購物模型
兩種歸類:
用戶購物類型:
- 購物沖動型
- 海淘猶豫型
- 理性比較型
- 目標(biāo)明確型
- 未識別
構(gòu)建:
- 計算用戶在對三級品類購物前流量時間和瀏覽sku數(shù)量
- kmeans聚類
用戶忠誠度模型:
用戶忠誠度:
- 忠誠型用戶
- 偶爾型用戶
- 投資型用戶
- 瀏覽型用戶
- 未識別
構(gòu)建:
- 只瀏覽不購買
- 購買天數(shù)大于一定天數(shù)
- 購買天數(shù)小于一定天數(shù),大部分只有優(yōu)惠彩購買 等
5. 客戶營銷信息表
將用戶營銷相關(guān)的常用標(biāo)簽放到一張表中,方便使用。
- 客戶營銷信息表: 客戶ID,營銷手機(jī)號,第一個有效訂單來源/地址/手機(jī)號,常用的手機(jī)號,常用的收貨地址,不同收貨地址的數(shù)量,客戶分群,活躍狀態(tài),用戶價值(重要,保持,流失等),糾結(jié)商品,糾結(jié)小時
- 主要來源表: 用戶表,訂單表,活動表,購物車表。
其中模型:
(1)客戶活躍狀態(tài)模型
客戶一般的活躍狀態(tài):
- 注冊未購買(只注冊未購買,多事第三方登錄)
- 活躍(可以細(xì)分為高頻,中頻,低頻)
- 沉睡(近90天無購買,近60天無購買)
- 流失 (近90天無購買,曾經(jīng)購買)
(2)用戶價值模型
體現(xiàn)用戶對網(wǎng)站的價值對提供用戶留存率非常有幫助
使用RFM實(shí)現(xiàn)用戶價值模型參考指標(biāo):
- 最近一次消費(fèi)時間(Recency)
- 消費(fèi)頻率(Frequency)
- 消費(fèi)金額(Monetary)
RFM 實(shí)現(xiàn)用戶價值模型計算方法:
- 使用指標(biāo):租金一次購買時間,近180天購買訂單量,近180天購買金額,分N段進(jìn)行RFM分?jǐn)?shù)計算
- 算出Recency_score,Frequency_score,Monetary_score,然后劃分用戶群
6. 客戶活動信息表
根據(jù)客戶參與活動的情況提取的客戶標(biāo)簽,用于了解用戶對活動的參與情況,以進(jìn)行活動的策劃
客戶活動信息表內(nèi)容標(biāo)簽:
客戶ID,用戶促銷明個度,滿減促銷敏感度,打折促銷敏感度,換購促銷敏感度,滿贈促銷敏感度,購買力分段,品牌偏好,品類偏好,顏色偏好,敗家偏好,沖動偏好,累計積分,已用積分,可以積分,累計代金券數(shù)量/金額,已用代金券數(shù)量/金額,過期代金券數(shù)量/金額,可用代金券數(shù)量/金額
標(biāo)簽作用:
確定用戶喜歡那種活動類型:用戶促銷敏感度,滿減促銷敏感度,滿贈敏感度,打折促銷敏感度,換購促銷敏感度,團(tuán)購促銷敏感度等
促銷敏感度模型:
根據(jù)用戶購買的活動類型訂單數(shù)與金額數(shù)已判斷其屬于哪類人群
用戶有什么偏好:店鋪偏好,品牌偏好,品類偏好,顏色偏好 用戶指數(shù):購買力分段,敗家指數(shù),沖動指數(shù) 用戶購買力高中低模型:
—從購物車,客單價來判斷 用戶購買力高中低端模型:
- 從購物車來判斷
- 從客單價來判斷
指數(shù)模型:
敗家指數(shù):
- 使用購買特征山炮數(shù)量來識別(剛出的蘋果產(chǎn)品,奢侈品)
- 結(jié)合用戶的訂單金額
沖動指數(shù) :
- 使用特征商品(同品類價格較高商品)平均購物車停留時間
- 結(jié)合特征商品(同品類價格較高商品)的購買數(shù)量
7. 客戶訪問信息表
根據(jù)客戶訪問的情況提取的客戶標(biāo)簽以了解訪問習(xí)慣。
客戶訪問信息標(biāo)簽:
最近一次/第一次pc端訪問日期/session/cookies/pv/使用瀏覽器/操作系統(tǒng)/,最近一次/ 第一次app端訪問日期/操作系統(tǒng),最近一次/第一次訪問ip/訪問城市/省份,近7天/15天/30天/60天/90天app端/pc端訪問次數(shù),近30天pc端/app端訪問天數(shù)/訪問并購買次數(shù)/訪問pv/訪問評價pv/ip數(shù)/,app及pc端各時間段訪問的次數(shù)。
本文由 @Ethan 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CCO協(xié)議。
您好,我想問一下,您是偏數(shù)據(jù)建模研發(fā)崗位還是偏產(chǎn)品崗位的?很認(rèn)真的研讀了這篇文章,我有一點(diǎn)亂,指標(biāo)、數(shù)據(jù)、模型規(guī)則、模型結(jié)果看完之后我沒劃分的很清楚;還有這個過程是算法分析挖掘的過程嘛 對應(yīng)的產(chǎn)品是怎么樣的呢~~可以私信請教一下嘛
我也覺得很亂,全文沒有什么邏輯性
感覺這篇文章不是沒有邏輯性,而是脫敏了,刪了好多關(guān)鍵內(nèi)容
數(shù)據(jù)很全了