從0到1,如何構建用戶畫像體系?

6 評論 22852 瀏覽 182 收藏 21 分鐘

文章從數據產品層面出發,對如何從0到1建設用戶畫像體系進行了梳理分析,主要是4個步驟:業務需求分析、建設標簽體系、建設畫像系統和畫像應用,供大家一同參考和學習。

從PC到移動互聯網,一批搭乘流量紅利快車的互聯網產品,曾極速崛起。而如今,流量紅利消失,一個瘋狂的、傳奇般的流量時代,已然結束。增量乏力,存量市場競爭更加激烈的環境下催生了精細化運營,結合大數據,對用戶進行分群,針對不同群體的用戶采用不同的營銷策略。

兵法云:“知己知彼,百戰不殆”,在整個精細化運營過程中,用戶畫像體系的搭建起到不可或缺的作用。前面草帽小子介紹了埋點數據采集、指標體系搭建、數倉和OLAP分析等數據基礎層建設,接下來我們來研究如何從0-1搭建用戶畫像體系,以及用戶畫像的應用場景。

初識用戶畫像

用戶畫像的概念,最早由交互設計之父Alan Cooper提出,是對產品或服務的目標人群做出的特征刻畫。

在早期,用戶數據的來源渠道比較少,數據量也相對比較小的時期,用戶畫像的研究主要基于統計分析層面,通過用戶調研來構建用戶畫像標簽。

后來,加利福尼亞大學的Syskill和Webert,通過手動收集網站用戶對頁面的滿意度,然后通過統計分析逐漸構建出用戶興趣模型。

再隨著互聯網及信息采集技術的發展,加州管理大學開發了Web Watcher,可以通過數據采集器,記錄互聯網上用戶產生的各種瀏覽行為以及用戶的興趣偏好,實現對用戶興趣模型的構建,并隨著數據的不斷累積,擴大更新系統模型,用戶畫像標簽也更加豐富。

近年來,隨著互聯網海量數據的爆炸式增長,眾多企業的用戶畫像研究有了新的機遇,基于用戶的屬性、行為、興趣愛好等數據標簽,運用算法對特征進行分析建模,從而抽象出用戶的全貌,成為了產品人員的關注重點。

例如對于路飛而言,其用戶畫像可簡單描述為18-25歲中二少年,15億身價,愛吃肉,愛炫酷機器人,沖動性消費人群,若某電商網站提前得知了該用戶信息,就可以根據其偏好特征,給其推送肉類以及高科技商品,促進路飛在平臺上完成購買。

這個過程中,用于描繪用戶畫像的關鍵性因素就是標簽,通常不同應用場景下,標簽分類不同。

例如騰訊廣告對標簽的分類,可分為:

  • 人口學標簽:性別、年齡、居住地、學歷、婚戀、資產及工作狀態等。
  • 興趣類標簽:商業興趣、泛娛樂興趣、語義興趣等。
  • 設備類標簽:設備品牌、運營商、 聯網方式、型號、操作系統等。
  • 行為類標簽:人群上班地、出游頻率、使用電商購物、O2O、游戲等應用特定行為、互動行為、支付行為等。

按阿里電商對標簽的分類,可分為:

  • 用戶屬性類標簽:性別、年齡、地域、注冊日期、手機品牌、手機系統、聯系方式、歷史購買狀態、用戶活躍度、RFM價值度。
  • 用戶行為類標簽:近30日訪問次數、近30日客單價、近30日活躍天數、近30日訪問時長、平均訪問深度、充值用戶等。
  • 消費類標簽:收入狀況、購買力水平、已購商品、購買渠道偏好、最后購買時間、購買頻次。
  • 商品品類標簽:高跟鞋、靴子、襯衫、法式連衣裙、肉脯、牛肉干、掃地機器人、智能音響等。
  • 社交類標簽:經?;钴S的時間段、活躍地點、單身、評價次數、好評度等。

整個畫像體系包含標簽建模、畫像系統、畫像應用,那從數據產品層面來看,如何0-1建立用戶畫像體系呢?接下來我們按照如下結構進行展開:

  1. 業務需求分析
  2. 建設標簽體系
  3. 建設畫像系統
  4. 畫像應用

第一步:業務需求分析

用戶畫像體系的建設不能憑空捏造,需要以經濟建設為中心,根據實際的業務需求,考量畫像系統能為業務帶來的價值,所以我們第一步要做的是分析業務需求。

明確用戶畫像服務于企業的對象,如產品、用戶運營、活動運營、市場、風控等部門;再根據業務方需求,明確未來產品建設目標和用戶畫像分析之后的預期效果。

就公司整體而言,他的目標是提升平臺整體的收益,過程中會驅動產品、運營、數據分析、市場、客服等同事協同工作,畫像會更加關注如何進行精細化運營,提升公司營收上;

就運營人員娜美而言,她的目標是提升轉化率,過程中會采用內容的個性化推送的策略、用戶精準觸達,畫像會更加關注用戶個人行為偏好上;

就數據分析人員羅賓而言,她的目標是做用戶的流失預警,做針對性的精準營銷,那過程中就需要分析用戶行為特征,用戶的消費偏好;

在需求分析階段,我們需要分析業務過程,各部門核心關注點、部門KPI、組織結構、用戶行為路徑、功能流程圖。此處分析過程跟埋點業務需求分析類似,詳情可查看埋點業務需求分析,此處不做展開。

第二步:搭建標簽體系

從數據產品建設標簽體系來看,可以根據標簽的統計方式,將標簽分為3類:統計類標簽、規則類標簽、預測類標簽;

1. 統計類標簽

用戶畫像最為基礎常見的標簽,統計類標簽值統計用戶相關數值、客觀描述用戶狀態的標簽,這類數據通??梢詮挠脩糇詳祿⒂脩粼L問、消費統計中可以得出。

例如對于某個用戶來說,其性別、年齡、城市、星座、近7日活躍天數、近7日活躍次數、累計購買金額、累計購買次數、月均消費金額等字段,

2. 規則類標簽

基于用戶行為及確定的規則產生,在實際開發畫像的過程中,根據業務的需要,由運營人員和數據人員共同協商制定,包含活躍度標簽、RFM標簽等。例如,對平臺上“交易活躍”這一口徑的定義為“近90天交易次數>3”。

下面由草帽小子來介紹,常用的用戶活躍度標簽、RFM標簽的劃分方法。

(1)用戶活躍度標簽

實際業務場景中會涉及根據用戶的活躍情況,給用戶打上高活躍、中活躍、低活躍、流失等標簽。

那這個過程中高中低的時間范圍是如何劃分的呢?

在這里,路飛的拍腦門可行不通,標簽的建設講究定義有依據,建設有方法

首先劃分用戶的流失周期,通常有2種方法:

一是拐點理論:X軸上數值的增加會帶來Y軸數值大幅增益(減益),直到超過某個點之后,當X增加時Y的數據增益(減益)大幅下降,即經濟學里面的邊際收益的大幅減少,那個點就是圖表中的“拐點”。

比如圖中流失周期增加到5周的時候,用戶回訪率的縮減速度明顯下降,所以這里的5周就是拐點,我們可以用5周作為定義用戶流失的期限,即一個之前訪問/登錄過的用戶,如果之后連續5周都沒有訪問/登錄,則定義該用戶流失。

二是統計用戶最后一次訪問與倒數第二次訪問之間的時間間隔,可認為大于這個時間間隔的用戶基本不會再訪問,即用戶已流失。查看歷史數據可以了解到用戶最后一次訪問與倒數第二次訪問間隔30日以上的用戶不足10%,可以認為大于這個時間間隔的用戶為“流失用戶”。

劃分完流失周期之后,根據用戶的活躍情況進一步將其劃分高中低活躍。對歷史數據,按照二八原則進行劃分。

例如分析得出活躍次數10次以上的用戶占近30日訪問用戶量的20%,則這批為“高活躍用戶”;進一步把活躍5-10次的用戶劃分為“中活躍用戶”;把活躍1-5次的用戶劃分為“低活躍用戶”。

(2)RFM標簽

RFM模型主要由3個基礎指標組成:最近一次消費時間、消費頻率、消費金額。根據歷史數據,查看用戶量的占比,可按照二八原則進行劃分,得到細分標簽。

  • R:如歷史數據中80%的用戶最近訪問<60日為“近”,用戶最近訪問>=60日為“遠”。
  • F:如歷史交易訂單量80%的用戶訂單量<5單為“低頻”,訂單量>=5單為“高頻”。
  • M:如歷史交易訂單金額80%的用戶交易金額<500元為“低額”,交易金額>=500元的為“高額”。

3. 預測類標簽

基于用戶的屬性、行為、位置和特征,運用決策樹算法、回歸算法等挖掘用戶的相關特征,挖掘其潛在需求,針對這些潛在需求,給用戶打標簽,配合不同的營銷策略,進行推送。

例如,根據一個用戶的消費習慣判斷,他對商品的偏好程度;根據用戶的退差評等行為,預測其風險程度。

一般統計類和規則類標簽即可滿足應用需求,在開發過程中占有較大比例。機器學習挖掘類標簽多用于預測場景,如判斷用戶風險、用戶購買商品偏好、用戶流失意向等,其開發周期長、開發成本高。

例如,今日頭條上積累了大量與數據產品主題相關的文章、帖子等文本數據,由于歷史原因,這些文章沒有做內容分類,也沒有打上相應的標簽,不便于對內容進行管理。現在需要對帖子打上相應的主題標簽。

一是根據已經劃定的文章類型,將為做過分類的文章自動劃分到相應類型下

二是支持文章的集約化管理,根據文章內容自動為每篇文章打賞與其主題相關的標簽

(1)特征選取及開發流程

數據分類:人工對一批文檔進行準確標注,作為訓練集樣本,未進行標注的一批文檔作為測試集

數據預處理:對測試集和訓練集文本進行分詞處理,建立詞料庫,去掉停用詞、語氣詞等

樸素貝葉斯分類:從精度、召回率、F-測度值3方面來劃分文章分類

(2)計算標簽權重

用戶在平臺上的不同行為,在用戶標簽層面權重不同,比如用戶購買某商品的行為權重要比用戶添加購物車、收藏某商品、瀏覽某商品行為權重依次要高。

在標簽制定過程中用戶畫像建模人員與業務人員需要密切溝通,結合業務場景制定不同行為類型和權重。常用的確定權重的方法有TF-IDF詞空間向量、時間衰減系數。

1)TF-IDF詞空間向量

TF-IDF是一種統計方法,用以評估一個字或詞相對于一個文件集或一個語料庫中其他詞的重要程度。字詞的重要性與它在文件集中出現的次數,成正比;與它在語料庫中出現的次數成反比。

2)時間衰減系數

當用戶數據達到足夠密集的程度后,用戶身上打的標簽對應的屬性會表現出較高的穩定性,這種穩定性與用戶長期行為形成的個人特征相匹配。

用戶標簽權重=行為類型權重*時間衰減*用戶行為次數*TF-IDF計算標簽權重

第三步:建設用戶畫像系統

畫像系統作為支撐系統,主要目標用戶是市場、運營、產品、數據分析師等人員,滿足其用戶分析、標簽查詢、營銷活動對接的需求。所以畫像系統的設計需要考慮功能上的用戶分析需求,以及非功能上的接口開發需求。

1. 功能需求

功能上可劃分為:首頁畫像數據、標簽管理、用戶查詢、用戶分群等。

  • 首頁畫像數據,展示用戶數據的整體情況,包含用戶的基本特征,如性別、年齡、地域、職業分布等基礎信息;用戶價值特征,如用戶活躍度、會員等級、流失預警、用戶價值RFM分布等信息。
  • 標簽管理,供數據人員提供標簽的增、刪、改、查等操作,包含標簽分類、新建標簽、標簽審核、標簽下線、異常標簽等。
  • 用戶查詢,主要能力包含通過輸入用戶ID,來查看用戶畫像等詳情數據,如用戶的基本信息、用戶屬性信息、用戶行為等數據。
  • 用戶分群,應用場景主要為業務使用標簽時,往往不會只使用一個標簽進行推送,更多的情況下需要組合多個標簽來滿足業務上對人群的定義,用戶分群相當于制作一個人群模版,在不同場景下做人群的推送。

添加分群時通常會配置人群名稱、滿足的條件,計算覆蓋的人群數量,推送到消息通知、電子郵件、短信。

2. 非功能需求

非功能性需求主要包含接口需求,保障畫像系統數據與各系統之間打通,如push推送系統、營銷系統、廣告系統、推薦系統、BI等平臺,并且保證各系統數據的實時更新,避免同源不同數的問題。

標簽體系和用戶畫像系統都搭建完成了,那用戶畫像具體在哪用、怎么用,能給業務帶來哪些價值呢?

第四步:畫像應用

在廣告投放、電商等領域,用戶畫像常用來作為精準營銷、推薦系統的基礎性工作,主要應用場景包含3類:精準營銷、用戶分析、個性化推薦。

1.?精準營銷

根據歷史用戶特征,運營人員可以分析產品的潛在用戶和用戶的相關需求,針對特定群體提供個性化營銷服務。常用的有短信、郵件、站內信、push消息的精準推送,客服針對用戶的不同話術、針對高價值用戶的極速退款退貨等VIP服務。

短信/郵件/push營銷

日常生活中會從多個渠道收到營銷信息,一條關于紅包到賬的短信消息推送,可能會促使用戶打開很久沒訪問的app,一條關于心愿單內的降價消息,可能會刺激用戶打開推送鏈接,直接購買。

借助畫像系統進行營銷需要注意的有:

短信敏感度:有的用戶對營銷短信的敏感度較差,比如從歷史數據來看,推送其10次短信,只打開過1次或從未打開過??紤]到短信渠道需要營銷成本,可以把這批用戶排除掉,并減少對用戶的干擾。

無效手機號:對于平臺上隨意填寫非自己的手機號、手機號已經作廢/更換,接收到短信回復了“TD”的用戶來說,短信無法接收,屬于短信黑名單,這類用戶也需要排除

對營銷商品感興趣的用戶:近期曾多次瀏覽、收藏或是加購、下單行為的用戶,是某累商品的潛在意向用戶,可以通過滿減優惠券或是紅包的方式進行營銷。

客服話術

當我們在向某平臺的客服部門投訴、咨詢或反饋意見時,客服人員可以準確的說出我們在平臺的購買情況,上一次咨詢問題的處理結果等信息,針對性的提出解決方法,對于高價值用戶提供VIP客服通道等專項服務。

2.?推薦系統

應用的運營者,可以通過個推用戶畫像中的性別、年齡段、興趣愛好、瀏覽購買行為等標簽,給用戶推薦不同的內容。如今日頭條上的個性化文章內容推薦、抖音上基于用戶畫像做的個性化視頻內容推薦、淘寶上基于用戶瀏覽行為等畫像數據做的個性化商品推薦等。

3.?數據分析

用戶畫像的標簽可應用于各類分析,包含用戶分析、訂單分析、漏斗分析、人群特征分析等。

總結

本文主要從數據產品層面來看,如何0-1建設用戶畫像體系??催^草帽小子之前寫的埋點、指標體系文章的朋友可能已發現,畫像體系搭建跟埋點、指標建設一樣,也是遵循普通的產品設計流程,從需求分析、到標簽/指標設計、后臺設計,最終再應用于業務。

正所謂萬變不離其宗,就像路飛的技能看起來千變萬化,其核心點都是在用橡膠能力做各種變化。數據產品的各種變化形式,其核心在于業務。

 

作者:草帽小子;公眾號:一個數據人的自留地,wx:luckily304

本文由 @草帽小子 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 建立標簽體系的三個維度(統計類、規則類和預測類)和用戶畫像以及業務需求提煉的關系是啥呢?

    來自北京 回復
  2. 從書上抄得內容有些多

    來自北京 回復
  3. 有需要進一步交流的朋友,可以加我微信,進畫像交流群溝通,備注:用戶畫像交流群

    來自北京 回復
    1. 你好,你微信多少?

      來自廣東 回復
    2. 公眾號:一個數據人的自留地,wx:luckily304

      來自北京 回復
  4. 感謝分享,很適合入門了解

    來自河南 回復