用戶畫像規劃流程和方法

4 評論 32921 瀏覽 192 收藏 9 分鐘

編輯導語:如今在這個大數據時代,“用戶畫像”這個詞經常出現,它跟精準營銷掛鉤,可以根據一個人的興趣、地理位置等進行精確的推送,達到良好的營銷效果;本文作者分享了關于用戶畫像規劃的流程和方法,我們一起來看一下。

互聯網行業飛速的發展,帶動行業業務量激增,同時伴隨數據量的增加,互聯網各行各業慢慢形成頭部企業,2/8原則下長尾企業也越來越多;因此,在大數據量和激烈競爭下,如何更好的對產品進行營銷,如何制定價格策略,越來越重要。

那么,如何制定準確的營銷和價格,就需要我們針對不同人群,不同個體的特點進行精細化推薦,所要本章介紹了如何進行用戶畫像。

文章結構:

一、什么是用戶畫像

用戶畫像就是對用戶按照一定的規則進行統計,劃分,從而能夠指導用戶推薦,客戶分層運營,達到營銷效果。

昨天:手機APP大爆發是隨著手機硬件的發展而發展起來的,發展前期大量APP為搶占市場紛紛上線;用戶畫像只是為了指導產品設計,主要用于產品設計前夕的用戶訪談、用戶調研的前期工作,而且一般覆蓋的人群比較狹隘,精準度差,產品經理設計產品全靠感覺。

今天:行業競爭越來越大,行業產生的數據量也越來越大,各大公司開始建造自己的數據倉庫;那么如何應用數據倉庫中的數據,如何進行精細化運營,用戶畫像越來越受到重視。

明天:隨著大數據技術的成熟應用,用戶畫像標簽將越來越多,目前互聯網行業中比較成功的標簽系統是淘寶的千人千面,技術創新必將推動用戶畫像的精準度。

二、用戶畫像常用場景

用戶畫像概況可應用于一下三個場景:

  • 產品設計:開發前期的產品定位設計;
  • 產品營銷:指導運營對特定用戶進行推送活動信息,推廣信息,個性化推薦等。
  • 產品決策:分析用戶畫像統計對產品的發展現狀和發展趨勢進行預測,及時調整產品發展路線。

按照用戶標簽的生產方式可分為:

統計標簽:現有的可以直接從數據中提取出來的標簽;包括用戶自然屬性,用戶行為統計等信息。

規則標簽:自定義規則進行標簽建模;根據業務流程提取需要統計的標簽。

算法模型標簽:根據機器學習等算法進行用戶行為預測分類;具有不確定性、開發周期長、成本高,因此系統中此類標簽數量較少。

三、用戶畫像系統搭建流程

1. 數據采集

對用戶數據進行采集,數據預處理,數據挖掘和過濾等手段得出期望的數據集。

用戶數據一般分為埋點數據和業務數據:

  • 埋點數據:根據用戶的行為特征進行埋點,將得到的數據進行處理存儲;
  • 業務數據:用戶的姓名、年齡、地理位置等自然屬性,同時包括用戶購買、用戶評價、用戶評論等隱形數據。

具體采集方法可以使用如下算法模型:

文本挖掘模型(TF-IDF):處理文本類型,提取數據信息。

TF是詞頻,IDF是逆向文件頻率,TF-IDF是詞頻和逆向文件頻率的乘積。

Nij就是詞i在j文章中出現的次數,分母就是文章的總詞數。

D就是語料庫中文件總數,下面分母就是詞i出現的文檔數,然后取對數。

該算法可以直接調用python庫Sklearn進行實現,但是該算法比較單一,不考慮詞條在文章中的位置,不能準確描述詞的重要程度,一般需要結合其他其他算法或者增加權重改進。

聚類算法:聚類算法較多,如ANN神經網絡和貝葉斯等,聚類主要是針對冷啟動用戶、用戶分群營銷等目的;具體算法相對復雜,目前算法應用多使用python的各種庫如Sklearn,包括一些框架tensorflow、caffe等。

相似度模型:一般使用相似度模型進行輔助用戶分群,常用的有邏輯回歸、線性回歸、余弦相似度、皮爾森相似度等。

具體說下余弦相似度:

實例:

用戶1和用戶2通過公式計算相似度為0.945406,是不是可以解釋為兩個用戶可以劃分為同一類人,進行用戶分群(計算過程只是用于解釋算法,無其他意義)。

若已有數據倉庫,數據采集相對比較輕松,可參考文章“每日優鮮如何搭建數據倉庫?”。

2. 用戶維度分析

用戶分析具有多維度,隨時間更新的特點,包括用戶年紀、學歷、興趣、消費水平等都容易變化。

因此維度信息應該隨著用戶偏好發生變化,因此,在標簽系統中需要有新增標簽功能。

3. 維度標簽化

用戶畫像最終的實現應該是對維度進行標簽化,常用MECE法則進行標簽化,防止標簽界限不清晰。

標簽需要根據需要進行逐級拆分,例如:

4. 標簽映射,接口封裝

用戶畫像數據導入服務器中,為后續推薦系統,營銷活動服務;封裝成API可以作為數據服務的內容,對其他系統提供數據支持。

5. 用戶畫像評估

對畫像進行評估:

用戶覆蓋率:用戶畫像具體能夠覆蓋到多少用戶,有些用戶畫像可能覆蓋總用戶的50%或者80%;所以覆蓋率是用戶畫像應用的一個評價,覆蓋率越高,對后續精準營銷的策略選擇越準確。

準確率:模型的準確性,如上所述,使用算法模型導致的用戶分群錯誤或者對用戶的購買意向預測錯誤,將直接影響購買率,影響GMV。

可拓展:用戶畫像在維度刻畫應該是可擴展的。

及時性:如果用戶畫像服務到實時推薦系統中還需要用戶畫像的及時。

四、總結

用戶畫像結合大數據技術使用戶刻畫更加細致、及時,對日趨競爭激烈的互聯網浪潮起到越來越重要應用。

 

本文由@汪仔2296 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash, 基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 好像什么都說了,又好像什么都沒說。

    來自北京 回復
    1. 說的太多太技術,說的太少內容不深刻。用戶畫像需要了解兩件事情:從技術層面講需要了解數倉的搭建,相對應技術架構;從產品層面講需要明確業務需求,構建標簽體系(增量過程)。

      來自上海 回復
    2. 這兩句話總結的到位,大佬實錘。

      來自北京 回復
  2. 各位大佬,若有工作機會請幫忙推薦下

    來自上海 回復