標簽分類的三種方式:按用途、按統計方式和按時效分類
編輯導語:標簽體系是整個用戶畫像建設的基礎,若沒有建設好,對后面的調研及規劃會有一定的影響,標簽體系的分類能夠給我們節省時間、提高效率。本文對標簽體系進行簡單的介紹,希望對你進行標簽分類有幫助。
標簽體系是整個用戶畫像建設的地基,不打好地基,摩天大樓就不可能平地而起。草帽小子在做調研及規劃過程中,就深深認識到標簽體系的重要性,接下來草帽小子會重點介紹標簽體系。
一、標簽分類
不同公司的標簽分類有所不同,目前市面上有三種常用的標簽分類方式:
- 按用途分類,可分為基礎信息、用戶行為、業務偏好、場景標簽;
- 按統計方式分類,可分為事實類標簽、規則類標簽、預測類標簽;
- 按時效分類,可分為靜態標簽、動態標簽。
1. 按用途分類
按用途分類的標簽,可分為基礎信息、用戶行為、業務偏好、場景標簽。通常面向產品/業務人員,分類時需要根據實際的業務需要進行類別劃分,以便適配業務人員在通用場景和定制場景下標簽的使用。
1) 基礎信息
標簽基礎信息標簽,是用于描述用戶的基礎屬性,包含自然屬性、社會屬性、業務屬性等,如性別、年齡、常駐城市、RFM、會員等級等標簽。
① 年齡
人們在一生中購買不同的商品和服務,在幼年時吃嬰兒食品,在發育時期和成年時期吃各類食物,在晚年吃特殊的低熱量食品。人們對衣服、家居和娛樂等的喜好也跟年齡有關,這也就是為什么年齡是畫像中常用的標簽。
② 職業和收入水平
職業影響一個人的消費模式,如藍領工人通常會買工作服,公司的董事長則會買名牌服裝及高端產品。不同職業的人群收入水平不同,針對高收入水平的消費者,可向其推薦更優質的商品,促進商品轉化率。
2) 用戶行為標簽
心理學家馬洛斯認為,在某一特定時間,人們會受到特定需求的趨勢。
他的理論是,人類的需求是按層次排列的,從最迫切的需求到最不迫切的需求。按重要程度排列,這五種需求分別是:生理需求、安全需求、社會需求、尊重需求和自我實現需求。
消費者總是先尋求滿足最重要的需求,當最重要的需求得到滿足之后,他就會尋求滿足下一個最迫切的需求。
用戶行為類標簽,主要通過洞察用戶在最近一段時間內的各類行為,如瀏覽、搜索、收藏、加購等,進一步提煉出用戶的需求。
用戶搜索或加購某一類型的商品頻率越高,其消費需求就表現得愈加強烈。提煉出的常見標簽包括近7天上網時段、近30天收藏品類、近30天消費頻度等。運營者可通過組合圈選擇有多種行為的用戶,為其定向推送相關商品。
3) 業務偏好標簽
業務偏好標簽,用于描述用戶的偏好業務內容,根據公司業務不同,劃分不同的分類,通常電商行業業務偏好類標簽包含運動戶外、數碼家電、食品保健等,其他行業的業務偏好標簽根據實際業務而定。
一般情況下,以上這3類標簽即可滿足常用的標簽使用需求,因為其已描述who(基礎信息)do(用戶行為)what(業務偏好)的整個過程,該用戶的行為合集構成了整個用戶畫像。
但隨著標簽的使用,業務人員發現,經常會有些同類似的活動,使用到了類似的標簽組合,類似的人群包。于是這類標簽組合便可沉淀下來,針對特定場景使用。
4) 場景應用標簽
場景應用標簽,用于特定場景下使用,由業務使用經驗積淀而來,例如618/雙十一活動標簽,雙十一預付定金人群、雙十一下單人群等。標簽建設初期可不設置此分類。
2. 按統計方式分類
按統計方式分類的標簽可分為事實類標簽、規則類標簽、預測類標簽。與按用途分類不同的是,按統計方式分類的3類標簽通常面向研發人員,意指標簽是按何種方式計算而來,其復雜程度、產研成本由低至高。
1) 事實類標簽
事實類標簽是用戶畫像最基礎、最常見的標簽,通常是基于原始數據清理后的歸類,用于描述客觀事實。例如,姓名、會員等級、終端類型、購買次數、購買金額等。
2) 規則類標簽
規則類標簽,顧名思義,是基于確定的規則而產生。與事實類標簽不同的是,規則類標簽擁有更多的業務屬性,其業務規則需與業務人員共同制定。例如,將“活躍用戶”標簽可定義為,“過去30天發生a行為x次”&“過去30天發生b行為x次”,進行綜合評定。
① 用戶活躍度標簽
實際業務場景中會涉及根據用戶的活躍情況,給用戶貼上高活躍、中活躍、低活躍、流失等標簽。那這個過程中高中低活躍度對應的時間范圍是如何劃分的呢?
在這里,靠拍腦門可行不通,標簽講究定義有依據、建設有方法。
首先劃分用戶的流失周期,運用拐點理論:X軸上數值的增加會帶來Y軸數值大幅增益(減益),直到超過某個點之后,當X增加時Y的數據增益(減益)大幅下降,即經濟學里面的邊際收益的大幅減少,那個點就是圖表中的“拐點”。
比如圖中流失周期增加到5周的時候,用戶回訪率的縮減速度明顯下降,所以這里的5周就是拐點。
我們可以用5周作為定義用戶流失的期限,即一個之前訪問/登錄過的用戶,如果之后連續5周都沒有訪問/登錄,則定義該用戶流失。劃分完流失周期之后,初期可根據根據四分位數,將用戶的活躍情況劃分為高中低,后期根據數據情況更新規則。
② 四分位數
也稱為四分位點,是指在統計學中把所有數值從小到大排列并分為四等分,處于三個分割點位置的數值。
如歷史數據,選擇近1個月訪問APP次數在0-8之間,則取3/4分位點為6、1/4分位點為2。
- 高活躍用戶:近1個月訪問APP次數在[6,8]區間的用戶
- 中活躍用戶:近1個月訪問APP次數在[2,6]區間的用戶
- 低活躍用戶:近1個月訪問APP次數在[0,2]區間的用戶
③ RFM標簽
根據美國數據庫營銷研究所Arthur Hughes的研究,客戶數據庫中有3個神奇的要素,這3個要素構成了數據分析最好的指標:最近一次消費時間、消費頻率、消費金額。
- 最近一次消費(Recency):指用戶上一次購買的的時間,一般上一次消費時間越近的顧客是質量更佳的顧客。最近一次消費是維系顧客關系的一個重要指標。
- 消費頻率(Frequency):顧客在限定時間周期內消費的次數。消費頻率高的顧客,也是滿意度最高的顧客。根據這個指標,可以把客戶分成幾等份,相當于劃分了一個忠誠度的階梯。
- 消費金額(Monetary):消費金額時產能最直接的衡量指標,也可以驗證“二八定律”,公司80%的收入來自于20%的顧客。
我們在設計RFM標簽時,可根據二八定律來進行標簽分級。
④ 二八定律
二八定律又名80/20定律、帕累托法則,它是在19世紀末由意大利經濟學家帕累托發現的。
帕累托認為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數,卻是次要的。給一個公司帶來80%利潤的是20%的客戶,按照這個原則,如果能把這20%的客戶找出來,提供更好的服務,這對于公司的發展和業績增長起到至關重要的作用。
- R:如歷史數據中80%的用戶最近訪問<90日為“近”,用戶最近訪問>=90日為“遠”。
- F:如歷史交易訂單量80%的用戶訂單量<10單為“低頻”,訂單量>=10單為“高頻”。
- M:如歷史交易訂單金額80%的用戶交易金額<2000元為“低額”,交易金額>=2000元的為“高額”。
客戶類型可劃分為:
- 重要價值客戶:R↑ F↑ M↑,消費金額、消費頻次大且最近有消費的用戶,則為優質客戶;可傾斜更多資源、提供VIP服務、專屬客服通道、個性化服務
- 重要保持客戶:R↓ F↑ M↑,消費金額和消費頻次大,但最近無消費,需要喚回;可提供有用資源,通過續訂或更新產品贏回他們
- 重要發展客戶:R↑ F↓ M↑,消費金額大,且最近有交易,但消費頻次不高,需要重點識別;可交叉銷售,提供會員/忠誠計劃,推薦其他產品
- 重要挽留客戶:R↓ F↓ M↑,消費金額大,但消費頻次不高且最近吳曉飛,此為最潛在有價值的客戶,需要挽留;可采取push消息觸達,回訪等措施,來提高留存率
- 一般價值客戶:R↑ F↑ M↓,消費頻次高且最近有消費,但消費金額較??;需要進一步挖掘,向上銷售更高價值的產品
- 一般保持客戶:R↓ F↑ M↓,消費頻次高,但最近無消費且消費金額較?。豢上蛏箱N售更高價值的產品
- 一般發展客戶:R↑ F↓ M↓,最近有消費,但消費頻次及金額較??;可按消費類型推薦其感興趣的產品
- 一般挽留客戶:R↓ F↓ M↓,無消費的新用戶;可開展活動,免費試用,提高客戶興趣,建立品牌認知度
3) 預測類標簽
預測類標簽,基于現有事實及規則無法得出,需要運用決策樹算法、貝葉斯算法等進行數據挖掘與訓練,得出標簽預測結果。
預測類標簽復雜度高、開發周期長、開發成本高,且需要算法工程師參與,通常此類標簽的占比較少。
3. 按時效分類
按時效分類,可分為靜態標簽、動態標簽,方便業務人員在需求提出時做好時間維度的限制,同時方便開發人員在標簽更新時,設置靜態標簽的更新時間更長,提升數據產出效率。
1)靜態標簽
靜態標簽通常用于描述固有屬性,不隨時間的變化而改變,如性別、身高、體重等。
2)動態標簽
動態標簽需要動態更新,來保持標簽的有效性,如近7天購買次數、近30天加購次數等。
二、標簽分級
隨著標簽的增多,當標簽數量發展到成百上千量級時,業務方要從中找一個標簽就會十分困難。所以標簽在建設初期就需要進行分級分類的管理,就像整理電腦文件夾一般,分類清晰的標簽更便于查詢使用。
標簽常用的分級結構為:一級標簽、二級標簽、三級標簽、四級……逐級往下分。
注意:建設初期要注意的是層級不必生搬硬套、劃分過細,根據標簽建設實際情況劃分即可。如果公司只有幾十個標簽,則劃分至二級足矣,過細反而累贅。
草帽小子,數據產品經理一枚;用戶畫像、埋點、指標體系、BI、廣告投放等系列作者;《大數據實踐之路:數據中臺+數據分析+產品應用》作者;“數據人創作組聯盟”成員。
本文由@一個數據人的自留地 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
很實用