MarTech?-CDP實戰手冊:CDP交付階段-標簽規劃(十)

2 評論 1667 瀏覽 8 收藏 12 分鐘

MarTech?-CDP實戰手冊是作者在平臺分享的一個系列文章,之前作者和我們分享了交付階段的相關內容,這篇文章,一起來解析一下標簽部分怎么做。

標簽規劃

標簽規劃需要先了解標簽的分類,根據標簽的分類進行梳理,分類包含事實標簽、規則標簽、預測標簽。

1)事實標簽

屬性標簽是相對比較穩定的標簽,主要以客戶的性別、年齡、地區等,在梳理屬性標簽時需要考慮相同屬性多源流入,如果有數據中臺則需要數據中臺進行融合,輸出唯一屬性,若無數據中臺則需在CDP中進行屬性的來源的優先級調配,保證屬性標簽數據質量。

2)規則標簽

沒有直接對應數據,需要通過規則進行定義,規則包含屬性、行為、標簽的交并排進行配置產出,規則標簽初期往往不會特別多,因為屬于靈活可配置的標簽,事實標簽足夠全面,基本上可以覆蓋所有規則標簽。規則標簽構建類型有商業價值標簽、用戶偏好標簽、生命周期標簽、營銷時機標簽。

3)預測標簽

參考已有事實數據,來預測用戶的行為或偏好。比如用戶a的歷史購物行為與群體A相似,使用協同過濾算法,預測用戶a也會喜歡某件物品。

4)標簽規劃流程

業務場景梳理-標簽規劃-行為建模-口徑確認-數據加工-標簽驗證-規范運營。

5)業務場景梳理

業務場景確認:一般根據業務部門或生命周期進行梳理,規劃業務場景,并通過業務場景進行流程梳理,根據每個節點進行標簽規劃。

① 生命周期確定業務場景:

② 增長階段確定業務場景:

③ 業務需求確認業務場景:

1. 標簽規范

因格式問題無法直接展示表格,需要表格模板可留言溝通。

標簽規劃表:

標簽命名規范:

標簽舉例

2. 行為模型

行為模型需要進行行為數據源梳理,如果有第三方接入的話則直接對接第三方即可,業務內部部分行為也需要進行梳理,構建統一的行為模型,幫助CDP進行實時、離線的行為接入。

構建并梳理建立用戶行為模型,先基于業務場景,構建業務模型,通過統一的建模,統一業務口,根據數據實際情況,建立數據模型,并基于對齊的數據口徑上開發。

行為數據模型在車企行業通常包括“用戶行為主題”,“訂單主題”,“用戶權益主題”,通過多個業務主題可以比較容易的描述常見的用戶行為。

字段介紹:模型名稱:模型寬表名稱/ 行為名稱;單一行為名稱/ 模型;模型字段:可包括維度度量型字段;數據口徑:關聯哪些維度,事實表的哪些字段,進行建模。

3. 口徑確認

口徑確認其實分為兩步,在原有系統中肯定涉及到部分標簽,需要將之前標簽與新標簽進行映射,名稱未改則不需要確認,如果有偏差或者修改或者通過標簽調研發現多個業務標簽命名或規則不一致,則需要進行各個業務線口凈統一。

4. 數據加工

數據加工要考慮兩點,其一為數據加工清晰化流程,其二則為數據加工過程中的安全性。

數據加工流程圖:數據源-數據中臺(數倉)-CDP應用數據構建,從ODS進行數據清洗后,進入到DWD層,再流入DWS層,其中DIM層可與DWD和DWS聯動應用,在進入DM層進行整合,最終流入CDP進行ADS構建從而提供給上層進行應用。

數據安全:數據安全屬于在數據中臺的范圍內要考慮的,但在標簽規劃時涉及到比較多的敏感數據,因此需要在這個階段考慮到數據安全性的問題,給相應的數據中臺提出安全性需求,確保數據傳輸的的安全穩定。每個公司的安全范圍可顆粒度不同,而且數據安全是個大項這里不做額外拓展。

需要遵循以下原則:

5. 標簽驗證

數據源質量驗證,對ODS、DM層進行數據質量評估,真實性 > 60% 被認為較為可信。

八維評估數據源各數據項的質量:

  1. 完整性:空值檢查;
  2. 規范性:引證數據;
  3. 及時性:延時時長;
  4. 唯一性:重復性檢查;
  5. 一致性:數據比對;
  6. 關聯性:業務檢查;
  7. 有效性:字段是否符合格式;
  8. 真實性:與實際值比較。

標簽表計算準確度:繼承DM層的各數據項完整性、真實性,且要求基于此數據項的標簽計算準確度達到99.9%.

  • 與DM層進行比較,確保數據一致。
  • 邏輯錯誤驗證:如年齡是否超出正常駕齡范圍等。
  • 取值單一性驗證:確保一個主體在一個標簽上只有一個值,如同一個客戶在性別標簽上,同一時間點不能既有“男”取值、又有“女”取值。
  • MECE原則驗證:確保通過規則切片后,各標簽值對應的用戶量累加是全部用戶,不能少也不能多。
  • 模型算法合理性驗證:模型算法的設計邏輯符合業務邏輯,測試集與訓練集樣本分配合理。

業務準確度:在業務過程中驗證,通過設計業務策略或AB測試,從業務角度評估標簽值的準確度。

  • 業務反饋驗證:銷售顧問或其他業務人員可在標簽使用過程中給予反饋,并提交開發進行數據源數據項的修正。
  • 通過設計問卷調研等相關活動收集數據,增加數據源可信度。
  • 模型算法準確率驗證:用AUC指標來衡量模型的準確率,一般AUC>0.8是比較好的表現。
  • 通過使用相關標簽圈定客群做POC驗證,設置AB測試,根據觸達客群后的轉化效果對比對照組的表現來評估;若顯著低于對照組,則需要排查標簽準確度。

6. 規范運營

除了在標簽設計需要規范化設計外,在標簽實施過程也需要有標準化的流程進行把控,保證標簽有序的開發實施。

與此同時需要進行標簽的權限和審核流程的規劃,標簽權限體系需要細化和內置到系統中,總得來說,有兩類權限可以會直接影響到業務流程和數據安全。

業務權限:通過將權限授權給固定角色,進而對于功能權限進行精細化管控;以下為舉例的角色打來,根據實際企業和業務會有更細分的范圍。

數據權限:通過將標簽可擁有,可查看的權限,授權給標簽的創建和使用者。

7. 經驗總結

標簽規劃:

切記大而全:標簽隨著業務走,大而全的標簽會使標簽開發成本、運營成本、運維成本增加,標簽設計時應該場景化,開發采取少兒精、小步快跑的規劃思路,優先實時數據質量高、業務需求強的標簽。

標簽質量:

ID打不通,會導致多端多平臺無法實現標簽一體化,往往會出現業務系統上標簽A,SCRM中也出現類似標簽A的標簽,導致標簽定義一致但為打通,因此應該從數據治理曾進行oneid體系的構建,打通全域數據,并將標簽統一化管理。

標簽無法驗證,如果前期未考慮標簽的驗證流程,會導致標簽構建完成后無法對標簽進行驗證草草上線可能對運營造成偏差,因此在抱歉構建時就需要考慮標簽數據驗證及業務驗證的雙重驗證,對不同類型的標簽進行標準化逐層驗證。

數據質量太差,數據質量差會導致標簽不完善甚至無法落地使用,對于這點在規劃階段是要進行數據勘察,確定哪些高優標簽的數據出現缺失,優先對于該數據員進行數據治理和數據補全,確保標簽可實施可落地。

本文由 @光波 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 感謝作者 請教一下個體標簽結果對外輸出 會有什么邊界和注意事項么?

    來自浙江 回復
  2. 請問一下樓主,數據中臺的數據進入到CDP平臺后,是在CDP平臺還會二次過濾嗎,過濾出自己想要的數據,并打上相應的標簽, 還是所有的數據處理都在數據中臺過濾處理,有什么需求,就給數據中臺的數倉提了,他們開發完了,提供給上層的CDP平臺

    來自湖北 回復