CDP的體系化搭建:從應用架構角度認識CDP

17 評論 31905 瀏覽 260 收藏 18 分鐘

本文講述了CDP的概念和架構,并按照【數據收集】→【數據預處理+建立映射關系】→【用戶細分】→【數據應用】→【報表輸出】的功能邏輯進行架構分析。

互聯網行業各種新概念總是層出不窮。

其實依據CRM的定義:以客戶為中心,運用通信技術進行市場營銷、銷售管理、客戶關懷、服務和支持,通過提高客戶忠誠度和保有率來提升企業的盈利的管理理念。

嚴格來說CDP也是屬于CRM范疇的。但為了方便闡述,本文仍然將CDP與CRM區分開來,下文所描述的CRM也僅指狹義上的“營銷型CRM”。

一、概念解釋

CDP(Customer Data Platform)即客戶數據中臺,是通過收集并處理用戶在第一方/第二方/第三方平臺的數據,實現用戶細分,進行精準的自動化營銷和廣告投放的系統。旨在挖掘開發潛在客戶,以及維系老客并提升其價值。

  • 【用戶】包含已產生購買行為的用戶,以及未產生購買行為的潛在用戶;
  • 【第一方平臺】企業自有的網站/APP/小程序和CRM等;
  • 【第二方平臺】廣告商和不限于社交/電商/資訊/視頻等其他合作媒體;
  • 【第三方平臺】電信運營商等;
  • 【數據】包含基本屬性信息(姓名/電話/郵箱/地址/各平臺賬號等個人信息),以及行為數據(瀏覽/點贊/收藏/分享/購買等關鍵交互操作)。

二、架構分析

通過上面的定義,大家可以暫時將CDP粗略理解為一個數據分析平臺。

其功能邏輯比較簡單,可大致分為五步:【數據收集】→【數據預處理+建立映射關系】→【用戶細分】→【數據應用】→【報表輸出】。下文我也將按照這個功能邏輯進行架構分析。

1. 數據收集

對于自有的網站/APP/小程序中用戶數據的收集,一般是采用埋點的方式;對于其他渠道(包含第一方平臺的CRM系統,以及第二方和第三方平臺)的用戶數據的收集,則是通過數據接口等方式實現;如果企業有線下渠道,也可以接入CDP。

針對第一方平臺的用戶數據的收集很容易實現,但是第二方平臺和第三方平臺用戶數據的獲取具備難度。原因如下:

1)國家出于保護大眾個人信息安全的考慮,在2017年左右出臺了一些政策和法規,限制了用戶數據交易市場倒買倒賣的亂象,目前精確到個體級別的用戶數據交易市場已經萎縮;前用戶數據交易平臺(某堂和某云等)都紛紛進行了業務轉型,著手去做大數據和云計算了;

2)第二方和第三方平臺轉為開始提供人群包數據,但人群包“能否提供用戶在某平臺上的行為信息”,這是不確定的。

我調研了抖音等平臺,針對入駐平臺的企業號,能獲取的用戶數據相當有限:只能獲取統計型數據,完全不提供精確到具體用戶的數據。詳情請見下表(?代表提供,-代表不提供,?代表不確定)。

抖音平臺用戶數據梳理

所以實際情況就是:第二方/第三方平臺數據獲取難度大,第一方平臺數據成為CDP搭建的重要數據來源。

但難度大并不代表不能獲取,大型企業之間建立合作伙伴關系,以及企業與上下游建立伙伴關系,是可能獲得合作伙伴平臺的用戶數據的,當然這必然是在合規的前提下。

各個平臺用戶數據收集后將被儲存進數據倉庫,構成了CDP的第一部分架構。

2. 數據預處理并建立映射關系

數據獲取后并不能立即投入運用,各個平臺的數據質量,數據格式一般存在較大差異。需要進行數據清洗和格式化預處理,篩選出高質量的、格式規范的數據。

然后依據某些特征信息(user ID/Cookie ID/IMEI/MAC地址/手機號等)將各個平臺的賬號歸一到某一個真實用戶名下(即建立各平臺賬號的映射關系),串聯起他在各個平臺的行為軌跡,這個交由CDP的ID引擎來完成。

完善相應板塊后,架構圖更新如下。

3. 用戶細分

CDP收集并預處理了相關用戶數據,但怎樣進行用戶細分?我們可以采用建模和打標簽的方式來實現。

2.3.1 客戶建模

客戶建模實際上是基于CRM系統中經典的客戶細分思路,大致包含以下幾種模型。

  • 基本模型:依據用戶性別/年齡/地區/收入等基本屬性維度進行的客戶細分;
  • RFM模型:依據最近一次消費(Recency) 、消費頻率(Frequency))和消費金額(Monetary)三個消費特征進行的用戶細分;
  • 生命周期模型:依據引導期/成長期/成熟期/衰退期(類比產品的生命周期)等時間維度進行用戶細分;
  • 價值模型:依據用戶消費金額高低進行用戶細分(通常消費額高的用戶對企業來說意味著高價值);
  • 忠誠度模型:依據用戶購買頻次的多少進行用戶細分(通常購買頻次多的用戶意味著對企業有高忠誠度)。

2.3.2 標簽體系

所謂打標簽即是基于用戶數據(基本屬性+行為數據)為用戶建立特征屬性說明。系統自動從標簽庫(當熱也支持手動)選取標簽與用戶進行匹配,并以標簽進行用戶細分。常見的電商標簽體系包含:

1)基本屬性:依據用戶性別/年齡/地區/收入等基本屬性維度進行的客戶細分(與客戶建模中“基本模型”類似);

2)購物興趣:依據用戶歷史訂單的商品類別進行客戶細分;

3)購買意愿:依據用戶的購買意愿強烈程度進行客戶細分;如果用戶在某商品推廣內容下點贊,或者直接將某商品加購(只是舉例,并非窮舉),那么則認為用戶對該商品具備購買意愿。

4)消費能力:依據用戶購買力的高低進行用戶細分;“消費能力”與客戶建模中“價值模型”并不一個概念。

“價值模型”的評估數據來源于用戶在企業自有平臺的消費記錄,但是標簽體系中“消費能力”的評估數據來源可能是第二方/第三方平臺。是可能出現某用戶被標簽標記為“高消費能力”但是在價值模型中卻是“低價值用戶”。

比如從第二方平臺獲取到某用戶住址在一高檔小區,我們合理推斷他是具有高消費能力的;但是他之前并未在企業自有平臺進行過消費,對企業來說他屬于低價值用戶。

5)消費習慣:依據用戶歷史訂單的特征信息進行用戶細分;比如某用戶總是先關注商品,等待其打折時才會購買;再比如某用戶常常在每月的固定日期購買某類型商品(周期購);這些訂單特征都可以作為用戶細分的標簽。

6)關注內容:依據用戶購物車詳情/搜索記錄/瀏覽記錄等匯總得出的商品類別進行用戶細分;

7)會員信息:依據用戶是否為平臺會員,是否享有特殊權益進行用戶細分。

2.3.3 用戶細分的動態/靜態選擇

我們可以通過客戶模型和標簽體系實現用戶人群細分,但是需要注意的是,人是一直在變化的?;蛟S當下某些人屬于某個細分人群,但隨著時間流逝他們可能不再滿足該細分人群的條件了,同時之前不屬于該細分人群的某些人又滿足了條件。

所以對于后面的環節,即報表輸出和數據應用,可能面臨根據實際業務需求采用動態數據或者靜態數據。則要求CDP具備數據定期刷新能力,開啟則意味著動態用戶細分,關閉則表示靜態用戶細分。

我們將相應板塊加入CDP應用架構中。

4. 數據應用

前一步我們已經實現了用戶細分,之后即可針對不同人群實施不同營銷策略。CDP對細分人群的兩個重要應用就是營銷自動化和智能廣告投放。

2.4.1 營銷自動化

通過多渠道/平臺聯合對具體用戶或者細分人群進行個性化營銷。

比如某個用戶將某商品加入了購物車,但是經過較長時間都沒有完成購買;恰好公司近期有相應的品類營銷活動,用戶可領取適用于該商品的優惠券;此時CDP自動以短信、公眾號等渠道通知該用戶,促使其完成購買。

營銷自動化的實施,涉及到相應的觸發機制,需要由規則引擎來實現。同時需要運營管理后臺(涉及到營銷管理,優惠券管理,會員管理,CMS等模塊,是屬于運營管理后臺基礎功能)與基礎服務底層(包含但不限于push服務、EDM和SMS)的配合。

2.4.2 智能廣告投放

廣告投放面臨的靈魂拷問是:我知道在廣告上的投資有一半是無用的,但問題是我不知道是哪一半。智能廣告投放就是盡量避免這種情況的發生,只針對目標人群投放廣告,提高廣告收益/投入比。

首先明確Lookalike這個概念,即相似人群擴展:是基于種子用戶,通過一定的算法評估模型,找到更多擁有潛在關聯性的相似人群的技術。大致可通過三種方法實現:

  1. 基于用戶畫像:給種子用戶打標簽,利用相同標簽找到目標人群;
  2. 基于分類模型:種子用戶為正樣本,候選對象為負樣本,訓練分類模型,然后用模型對所有候選對象進行篩選;
  3. 基于社交網絡:利用種子用戶的好友關系,將其標簽傳給社區中的好友,從而實現人群擴散。

所以廣告投放過程就優化為:CDP先通過Lookalike得到目標擴展人群,企業再將廣告內容和目標擴展人群一并給到DSP(這里需要提供不同廣告內容與不同擴展人群的對應關系,比如廣告A要求投放給擴展人群a,廣告B要求投放給擴展人群b),就能實現千人千面的智能廣告投放。

DSP(廣告平臺)一般包含人群分析引擎、LBS定向引擎、RTB重定向、個性推薦引擎、動態出價等功能模塊,網上有很多介紹資料,大家可自行搜索了解。

運營管理后臺和DSP,嚴格來說屬于CDP直接服務的外部系統,故在架構圖中以虛線標識。

5. 報表輸出

該板塊即是對用戶數據的可視化處理。同時報表引擎能根據具體業務,定義相關指標,并輸出相應報表。下面介紹一些典型的數據報表。

  • 行為軌跡分析:針對全體用戶、經過細分的用戶人群或者具體用戶,進行各平臺行為軌跡分析,甚至包含線上/線下渠道的信息,從而分析出哪些渠道/平臺/頁面的轉化效果更好,對于渠道/平臺/頁面優化有指導意義;
  • 營銷漏斗分析:反映了從展現、點擊、訪問、咨詢,直到生成訂單過程中的客戶數量及流失;這個一層層縮小的過程表示不斷有客戶因為各種原因離開,對企業失去興趣或放棄購買;其價值在于量化了營銷過程各個環節的效率,幫助企業找到薄弱環節;
  • 人群特征分析:可以提煉出企業的客戶的基本屬性(性別/地區/年齡等),有助于企業識別典型客戶;“人群特征”需要與“用戶畫像”相區別。如果CDP收集了所有分散在各渠道/平臺的用戶數據并分析得出人群特征,從統計學上講,該數據肯定比用戶畫像要精確,因為人群特征是基于真實的用戶的統計,用戶畫像往往是基于籠統的流量進行的分析。
  • 廣告效果分析:主要是針對細分人群進行廣告投放的效果分析,包含CVR/CTR等重要指標的展現,優化廣告投放渠道和人群;
  • 用戶留存分析:統計某一時段內的新增用戶數中再經過一段時間后仍啟動該應用的用戶比例,用于分析渠道/平臺的效果,是否能夠留住用戶。

我們將報表引擎加入架構圖中,更新后如下。

6. 其他

基于保護客戶數據安全的考慮,CDP需要有權限管理,限制使用人員的查看范圍和操作權限。同時提供日志管理功能,操作留底便于追溯。

我們將這最后兩個板塊加入架構圖中。

三、總結

其實CDP還可能包含機器學習、數據挖掘等能力;能優化用戶細分、營銷自動化和廣告投放策略,在智能化和自動化程度上能更進一步。但這并不是CDP的必要功能,故在架構圖中沒有體現。

至此,我們完成了CDP應用架構的完整梳理。

通過應用架構分析,大家應該能對CDP有了較深的認識??梢娝⒉皇乔拔奶岬降囊粋€簡單的“數據分析平臺”,對結果數據的自動化/智能化應用才是其核心能力。

希望本文對大家有用,歡迎討論。

 

本文由 @伊甸東 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 你好,想請教一下營銷自動化的規則引擎這塊如何設計,謝謝

    來自廣東 回復
  2. 怎么搭建一個CDP系統

    來自廣東 回復
  3. 對了:想請教一下您知道哪里可以看到:APP/PC中的一些常用模塊(如:搜索等)的推薦、展示、的案例書籍/文章嗎?

    來自廣東 回復
    1. 不好意思,這個我不是太了解。你可以站內搜索一下相關專題或者別人的文章。

      來自重慶 回復
    2. 好的感謝!想在請教一下;《推薦系統實踐》我粗略的從第一章看到了第四章;但是里面很多都是算法之類的;有點難以理解;

      所以想請教一下;您還有啥關于推薦系統的書籍方便幫忙推薦一下的嗎?

      偏理論一些的;更適合產品看的;

      來自廣東 回復
    3. 你好。專門介紹“推薦系統”的書籍,一般都會展開詳細算法。如果你只是想從理論上了解推薦系統,建議直接搜索產品經理輸出的相關文章或者書籍。推薦兩本書《策略產品經理:模型與方法論》和《策略產品經理實踐》,其中都有關于推薦系統的內容。

      來自重慶 回復
    4. 好的感謝

      來自廣東 回復
    5. 在詢問一下;一般策略類的產品經理需要去了解算法嗎?是一般的將想要的規則明確表達;然后有相關的開發去實施,是吧?然后產品去制定收集反饋優化的機制;

      來自廣東 回復
    6. 一般來說產品經理只需理論上了解算法即可,具體實施應該是由算法工程師負責。我個人也只是對策略產品經理有一個大致認識,建議你在各大招聘平臺上查看一下策略產品經理的JD。

      來自重慶 回復
  4. 想問一下這個CDP系統可以用作;資訊類(如今日頭條)興趣推送 中標簽的一部分嗎?

    來自廣東 回復
    1. 是可以的。實際上各大內容平臺(不限于頭條、抖音)采用的推薦算法中,都采用給用戶或者給內容“打標簽”的方式來關聯相似內容,作為候選推薦內容。具體原理、實例和操作步驟可以翻閱項亮的《推薦系統實踐》第四章“利用用戶標簽數據”。

      來自重慶 回復
    2. 哇!好嘞!感謝感謝;明天我去看看;這個我一直感覺是可以的;但是沒有實操做;具體怎么弄不了解;感謝;明天我去了解一下;

      來自廣東 回復
  5. 不錯,學習了

    來自上海 回復
  6. 你好,目前正好在做公司的數據平臺升級,目標是向CDP轉變。在平臺改造升級這方面有哪些建議呢?

    來自上海 回復
    1. 你好。當初寫這篇文章的緣由是為公司尋找數字化營銷解決方案,但該方案未實際落地。所以很抱歉我沒有太多關于實施過程的建議。不過,以我作為數據產品的經驗來說,數據質量尤其重要;如果對第一、二、三方平臺的數據清洗工作不到位,沒有得到口徑一致、格式一致的高質量數據,整個平臺都是空中樓閣。

      來自重慶 回復
  7. 想問一下,報表輸出那塊,cdp和一些專業做流量分析、報表的平臺的關系是什么呢

    來自北京 回復
    1. 你好。你指的流量分析平臺應該是GA和GrowingOI之類的。文中舉例的那些分析模型其實都是相通的,我們當然也可以采用GA等第三方工具對自有平臺的流量進行分析。但CDP的報表分析相較于第三方工具有一個顯著優勢:由于數據來源是基于真實的用戶,準確度肯定更高。
      PS:既然CDP都完成了數據收集、數據處理、數據應用,那么用他進行數據分析又何樂而不為呢(雖然這只是他的“副業”)。

      來自重慶 回復