用戶畫像ID體系建設(shè):以阿里、網(wǎng)易、美團、58為例

1 評論 20040 瀏覽 87 收藏 10 分鐘

編輯導(dǎo)語:在上篇文章《一文從0到1掌握用戶畫像知識體系》中,本文作者為我們分析了用戶畫像知識體系。在上篇文章的基礎(chǔ)上,今天,作者又以阿里、網(wǎng)易、美團、58為例,分析總結(jié)了用戶畫像ID體系建設(shè),幫你理清楚各ID之間的關(guān)系圖,方便做映射。

前言:梳理完標(biāo)簽畫像體系的業(yè)務(wù)需求后,作為數(shù)據(jù)產(chǎn)品經(jīng)理,就要開始了對畫像體系的整體設(shè)計,其中首要遇到的就是用戶ID體系的打通相關(guān)的問題。

公司各業(yè)務(wù)線ID繁多,數(shù)據(jù)割裂,如何才能盡可能關(guān)聯(lián)更多的數(shù)據(jù),以準(zhǔn)確的描繪出一個用戶的畫像呢?

接下來我們來看看索隆通過對界內(nèi)科技巨頭:阿里、網(wǎng)易、美團、58的調(diào)研分析,來一步步建立自己公司的ID-Mapping體系的過程。

一、阿里OneID

阿里巴巴作為一家包含多條業(yè)務(wù)線的公司,如:

電商、金融、廣告、文化、教育、娛樂、設(shè)備和社交等領(lǐng)域,數(shù)據(jù)區(qū)域包含國內(nèi)、國外;數(shù)據(jù)場景包含線上的人貨場錢、線下的人貨場錢位置等數(shù)據(jù),以及物流、用餐、咨詢、影視、出行、閱讀、音樂和健康等相關(guān)數(shù)據(jù)。

ID類型包含phone、PC cookie、IMEI與IDFA、淘寶賬戶、支付寶賬戶、郵箱等。

而對于每個BU來說,他們知道的只是這個客戶的片面屬性,在開展?fàn)I銷活動時,只是針對一個手機號或一個郵箱做營銷,但背后不能識別出來一個自然人、一個公司。

為打破數(shù)據(jù)孤島,創(chuàng)造更大的數(shù)據(jù)價值,阿里使用OneData作為核心方法論。

OneData體系包含:

  1. OneModel:數(shù)據(jù)資產(chǎn)構(gòu)建與管理
  2. OneID:實體打通和畫像
  3. OneService:邏輯化服務(wù)

阿里/網(wǎng)易/美團/58用戶畫像中的ID體系建設(shè)

OneID基于超強ID識別技術(shù)鏈接數(shù)據(jù),高效生產(chǎn)標(biāo)簽;業(yè)務(wù)驅(qū)動技術(shù)價值化,消除數(shù)據(jù)孤島,提升數(shù)據(jù)質(zhì)量,提升數(shù)據(jù)價值。

而ID的打通,必須有ID-ID之間的兩兩映射打通關(guān)系,通過ID映射關(guān)系表,才能將多種ID之間的關(guān)聯(lián)打通,完全孤立的兩種ID是無法打通的。

打通整個ID體系,看似簡單,實則計算復(fù)雜,計算量非常大。

假如某種對象有數(shù)億個個體,每個個體又有數(shù)十種不同的ID標(biāo)識,任意兩種ID之間都有可能打通關(guān)系,想要完成這類對象的所有個體ID打通需要數(shù)億次計算,一般的機器甚至大數(shù)據(jù)集群都無法完成。

大數(shù)據(jù)領(lǐng)域中的ID-Mapping技術(shù)就是用機器學(xué)習(xí)算法類來取代野蠻計算,解決對象數(shù)據(jù)打通的問題。

基于輸入的ID關(guān)系對,利用機器學(xué)習(xí)算法做穩(wěn)定性和收斂性計算,輸出關(guān)系穩(wěn)定的ID關(guān)系對,并生成一個UID作為唯一識別該對象的標(biāo)識碼。

二、網(wǎng)易ID-Mapping

網(wǎng)易產(chǎn)品線有網(wǎng)易云音樂、網(wǎng)易郵箱、網(wǎng)易新聞、網(wǎng)易嚴(yán)選等,不同應(yīng)用上有不同的ID,如yanxuanid、oaid、musicid、phone、email、idfa、imei等。

要想標(biāo)識唯一ID,網(wǎng)易采用的思路及方案為:

結(jié)合各種賬戶、各種設(shè)備型號之間的關(guān)系對,以及設(shè)備使用規(guī)律等用戶數(shù)據(jù),采用規(guī)則規(guī)律、數(shù)據(jù)挖掘算法(連通圖劃分+社區(qū)發(fā)現(xiàn))的方法,判別賬戶是否屬于同一個人。

阿里/網(wǎng)易/美團/58用戶畫像中的ID體系建設(shè)

ID-Mapping過程中,常遇到的問題及對應(yīng)方案如下:

1. 問題一:用戶有多個設(shè)備信息

解決方案:定義相關(guān)的閾值進行關(guān)聯(lián)。社區(qū)發(fā)現(xiàn)當(dāng)前應(yīng)用于營銷場景,暫未用于風(fēng)控或用戶運營場景,因為這種方式會把一些異常的賬號關(guān)聯(lián)在一起,且會存在僅登錄使用過一次的設(shè)備信息。

2. 問題二:設(shè)備過期,一般是2年半左右時間

解決方案:設(shè)定衰減系數(shù),對單用戶多設(shè)備加大衰減力度。

備注:通常一人多設(shè)備對應(yīng)的場景有,借用朋友設(shè)備、設(shè)備臟數(shù)據(jù)、刷號等。

三、58 ID-Mapping

58業(yè)務(wù)場景豐富,其產(chǎn)品線包含58同城、趕集、安居客、中華英才網(wǎng)、轉(zhuǎn)轉(zhuǎn)、58到家等。

在這種多用戶、多業(yè)務(wù)線、多子公司的情況下,用戶數(shù)據(jù)種類繁雜,構(gòu)建畫像的數(shù)據(jù)來自于日志、簡歷庫、帖子庫、用戶信息庫、商家?guī)?、認(rèn)證信息庫等數(shù)據(jù)源,其中僅日志就涉及到58、趕集、安居客等各個子產(chǎn)品的PC/M/APP日志。

如何將眾多數(shù)據(jù)源串聯(lián)起來是構(gòu)建用戶畫像面臨的第一個問題,如下是58構(gòu)建的ID-Mapping模型圖。

阿里/網(wǎng)易/美團/58用戶畫像中的ID體系建設(shè)

從圖中可以看出,不同業(yè)務(wù)線所擁有的ID標(biāo)識不一:

  • 58同城:wuser、wbdid、wimei
  • 58趕集:guser、gbdid、gapud、gimei
  • 安居客:kimei

其中可以通過telep、bidua、appua、imei、idfa關(guān)聯(lián)起來,由此建立不同ID之間的關(guān)聯(lián)映射關(guān)系,就是ID-Mapping的過程。

四、美團ID-Mapping

美團與大眾點評進行了合并,那同一個用戶在兩個APP上有不同的身份標(biāo)識,美團要怎樣進行唯一標(biāo)識呢?

我們來看看美團和大眾點評的賬號體系。美團采用手機號、微信、微博、美團賬號的登錄方式;大眾點評采用的手機號、微信、QQ、微博的登錄方式;其交集為手機號、微信、微博。

最終,對于注冊用戶賬戶體系,美團采用了手機號作為用戶的唯一標(biāo)識。

阿里/網(wǎng)易/美團/58用戶畫像中的ID體系建設(shè)

五、總結(jié)

從上述案例可看出,ID-Mapping有三種常見方法:

  1. 基于賬號體系企業(yè)中最常用的是基于賬號體系來做ID的打通,用戶注冊時,給到用戶一個uid,以uid來強關(guān)聯(lián)所有注冊用戶的信息。
  2. 基于設(shè)備:那對于未注冊用戶可以通過終端設(shè)備ID精準(zhǔn)識別,包含Android/iOS兩類主流終端的識別。通過SDK將各種ID采集上報,后臺利用的ID關(guān)系庫和校準(zhǔn)算法,實時生成/找回終端唯一ID并下發(fā)。
  3. 基于賬號&設(shè)備:結(jié)合各種賬戶、各種設(shè)備型號之間的關(guān)系對,以及設(shè)備使用規(guī)律等用戶數(shù)據(jù),采用規(guī)則規(guī)律、數(shù)據(jù)挖掘算法的方法,輸出關(guān)系穩(wěn)定的ID關(guān)系對,并生成一個UID作為唯一識別該對象的標(biāo)識碼。

六、實踐

1. 梳理業(yè)務(wù)及數(shù)據(jù)現(xiàn)狀由于公司包含租住、生活服務(wù)等多條業(yè)務(wù)線

不同業(yè)務(wù)的用戶標(biāo)識不一;數(shù)據(jù)來源各不相同,數(shù)據(jù)散落在各業(yè)務(wù)表中,ID標(biāo)識包含phone、郵箱、神策ID、cuid、IMEI、idfa等。

2. 明確建設(shè)目標(biāo)

ID-Mapping體系的建立,旨在打破數(shù)據(jù)孤島,將更多用戶的數(shù)據(jù)關(guān)聯(lián)起來,形成全域用戶畫像,幫助營銷人員進行精細(xì)化營銷。

3. 制定項目計劃

第一階段:基于用戶賬號體系,用phone關(guān)聯(lián)注冊用戶的ID,維護一個ID映射庫,統(tǒng)計注冊用戶線上線下行為數(shù)據(jù)。

阿里/網(wǎng)易/美團/58用戶畫像中的ID體系建設(shè)

第二階段:基于設(shè)備,用device ID關(guān)聯(lián)未注冊用戶的ID,統(tǒng)計未注冊用戶的行為數(shù)據(jù)。

第三階段:基于賬號&設(shè)備,采用數(shù)據(jù)挖掘算法做ID映射。

4. 按計劃進行

接下來要做的就是按計劃開展項目。這個過程中,注意要點在于,基于公司的數(shù)據(jù)現(xiàn)狀出發(fā),一步步實施;梳理清楚底層數(shù)據(jù)表中的ID標(biāo)識;理清楚各ID之間的關(guān)系圖,便于做映射。

#專欄作家#

大鵬,公眾號:一個數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊》作者。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 老師您好,我是類類有話說的網(wǎng)站編輯,想申請權(quán)限轉(zhuǎn)載這篇文章到我們網(wǎng)站上,麻煩您添加下我的微信呀,KL15968397937

    來自浙江 回復(fù)