運(yùn)營數(shù)據(jù)能力進(jìn)階(一):客戶畫像數(shù)據(jù)分析

5 評論 22807 瀏覽 169 收藏 10 分鐘

如何通過數(shù)據(jù)清晰現(xiàn)有用戶的畫像,找到各個行業(yè)用戶的核心關(guān)注點(diǎn),來進(jìn)行精細(xì)化的運(yùn)營以提升用戶的復(fù)購?如何將數(shù)據(jù)清晰梳理,整理出可以實(shí)際指導(dǎo)業(yè)務(wù)的指標(biāo)呢?

業(yè)務(wù)數(shù)據(jù)復(fù)雜且多,如何通過海量數(shù)據(jù)定義出核心關(guān)注的指標(biāo),用以指導(dǎo)用戶增長和轉(zhuǎn)化?

如何通過數(shù)據(jù)知道用戶體驗(yàn)產(chǎn)品的核心路徑?如何設(shè)計(jì)產(chǎn)品的新手引導(dǎo)來提升用戶的體驗(yàn)?引導(dǎo)更多用戶體驗(yàn)到產(chǎn)品核心,成為“高轉(zhuǎn)化可能”的用戶?

用戶運(yùn)營時候,如何通過數(shù)據(jù)清晰現(xiàn)有用戶的畫像,找到各個行業(yè)用戶的核心關(guān)注點(diǎn),來進(jìn)行精細(xì)化的運(yùn)營以提升用戶的復(fù)購?

這些可能是很多運(yùn)營在面對海量數(shù)據(jù)的時候都想知道的。我們都知道數(shù)據(jù)有強(qiáng)大的能力,清洗后的數(shù)據(jù)更加能夠指出一條清晰的前進(jìn)道路。俗話說,一個不會看數(shù)據(jù)的運(yùn)營不是一個好產(chǎn)品經(jīng)理,作為一個主要通過看數(shù)據(jù)和用戶訪談定性定量分析,然后產(chǎn)出相應(yīng)策略指導(dǎo)增長的用戶增長產(chǎn)品運(yùn)營,今天要講幾個硬核的能力,幫助通過數(shù)據(jù)提升運(yùn)營能力,制定運(yùn)營策略

運(yùn)營在數(shù)據(jù)分析的路上,有幾道關(guān),埋點(diǎn),拿數(shù)據(jù),分析,產(chǎn)出可行運(yùn)營策略,每一關(guān)都困難重重

以下可能是運(yùn)營去提取數(shù)據(jù)的真實(shí)場景:

運(yùn)營:“我想看一下最近新上的功能用戶使

用的如何,能不能給撈一下數(shù)據(jù)?”

開發(fā):“看什么數(shù)據(jù)?”

運(yùn)營:“就想看一下都有誰看了功能,又有誰買了,買的用戶有什么特征,還有哪些使我們的目標(biāo)用戶可以再去推廣一波”

開發(fā):“到底需要什么字段?”

運(yùn)營:“啥字段???能不能把這個客戶使用過什么功能,使用的情況怎么樣,屬于深度用戶還是流失用戶,什么行業(yè)都導(dǎo)出來?”

開發(fā):“使用了什么功能沒問題,使用情況給出定義,是使用次數(shù)還是使用賺到的錢?還是使用時長?”

運(yùn)營:“都可以啊”

開發(fā):“你能不能想清楚,你到底要用來干嘛?什么叫都可以,我是運(yùn)營你是運(yùn)營”

這是很普遍的情況,也是可以理解的情況,因?yàn)檫\(yùn)營的角度,是業(yè)務(wù)的角度,但開發(fā)的角度,是數(shù)據(jù)的角度,這個字段里沒有你說的是不是活躍用戶。這時候肯定就會想,好像要一套數(shù)據(jù),能夠清晰告訴我,這個用戶是什么行業(yè),使用了什么功能,是什么商業(yè)模式,處在什么狀態(tài)啊??!

這就引出了一個問題,如何將數(shù)據(jù)清晰梳理,整理出這些可以實(shí)際指導(dǎo)業(yè)務(wù)的指標(biāo)呢?

如何通過數(shù)據(jù)定義用戶畫像?

  1. 清晰定義想要的指標(biāo)類型,例如是用戶生命周期指標(biāo),產(chǎn)品使用行為指標(biāo),用戶購買行為指標(biāo),用戶能力行為指標(biāo),用戶自然人屬性指標(biāo)……
  2. 和數(shù)據(jù)盡可能清晰的溝通,拿到盡可能詳細(xì)的數(shù)據(jù),注意,這里的數(shù)據(jù)最好在提取數(shù)據(jù)的時候就不要多維數(shù)據(jù)!不要多維數(shù)據(jù)!
  3. 處理數(shù)據(jù)并盡可能不要忽略可能對關(guān)鍵行為產(chǎn)生影響的指標(biāo),通過模型或者excel等其他高級(假裝)的手段,通過宏觀數(shù)據(jù)(整個行業(yè)用戶數(shù)據(jù)或地區(qū)用戶數(shù)據(jù))和圍觀數(shù)據(jù)(詳細(xì)到每個用戶一條記錄的數(shù)據(jù))進(jìn)行分析
  4. 根據(jù)分析結(jié)果,得出一套可以套用的指標(biāo)體系,將指標(biāo)自動打在各個用戶身上
  5. 用戶畫像初步完成,之后可以再優(yōu)化

指標(biāo)定義——場景化定義便于明確需要提取的指標(biāo)

在和數(shù)據(jù)或者開發(fā)溝通提取數(shù)據(jù)之前,首先需要思考希望得出一個什么樣的畫像結(jié)果,這里可以大膽使用假設(shè),例如

“我希望看到用戶A,是一個來自百度搜索的北京K12機(jī)構(gòu)用戶,他已經(jīng)聯(lián)系3年續(xù)費(fèi)我們的產(chǎn)品了,但他們運(yùn)營能力比較弱,使用的功能一直都是那么幾個,沒有用到我們推出的新功能,主要使用的就是直播功能和考試功能。他們機(jī)構(gòu)的用戶一直穩(wěn)定在10萬左右,其中還有3個運(yùn)營在維護(hù),在學(xué)生放假和考試時間使用尤其頻繁?!?/p>

這樣就很明確,一般我會分出兩類型數(shù)據(jù),然后再根據(jù)兩個類型數(shù)據(jù)細(xì)化相關(guān)指標(biāo)。

這里每一類數(shù)據(jù)都可以再細(xì)分出細(xì)化的數(shù)據(jù)指標(biāo),比如說用戶基礎(chǔ)數(shù)據(jù)可以如此細(xì)化,其他指標(biāo)類型也可以如此,根據(jù)產(chǎn)品屬性和需要了解的內(nèi)容選取指標(biāo)。

數(shù)據(jù)提取——多維數(shù)據(jù)的降維處理

清晰了指標(biāo)定義,會發(fā)現(xiàn),有一些指標(biāo),可能會涉及多維,沒有辦法進(jìn)行比較和分析。

例如,用戶使用成功創(chuàng)建了某種類型的商品,每個商品的售賣量和銷量都不相同,在考慮該商品功能的使用時候如何進(jìn)行綜合處理?這里需要降維處理一下數(shù)據(jù),可以加權(quán)平均,或者取眾數(shù),中位數(shù)進(jìn)行代表,從而降低對比評價出現(xiàn)多維對比的情況。

數(shù)據(jù)分析——發(fā)現(xiàn)到底什么才是“最重要的指標(biāo)”

一條用戶記錄,關(guān)聯(lián)的數(shù)據(jù)字段是非常多的,一個用戶,付費(fèi)和不付費(fèi)的核心差別點(diǎn)是什么?到底什么是讓用戶付費(fèi)的關(guān)鍵?用戶到底關(guān)注什么

這可能需要借助分析來看清楚,這里的因變量(用戶的付費(fèi))和哪些自變量是相關(guān)聯(lián)的。在這里推薦一個算法,CHAID決策樹,這類決策樹專門用來找出這里面核心影響最終結(jié)果的變量是什么,也就是說,這么多功能,用戶這么多行為,這么多屬性,到底哪種屬性類型的用戶,哪種行為類型的用戶,更容易轉(zhuǎn)化!

決策樹算法是如何計(jì)算的?

假定我們需要了解的是用戶如何能夠付費(fèi),那付費(fèi)與否就是要考察的因變量,也是需要決策樹根據(jù)變量情況預(yù)測的值

我們把整個數(shù)據(jù)集按照20%,80%分成訓(xùn)練集和驗(yàn)證集,即為一部分拿來訓(xùn)練模型,讓模型從數(shù)據(jù)里找出特征因素,一部分用來印證和預(yù)測,判斷模型和挑選的特征變量是不是有效的,擬合度如何

從自變量里抽取2個既定值,與因變量進(jìn)行卡方檢驗(yàn);如卡方檢驗(yàn)顯示2者關(guān)系不顯著,正面2個既定值可以合并。不斷減少自變量的取值數(shù)量,知道該自變量所有取值均呈現(xiàn)顯著性。

例如,我們的數(shù)據(jù)里有130個自變量,其中很多我們都不知道是否和用戶是否付費(fèi)相關(guān),不知道用戶每周活躍次數(shù)和用戶付費(fèi)是否相關(guān),不知道用戶嘗試了某個功能是否和用戶付費(fèi)相關(guān),這時就通過決策樹的卡方檢驗(yàn)通過距離來判斷自變量和因變量之間是否相關(guān)

通過比較找出最顯著的自變量,并按照自變量的最終取值對樣本進(jìn)行分割,也就是形成多個不同的樹(一般CHAID生成兩個樹節(jié)點(diǎn))

最終展示出所有和用戶付費(fèi)與否相關(guān)的決策點(diǎn),其中可能是,直播功能創(chuàng)建超過3個,付費(fèi)的概率高達(dá)80%,決策樹就幫助我們剔除了不相關(guān)或關(guān)聯(lián)性不顯著的自變量,告訴了我們,到底什么才會導(dǎo)致用戶的轉(zhuǎn)化付費(fèi)。

 

本文由 @LunaDeng 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. CHAID決策樹有實(shí)例推算么

    來自安徽 回復(fù)
    1. 能這么問看來是專業(yè)大神(瑟瑟發(fā)抖),有數(shù)據(jù)實(shí)例驗(yàn)證過,數(shù)據(jù)集分成了訓(xùn)練集和驗(yàn)證集,然后做了交叉驗(yàn)證防止過度擬合,前期數(shù)據(jù)清洗做了標(biāo)化和部分剔除處理,最終f值,recall值都在0.8以上,應(yīng)該還可以吧(求指點(diǎn))

      來自廣東 回復(fù)
    2. 我真不是大神

      來自安徽 回復(fù)
    3. 哈哈哈,我覺得這樹用來做分類處理最好,特別是變量取值只有兩種,例如付費(fèi)還是不付費(fèi),流失還是沒流失,這種的分類效果更好些

      來自廣東 回復(fù)
    4. 這種推算很多其他領(lǐng)域也會用到

      來自安徽 回復(fù)