明確錨點(diǎn)/維度/指標(biāo),用數(shù)據(jù)分析解決問題
無(wú)論是產(chǎn)品還是運(yùn)營(yíng),都離不開去用數(shù)據(jù)分析、解決異常問題。但是,在我們找到數(shù)據(jù)后,數(shù)據(jù)并不會(huì)直接告訴我們答案,我們需要做的就是把問題轉(zhuǎn)譯成維度和指標(biāo),然后提取數(shù)據(jù),之后才是分析、解決問題。
數(shù)據(jù)分析是產(chǎn)品、市場(chǎng)、運(yùn)營(yíng)等崗位的基本技能,越來(lái)越多的招聘要求中,將數(shù)據(jù)分析視作基本要求。當(dāng)然,大部分情況下,業(yè)務(wù)需要的數(shù)據(jù)分析是非?;A(chǔ)的,只需用Excel做基本的統(tǒng)計(jì)計(jì)算,無(wú)須像專業(yè)的數(shù)據(jù)分析師,手握SQL和R,運(yùn)用回歸、分類樹等算法,輸出高精尖的報(bào)告。
從業(yè)務(wù)場(chǎng)景出發(fā),數(shù)據(jù)分析是問題驅(qū)動(dòng)的。也就是說(shuō),每一次啟動(dòng)數(shù)據(jù)分析,本質(zhì)是發(fā)現(xiàn)問題、翻譯問題、歸因問題和解決問題。
基于數(shù)據(jù),發(fā)現(xiàn)問題是數(shù)據(jù)分析的第一步。問題之所以被稱為問題,是因?yàn)閿?shù)據(jù)表現(xiàn)不符合“常理”或邏輯,正所謂“事出反常必有妖”。
01 發(fā)現(xiàn)問題:異常與錨點(diǎn)
大學(xué)時(shí)上普通心理學(xué)課程,講到精神障礙一章定義“正常行為”時(shí),老師課上討論過“正?!钡亩x——是取平均值,還是取眾數(shù),還是取中位數(shù)?
數(shù)據(jù)分析中也是如此,“?!笔鞘裁矗?/p>
“?!笨梢允菚r(shí)序中的歷史數(shù)據(jù)。比如App的日活用戶數(shù)(DAU),我們要判斷它是否正常,通常需要參考T-1、T-7、T-30的DAU,計(jì)算環(huán)比增幅(降幅)。
“常”也可以是競(jìng)品或者行業(yè)均值的指標(biāo)表現(xiàn)。例如,微信公眾號(hào)頭條文章的粉絲打開率為5%(一個(gè)虛擬的數(shù)字不具備實(shí)際參考意義,即100個(gè)公眾號(hào)粉絲,平均5個(gè)會(huì)打開公眾號(hào)推送的頭條文章)。如果你的公眾號(hào)的粉絲打開率低于這個(gè)數(shù)值,那么就要反思,是否是頭條文章的內(nèi)容不夠吸引人。
或許你也發(fā)現(xiàn)了,“正常”也好,“異常”也罷,都是基于比較產(chǎn)生的。增速“快”、滲透率“高”、客戶數(shù)“少”,都是相對(duì)而言的。因此,基于數(shù)據(jù)定位問題的第一步,在于找到正確的錨點(diǎn)。
再看一個(gè)簡(jiǎn)單的例子,你就會(huì)明白選擇正確的“錨點(diǎn)”對(duì)于定義問題是多么的至關(guān)重要,因?yàn)橹挥羞x對(duì)錨點(diǎn)才能發(fā)現(xiàn)真問題。
互聯(lián)網(wǎng)廣告有一個(gè)顯著的特點(diǎn),廣告主特別是中小廣告主傾向在周末減投或者停止投放,因此周末大盤的廣告主數(shù)量都會(huì)比較少因此。如果是將周六在投的廣告主數(shù)量與T-1(昨天,也就是周五)的投放廣告主數(shù)量相比,在部分行業(yè)會(huì)出現(xiàn)“斷崖式”的下跌。但是如果你去對(duì)比T-7(也就是上一個(gè)周六)在投廣告主數(shù)量,你會(huì)發(fā)現(xiàn)數(shù)據(jù)并沒有發(fā)生顯著變化。
假設(shè)我們已經(jīng)定義清楚了問題,那么接下來(lái)就是找到引起問題的因素,而這則需要數(shù)據(jù)指標(biāo)按維度的拆解。
02 翻譯問題:維度與指標(biāo)
工作當(dāng)中,無(wú)論是剛?cè)肼殘?chǎng)的新手,還是已經(jīng)在職場(chǎng)打磨十幾年的老兵,面對(duì)數(shù)據(jù)分析時(shí),最常犯的錯(cuò)誤是混淆維度與指標(biāo)。
維度是針對(duì)對(duì)象的描述性特征或者屬性,比如城市的分級(jí)、性別、行業(yè)等;指標(biāo)是用戶衡量對(duì)象的單位或者方法。維度與指標(biāo)一般成對(duì)出現(xiàn),共同構(gòu)成一組數(shù)據(jù)。
例如,我們要分析北京、上海、廣州和深圳4個(gè)城市2019年的GDP,那么城市就是維度,GDP就是指標(biāo)。
再舉一個(gè)例子:最近疫情發(fā)展?fàn)縿?dòng)著很多人的心,我每天早上醒來(lái)除了睜眼,第一件事情就是查看昨天全球新增患病人數(shù),特別是每個(gè)國(guó)家的新增患病人數(shù)。在這里,維度就是國(guó)家/地區(qū),指標(biāo)就是昨日新增患病人數(shù)。
數(shù)據(jù)提取時(shí),我們還需要定義的是“篩選條件”。嚴(yán)格意義上,它只是維度或者指標(biāo)的二次使用,與維度、指標(biāo)并不在同一個(gè)邏輯層面。
現(xiàn)實(shí)業(yè)務(wù)中,我們的數(shù)據(jù)表中存儲(chǔ)著多個(gè)主體的多個(gè)指標(biāo)數(shù)據(jù),但是不是所有的維度和指標(biāo)是需要我們關(guān)注的。因此,我們通常會(huì)通過維度或者指標(biāo),對(duì)將要提取的數(shù)據(jù)進(jìn)行限制,避免數(shù)據(jù)量級(jí)過大,同時(shí)也避免我們的注意力分散。
還是以本次疫情中每個(gè)國(guó)家新患病人數(shù)為例。假設(shè)我只關(guān)心那些已經(jīng)出現(xiàn)新冠肺炎病例的國(guó)家,因此篩選條件為截至到昨日,累計(jì)感染新冠肺炎病例數(shù)(指標(biāo))>0的國(guó)家和地區(qū);那些還未出現(xiàn)感染患者的國(guó)家和地區(qū)暫時(shí)就不用考慮。
當(dāng)然,如果只希望關(guān)注亞洲國(guó)家的疫情進(jìn)展情況,那么在國(guó)家這個(gè)維度中,只需將國(guó)家限定為中國(guó)、日本、韓國(guó)、伊朗等亞洲國(guó)家。
在我們正式進(jìn)入后面的內(nèi)容之前,請(qǐng)記?。壕S度、指標(biāo)與篩選條件,是我們進(jìn)行數(shù)據(jù)分析的基石。
盡管我們每天都會(huì)遇到各種各樣的數(shù)據(jù)分析需求,然而,數(shù)據(jù)本身是不會(huì)說(shuō)話的,不會(huì)直接告訴你答案,你需要做的是把問題轉(zhuǎn)譯成維度和指標(biāo),然后提取數(shù)據(jù),之后才是分析。
所以,收到數(shù)據(jù)分析的需求,不要急著寫SQL或者打開Excel,先明確下問題是什么,以及希望達(dá)到什么樣的目標(biāo)。
怎么樣才能準(zhǔn)確翻譯成維度和指標(biāo)呢?不要著急,我們一步步來(lái)。
假設(shè),某一天我們被問到這樣一個(gè)問題:為什么2019年我們公司拳頭產(chǎn)品——洗面奶的GMV下降了?
步驟1:明確分析的主體-限定篩選條件
公司的產(chǎn)品線非常豐富,從洗面奶、面膜、面霜、BB霜等,護(hù)膚類和彩妝類產(chǎn)品線基本都覆蓋。
好了,現(xiàn)在很明確,我們需要分析的數(shù)據(jù)是洗面奶,其他的產(chǎn)品如面霜、口紅等產(chǎn)品,暫時(shí)不需要我們操心。
聰明的你,肯定會(huì)記得,我們需要在篩選條件中,將產(chǎn)品種類這個(gè)維度限定為洗面奶。同時(shí)?。?!時(shí)間維度限定為2019年,但是為了對(duì)比(參見上一篇),我們也需要提取2018年洗面奶的GMV數(shù)據(jù)。
步驟2:觀察數(shù)值——明確指標(biāo)
我們拿到的問題是:為什么2019年洗面奶的GMV下降了。
假設(shè)GMV在我們的業(yè)務(wù)范疇為復(fù)合型指標(biāo),也即是由2個(gè)基礎(chǔ)指標(biāo)計(jì)算而來(lái)的,比如我們規(guī)定GMV=銷量*售價(jià)。
為了簡(jiǎn)化問題,我們假設(shè)2019年洗面奶售價(jià)與2018年持平。也也就是說(shuō),2019年相比2018年,GMV下降的本質(zhì)是銷量下滑。
步驟3:大膽建設(shè)提出原因——拆解維度
分析洗面奶銷量下降的原因,本質(zhì)上就是找到在哪個(gè)維度上下降。
洗面奶銷量下降,我們猜測(cè)可能的原因有如下:
① 時(shí)間維度:2019年雙11促銷活動(dòng)復(fù)雜,用戶參與度低;
② 渠道維度:2019年小紅書下架,導(dǎo)致洗面奶在小紅書上的銷量下降;
③ 消費(fèi)者維度:2019年,30歲以下消費(fèi)者購(gòu)買洗面奶的人數(shù)減少;
……
- 針對(duì)第一個(gè)猜想,我們只需按月(時(shí)間維度)提取2018-2019年24個(gè)月的銷量數(shù)據(jù),比對(duì)2019年雙11與2018年雙11期間的銷量情況;
- 針對(duì)第二個(gè)猜想,我們需要按照渠道(小紅書、天貓、京東、唯品會(huì)、KA賣場(chǎng)等渠道維度)提取銷量數(shù)據(jù),分析小紅書渠道的銷量相對(duì)于2018年的增幅;
- 針對(duì)第三個(gè)猜想,我們只需分析每一個(gè)年齡層級(jí)購(gòu)買洗面奶的消費(fèi)者數(shù)量即可。
03 歸因問題:維度與溯源
可能你已經(jīng)發(fā)現(xiàn)了:我們一般依賴指標(biāo)的“異常”來(lái)定義問題,然后通過維度拆解指標(biāo)來(lái)定位和歸因問題。
還是以洗面奶銷量下滑原因拆解為例。通過多個(gè)維度的拆解,我們發(fā)現(xiàn)洗面奶在小紅書渠道銷量下滑,是導(dǎo)致洗面奶銷量下滑的“罪魁禍?zhǔn)住薄?/p>
為了驗(yàn)證你的觀點(diǎn),你可能還需要在維度間交叉驗(yàn)證:如,洗面奶銷量下滑的時(shí)間,是不是也剛好是小紅書被下架的時(shí)間?
事實(shí)上,維度非常多,如果我們只是粗淺地觀察數(shù)據(jù)趨勢(shì),有可能得出的結(jié)論與真相大相徑庭。當(dāng)然,我們經(jīng)常遇到的另外一個(gè)問題則是:導(dǎo)致銷量下滑的原因多種多樣,多個(gè)維度都可以解釋銷量下滑,我們只需關(guān)注主要的維度即可;否認(rèn)這如果我們不停地進(jìn)行維度下鉆,或者維度間的交叉分析,只會(huì)陷入“維度災(zāi)”?!?/p>
接下來(lái)就是怎么做,讓數(shù)據(jù)指標(biāo)恢復(fù)到“正常”——由上面的成因,導(dǎo)出你的執(zhí)行策略。
04 解決問題:針對(duì)維度,影響指標(biāo)
假設(shè)我們已經(jīng)成功定位到問題了,即定位到維度了,接下來(lái)就是輸出策略的時(shí)刻。
其實(shí),這是一個(gè)需要case by case討論的話題,畢竟業(yè)務(wù)場(chǎng)景不同、資源條件不同,方案也會(huì)不一樣。
這里,只強(qiáng)調(diào)一點(diǎn):你的方案,必須能強(qiáng)有力地影響指標(biāo)。
咋看起來(lái)是廢話,但是真實(shí)的工作中,你會(huì)發(fā)現(xiàn)很多方案與想要達(dá)成的目標(biāo)經(jīng)常南轅北轍。我們經(jīng)常會(huì)忽視的一點(diǎn)是任何行為都會(huì)導(dǎo)致你可能意想不到的后果,感慨“原來(lái)這樣也可以”:
一個(gè)經(jīng)典的案例是考古學(xué)家期望收購(gòu)更多龜殼以拯救甲骨文,結(jié)果發(fā)現(xiàn)很多人都把龜殼砸碎了來(lái)賣,因?yàn)槭前磯K數(shù)付給他們費(fèi)用,導(dǎo)致很多人把完整的龜殼敲成一塊塊的,以獲取更高價(jià)值。
實(shí)際上,很多活動(dòng)也是如此:一個(gè)明明以GMV為導(dǎo)向的活動(dòng),愣是把活動(dòng)路徑設(shè)計(jì)地非常長(zhǎng),造成用戶跳轉(zhuǎn)到其他頻道流失。
好了,以上就是我的一些思考,我叫余子申,關(guān)注B端產(chǎn)品和營(yíng)銷,歡迎大家多多交流。
作者:余子申;公眾號(hào):簡(jiǎn)寫2019
本文由 @余子申 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
寫得很有深度,受教啦