在數(shù)據(jù)分析中,我們需要掌握這4種思維模式
編輯導(dǎo)語:對很多產(chǎn)品經(jīng)理而言,做數(shù)據(jù)分析好像就是數(shù)據(jù)采集然后進行分析這么簡單;實際上,數(shù)據(jù)分析是一個嚴(yán)格的工作流程,數(shù)據(jù)分析思維可以有效地幫助我們優(yōu)化賬戶,同時也能提高我們的工作效率。本文作者就教你數(shù)據(jù)分析的思維。
面對數(shù)據(jù)異常,我們經(jīng)常會出現(xiàn)“好像是A原因引起的?”、“貌似和B原因也相關(guān)?”、“有可能是C操作不當(dāng)”的主觀臆測。
或者,拿到一個分析議題,分析“11月銷售數(shù)據(jù)下降的原因”,是先從產(chǎn)品層面,還是渠道層面著手的茫然無措。
顯然,這樣的思維是亂的。
做數(shù)據(jù)分析,首先你得具備看待一個事物的邏輯化思維,其次用數(shù)據(jù)去證明他。
我們會經(jīng)常聽說兩種推理模式,一種是歸納,一種是演繹;這是麥肯錫思維當(dāng)中很經(jīng)典的兩個方法,工作中所有的問題,都可以用歸納或者演繹的形式進行拆分,我喜歡把這個過程稱為“解構(gòu)”。
這兩種思維模式能夠幫助數(shù)據(jù)分析師完成原始的業(yè)務(wù)邏輯積累,在此基礎(chǔ)上快速定位業(yè)務(wù)問題,提升分析效率。
一、結(jié)構(gòu)化思維
歸納其實就是把復(fù)雜問題分解成多種單一因素的過程,并且將這些因素加以歸納和整理,使之條理化、綱領(lǐng)化;這個過程猶如抽絲剝繭,將一團亂麻理地條條順順。
如何練習(xí)結(jié)構(gòu)化思維,這其中會運用一個很重要工具,那就是金字塔模型。
根據(jù)《金字塔原理》:“任何事情都可以歸納出中心論點,由中心論點出發(fā),可由三至七個論據(jù)支撐,每個一級論點可以衍生出其他的分論點?!比绱税l(fā)散開來,就可以形成以下的金字塔結(jié)構(gòu)思考方式。
但是在你還沒有掌握這種結(jié)構(gòu)化思維方式時,直接用這種思考方式是有一定難度的。這時候就可以采用金字塔原理中的MECE法則去思考結(jié)構(gòu)。
具體的操作方式是:
- A. 盡可能列出所有思考的要點
- B. 找出關(guān)系,進行分類。
他的原則是論點之間相互獨立,不重疊;論據(jù)窮盡劃分,不遺漏。
舉個例子:現(xiàn)在有一個線下銷售的產(chǎn)品,我們發(fā)現(xiàn)8月的銷售額度下降,和去年同比下降了20%。我想先觀察時間趨勢下的波動,看是突然暴跌還是逐漸下降;再按照不同地區(qū)的數(shù)據(jù)看一下差異,有沒有地區(qū)性的因素影響;我也準(zhǔn)備問幾個銷售員,看一下現(xiàn)在的市場環(huán)境怎么樣,聽說有幾家競爭對手也縮水了,是不是這個原因。
用結(jié)構(gòu)化思維梳理,就是:
用這種方式思考,能確保思考的點成體系,邏輯嚴(yán)謹(jǐn),要素相互之間不凌亂不打架,思考的點都窮盡。
長期練習(xí)這種方法,不僅更容易找到邏輯結(jié)構(gòu),也更容易培養(yǎng)你的結(jié)構(gòu)化思維。
二、假說演繹思維
以情況為起點的推理方法是歸納推理,以規(guī)則為起點的推理方法可以稱之為演繹推理。
比如:某自營電商網(wǎng)站,現(xiàn)在想將商品提價,讓你分析下銷售額會有怎樣的變化?
首先可以確定銷量會下降,那么下降多少?
這里就要假設(shè)商品流量情況,提價后轉(zhuǎn)化率的變化情況,然后根據(jù)歷史數(shù)據(jù)匯總出銷量下降的情況,從而得出銷售額的變化情況。
具體的變化情況都可以根據(jù)過往的數(shù)據(jù)來擬合,統(tǒng)計學(xué)上也有一些科學(xué)的預(yù)測模型,后面講數(shù)理統(tǒng)計知識時會有涉及。
假設(shè)先行就是以假設(shè)作為思考的起點,先提出問題,然后用MECE原則梳理關(guān)聯(lián)因素間的結(jié)構(gòu)關(guān)系。
小結(jié):歸納和演繹的思維是數(shù)據(jù)分析初期必備的,面試考察邏輯思維無非也是這兩點。
實際情況中可針對不同的項目要求進行組合應(yīng)用,在經(jīng)過一定階段的訓(xùn)練后,可以幫助提升業(yè)務(wù)熟悉程度;完成業(yè)務(wù)的初始積累后,后續(xù)的分析過程中就可以逐步減少拓展推理的層級及組合,逐步提升問題原因定位的效率。
三、指標(biāo)化思維
上述的分析思維,幫助我們?nèi)ザㄐ詥栴},接下來我們要介入數(shù)據(jù)的方式,去定量分析,首要掌握指標(biāo)化的思維。
假設(shè)有一家電商公司,我們想要了解網(wǎng)站運營的情況如何?運營人員向我們描述:我們的網(wǎng)站的流量很高啊,比淘寶差一點,比京東好一點,每天都有大量的新用戶,老用戶下單也很活躍啊。
那我就疑惑了,流量高是多少?大量的新用戶怎么衡量?一個手機注冊了算新用戶還是新下單的用戶?下單活躍又是怎么個活躍法?
這樣的問題相信只能憑運營人員的經(jīng)驗來判斷,而經(jīng)驗帶來的“后果”往往是拍腦袋式的決策。
如果用指標(biāo)化的思維,應(yīng)該用PV和UV去衡量流量,新用戶下單數(shù)和占比去評價網(wǎng)站的拉新,新老買家占比等指標(biāo)去衡量用戶活躍。
很明顯,指標(biāo)就是用來定義、評價和衡量業(yè)務(wù)的一個標(biāo)準(zhǔn)。
比如網(wǎng)站相關(guān)用戶訪問量、停留時長、跳出率等,銷售相關(guān)銷售量、銷售額、客單價等,應(yīng)該很好理解。
指標(biāo)的設(shè)定有兩個經(jīng)驗:
- “有總比沒有強”,對于要監(jiān)控的事物,能有指標(biāo)的盡量要有指標(biāo)。
- “一個好的指標(biāo)應(yīng)該是用來衡量具體且可量化的事物”,比如:用戶訪問量、停留時長、跳出率等。
下面這張圖,解釋了什么是指標(biāo)化,這就是有無數(shù)據(jù)分析思維的差異,也是典型的數(shù)據(jù)化運營。
1. 指標(biāo)體系
有指標(biāo)是否就夠了呢?
指標(biāo)按照結(jié)構(gòu)化思維可以形成一個體系,如銷售分析指標(biāo)體系、生產(chǎn)指標(biāo)體系、電商行業(yè)指標(biāo)體系。
一家企業(yè)建立的數(shù)據(jù)分析體系通常細(xì)分到了具體可執(zhí)行的部分,可以根據(jù)設(shè)定的某個指標(biāo)異常變化,相應(yīng)立即執(zhí)行相應(yīng)的方案,來保證運營的正常進行。
2. 建立指標(biāo)體系的思路
向上:可以按業(yè)務(wù)職能結(jié)構(gòu)劃分,映射出更多維度,比如渠道,運營,產(chǎn)品等相關(guān)模塊;將相關(guān)指標(biāo)映射到主要模塊,通過簡單快速的溝通,快速定位問題原因。
向下:可以按因果結(jié)構(gòu)劃分,也就是指標(biāo)分解,利用公式的方法。比如營收=日活*付費率*arpu等指標(biāo)因果關(guān)系進行劃分;通過定位指標(biāo)波動、定位最細(xì)指標(biāo)、輔助維度下轉(zhuǎn),能夠清楚的問題原因;
就像枝丫一樣,從主干不斷延伸枝丫,將業(yè)務(wù)用指標(biāo)評價量化,逐漸形成一個健全的數(shù)據(jù)分析體系。
四、維度分析思維
最后,站在分析的角度講一下維度思維。
當(dāng)你有了指標(biāo),可以著手進行分析,數(shù)據(jù)分析大體可以分三類:
- 利用維度分析數(shù)據(jù);
- 使用統(tǒng)計學(xué)知識如數(shù)據(jù)分布假設(shè)檢驗;
- 使用機器學(xué)習(xí)。這里我們主要了解維度分析法;
維度是觀察數(shù)據(jù)的角度,例如“時間”、“地區(qū)”、“產(chǎn)品”。
在具體分析中,我們可以把它認(rèn)為是分析事物的角度;時間是一種角度、地區(qū)是一種角度、產(chǎn)品也是一種角度,所以它們都能算維度。
當(dāng)我們有了維度后,就能夠通過不同的維度組合,形成數(shù)據(jù)模型;數(shù)據(jù)模型不是一個高深的概念,它就是一個多維立方體。
這個概念最早來源于商業(yè)智能OLAP技術(shù),數(shù)據(jù)按照事實表(Fact Table)和維表(Dimension Table)的形式存在。
- 事實表用來記錄具體事件,比如銷量、銷售額、售價、折扣等具體的數(shù)值信息。
- 維度表是對事實表中事件的要素的描述信息,比如時間、城市、品牌、機型等。
這是一個最簡單的星形模型的實例:
事實表里面主要包含兩方面的信息:維和度量。
- 維的具體描述信息記錄在維表,事實表中的維屬性只是一個關(guān)聯(lián)到維表的鍵,并不記錄具體信息;
- 度量一般都會記錄事件的相應(yīng)數(shù)值,比如這里的產(chǎn)品的銷售數(shù)量、銷售額等。
維表中的信息一般是可以分層的,比如時間維的年月日、地域維的省市縣等;這類分層的信息就是為了滿足事實表中的度量可以在不同的粒度上完成聚合,比如2016年商品的銷售額,來自上海市的銷售額等。
下圖舉例一個簡化的分析模型,分別由產(chǎn)品、城市、時間這三個維度組成,實際數(shù)據(jù)分析中,維度遠不止三個。
在數(shù)庫中,可能是這樣兩張表:
我們可以將品牌作為維度,分析手機的銷量情況,也可以將時間作為維度,分析每一年手機市場的份額情況。
多維分析操作包括:鉆取(Drill-down)、上卷(Roll-up)、切片(Slice)、切塊(Dice)以及旋轉(zhuǎn)(Pivot)。
- 鉆?。―rill-down):在維的不同層次間的變化,從上層降到下一層,或者說是將匯總數(shù)據(jù)拆分到更細(xì)節(jié)的數(shù)據(jù);比如通過對2018年華為的總銷售數(shù)據(jù)進行鉆取來查看各個手機型號的銷售數(shù)據(jù)。
- 上卷(Roll-up):鉆取的逆操作,即從細(xì)粒度數(shù)據(jù)向高層的聚合;如將江蘇省、上海市和浙江省的銷售數(shù)據(jù)進行匯總來查看江浙滬地區(qū)的銷售數(shù)據(jù)。
- 切片(Slice):選擇維中特定的值進行分析;比如只選擇蘋果手機的銷售數(shù)據(jù),或2017年的手機銷售數(shù)據(jù)。
- 切塊(Dice):選擇維中特定區(qū)間的數(shù)據(jù)進行分析;比如選擇2016年2017年的銷售數(shù)據(jù)。
- 旋轉(zhuǎn)(Pivot):即維的位置的互換,就像是二維表的行列轉(zhuǎn)換;如圖中通過旋轉(zhuǎn)實現(xiàn)產(chǎn)品維和地域維的互換。
為什么這邊花那么多筆墨去講維度和度量呢?
- 一者是我們在梳理分析思路時,常常會按照幾個大的維度類去劃分層級、多面分析,如時間維、地域維、產(chǎn)品維,幫助我們成為“多面分析手”。
- 另一方面,BI商業(yè)智能在操作也基于維度一說,熟悉維度和數(shù)據(jù)模型的原理,能更好的理解這個工具。
好了,花了一天的時間整理了數(shù)據(jù)分析的思維,大家慢慢消化。
作者:李啟方,公眾號:數(shù)據(jù)分析不是個事兒
本文由 @李啟方 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!