數(shù)據(jù)分析能力的核心是思維

22 評(píng)論 75586 瀏覽 385 收藏 12 分鐘

對(duì)于業(yè)務(wù)人,比如產(chǎn)品或運(yùn)營(yíng),數(shù)據(jù)分析能力的核心不在方法和工具,而在于思維。

  • 大多數(shù)人錯(cuò)誤地理解了數(shù)據(jù)分析,把數(shù)據(jù)分析能力提升的關(guān)鍵放在了方法和工具;
  • 對(duì)于業(yè)務(wù)人而言,數(shù)據(jù)分析的核心思路是,得到兩個(gè)變量之間的「量化關(guān)系」,用以解釋現(xiàn)象;
  • 數(shù)據(jù)分析的步驟,感知問題、提出假說、選擇表征、收集數(shù)據(jù)、分析驗(yàn)證;
  • 提出假說和選擇表征是很多業(yè)務(wù)人數(shù)據(jù)分析做不下去的原因。

數(shù)據(jù)分析的方法崇拜

在和團(tuán)隊(duì)小伙伴分享的的時(shí)候,發(fā)現(xiàn)一個(gè)問題:

我問,你怎么看數(shù)據(jù)分析能力?如何評(píng)價(jià)自己的數(shù)據(jù)分析能力?

大家的回答主要是這樣的:

運(yùn)營(yíng)是基于數(shù)據(jù)驅(qū)動(dòng)的,但是拿著很多數(shù)據(jù),不能分析下去,主要是對(duì)于excel的一些陌生的公式、函數(shù)都不太會(huì),我要專門去學(xué)一下excel

我感覺導(dǎo)致現(xiàn)在轉(zhuǎn)化率低低原因是xxx,最近接觸到很多用戶都是這么反饋的,但還沒有找到好的分析方法

產(chǎn)品的數(shù)據(jù)分析能力還是很重要,我想去學(xué)個(gè)R,能夠去構(gòu)建量化模型

……

以上,我覺得太在意數(shù)據(jù)分析方法和工具,我覺得都還沒有把握住一個(gè)業(yè)務(wù)人數(shù)據(jù)分析能力的核心。

業(yè)務(wù)人考慮的最重要的問題是,業(yè)務(wù)結(jié)果到底怎么樣,出現(xiàn)了什么問題,原因是什么,可能的解決方案是什么。

數(shù)據(jù)分析只是手段,它的誤區(qū)就是,太在意方法和工具。

而最缺少的,恰恰是最重要的思維。

數(shù)據(jù)分析的本質(zhì)

數(shù)據(jù)分析最重要的思維就是,不斷確定業(yè)務(wù)中兩組變量之間的關(guān)系,用以解釋業(yè)務(wù)。

收入、轉(zhuǎn)化、用戶規(guī)模、用戶活躍等,我們稱為現(xiàn)象。而只有通過數(shù)據(jù)量化的現(xiàn)象,我們才能精準(zhǔn)感知。所以,數(shù)據(jù)是用來描述現(xiàn)象的,是被量化的現(xiàn)象。這就是數(shù)據(jù)統(tǒng)計(jì)在干的事情,比如建立數(shù)據(jù)漏斗,嚴(yán)格意義上這就是數(shù)據(jù)統(tǒng)計(jì)。

而數(shù)據(jù)分析,就是尋找這些被量化的現(xiàn)象之間的「關(guān)系」。這個(gè)關(guān)系就是y=f(x)。找到兩個(gè)變量之間的關(guān)系,多找到一種這樣關(guān)系,在實(shí)踐中,就多一種有效手段。

所以,在數(shù)據(jù)處理層面,有這樣兩個(gè)方式:

  1. 數(shù)據(jù)統(tǒng)計(jì)——利用數(shù)據(jù)體現(xiàn)現(xiàn)象,比如建立數(shù)據(jù)漏斗
  2. 數(shù)據(jù)分析——利用數(shù)據(jù)尋找現(xiàn)象關(guān)系,比如城市特征和活躍之間的關(guān)系

本文核心是圍繞數(shù)據(jù)分析進(jìn)行展開。

比如,做社群運(yùn)營(yíng)的同學(xué),常常會(huì)想,到底什么因素在影響用戶的活躍度。在實(shí)踐的過程中,我們感覺到,不同的進(jìn)入社群的時(shí)間點(diǎn)可能是活躍度比較關(guān)鍵的影響因素。于是,嘗試通過數(shù)據(jù)定義,確定x=進(jìn)群時(shí)間點(diǎn)與開群的時(shí)間差,y=第一月活躍率。我們將x變量按天為單位氛圍不同類別,得到了以下的關(guān)系:

*x變量每類樣本N>50,且基本是同一時(shí)間的社群,排除了其他因素影響

當(dāng)我們得到以上圖示的關(guān)系其實(shí)足以指導(dǎo)我們的工作了——做社群運(yùn)營(yíng),盡量做到及時(shí)開群,不要讓用戶等待,消耗熱情。

所以,數(shù)據(jù)分析最重要的思維就是,不斷去尋找可能與業(yè)務(wù)結(jié)果有關(guān)的變量,確定這兩個(gè)變量之間的關(guān)系。多確定了一種關(guān)系,就多了一種手段,少了一些瞎干。

要做到這些,excel的基礎(chǔ)功能,妥妥解決。通過統(tǒng)計(jì)學(xué)方法回歸分析出一個(gè)量化模型或論證其信效度。

因?yàn)?,?duì)于大部分業(yè)務(wù)而言,動(dòng)作的精度有限,所以不需要分析的精度太高,同時(shí),統(tǒng)計(jì)方法的量化模型無法用業(yè)務(wù)邏輯進(jìn)行解釋,只能預(yù)測(cè),對(duì)于實(shí)操類業(yè)務(wù)意義不大。

業(yè)務(wù)中數(shù)據(jù)分析的一般方法

前面簡(jiǎn)單說了數(shù)據(jù)分析的方法工具誤區(qū)和數(shù)據(jù)分析核心是要去尋找兩組變量之間的關(guān)系。

那在業(yè)務(wù)中,如何進(jìn)行有效的數(shù)據(jù)分析。我將數(shù)據(jù)分析歸納為以下五個(gè)步驟:

  • 第一步,感知問題
  • 第二步,提出假說
  • 第三步,選擇表征
  • 第四步,收集數(shù)據(jù)
  • 第五步,分析驗(yàn)證

第一步,感知問題

如果沒有問題,是不需要數(shù)據(jù)分析的。

但是,那是不可能的。KPI總是差點(diǎn)才達(dá)到,即使達(dá)到了,領(lǐng)導(dǎo)還會(huì)問你,就不能做到更好嗎?

在業(yè)務(wù)中的問題有這樣兩種,一種是直接找最終結(jié)果的問題,比如收入比不上競(jìng)品,DAU下降了10%等;一種是環(huán)節(jié)上的問題,拆解漏斗和業(yè)務(wù)環(huán)節(jié),比如通過分析app數(shù)據(jù)漏斗,發(fā)現(xiàn)每日使用一次人數(shù)相對(duì)于每日打開人數(shù)相對(duì)于流失了30%等。

記住這樣一句話,但凡有差異,必有問題,但凡有問題,必要尋找原因。

這一步困難的不是有沒有問題,差距、不足總是在那里。困難的是,能不能找到最重要,也就是最和業(yè)務(wù)結(jié)果相關(guān)的問題,優(yōu)先級(jí)排序是關(guān)鍵。

而排序的關(guān)鍵就是,基于最重要的結(jié)果或KPI的標(biāo)準(zhǔn)進(jìn)行排序。不斷思考一件事,解決了這個(gè)問題能夠?qū)Y(jié)果有多大的改善?

第二步,提出假說

找到問題,下一步就是找方法解決。

在管理咨詢界有個(gè)說法,叫作不要煮沸海洋。說的是,把所有的,可能導(dǎo)致問題的因素全部找出來分析一遍,那是低效也是不可能的。

所以,這里就需要使用到「假說」的方法。

哪些因素可能影響到收入?哪些因素會(huì)導(dǎo)致打開app的人不使用任何功能直接離開?

找到以上問題可能的答案的過程,就是提出假說的過程。

這里有兩個(gè)路徑用來提出假說,一個(gè)是歸納的方式,一個(gè)是演繹的方式:

什么是歸納式的,就是根據(jù)個(gè)案進(jìn)行總結(jié)。比如在收入可能的影響因素的時(shí)候,我會(huì)找所有相關(guān)工作人員進(jìn)行頭腦風(fēng)暴,提出可能的因素;也會(huì)對(duì)分層的用戶進(jìn)行抽樣深讀訪談,了解他們購買或不購買的原因及其他看法。

什么是演繹式的,就是根據(jù)模型進(jìn)行推演。比如在app打開不使用直接離開,我們可以根據(jù)對(duì)用戶行為模型的理解進(jìn)行拆解,而拆解的有效與否,其實(shí)就是關(guān)于你模型多少、深度。

結(jié)合歸納式和演繹式的方法,我們會(huì)得到非常多的可能與結(jié)果相關(guān)因素。進(jìn)行整理,并進(jìn)行重要性排序。

到這里,我們就找出很多可能、未經(jīng)確定、未經(jīng)量化的y=f(x),也就是一對(duì)對(duì)可能有關(guān)系的變量。

第三步,選擇表征

不可被數(shù)據(jù)量化,就不能被改變。如前文所說,數(shù)據(jù)分析,需要將現(xiàn)象量化,得到可以分析的數(shù)據(jù)。

所以,需要將提出的假說中所選擇的變量,用數(shù)據(jù)來進(jìn)行表征。

在入群時(shí)間點(diǎn)對(duì)用戶活躍度影響的例子中,我們將入群時(shí)間點(diǎn)(x)定義為:入群時(shí)間與開群時(shí)間差;將活躍度(y)定義為用戶從進(jìn)入起一周的活躍率,即一月內(nèi)活躍天數(shù)的占比。

在選擇數(shù)據(jù)表征元素的時(shí)候,需要把握的原則就是:

  • 選擇的數(shù)據(jù)能夠充分代表假說中變量的內(nèi)涵;
  • 選擇的數(shù)據(jù)盡量是用戶客觀行為數(shù)據(jù)而非主觀態(tài)度數(shù)據(jù);
  • 選擇的數(shù)據(jù)是有被記錄或容易獲取。

第四步,收集數(shù)據(jù)

互聯(lián)網(wǎng)的很大優(yōu)勢(shì)就是數(shù)據(jù)驅(qū)動(dòng)的,數(shù)據(jù)往往是被有效收集的。

但是,也存在數(shù)據(jù)沒有被記錄情況。支持產(chǎn)品功能的數(shù)據(jù),會(huì)被記錄,但是很多行為數(shù)據(jù)只能通過調(diào)取接口數(shù)據(jù)或埋點(diǎn)的方式進(jìn)行記錄。這就需要業(yè)務(wù)人能夠提前規(guī)劃所需數(shù)據(jù),讓工程師將數(shù)據(jù)記錄在庫。

在收集數(shù)據(jù)的過程中,需要注意到就是有效數(shù)據(jù)量不能太小。

第五步,分析驗(yàn)證

反倒是,分析驗(yàn)證這個(gè)步驟變得不是那么核心的步驟。

確定好了x與y的含義和數(shù)據(jù),剩下的分析就很簡(jiǎn)單了。通過數(shù)據(jù)可視化的方式,表現(xiàn)出x與y的關(guān)系,就能發(fā)現(xiàn)其中是否存在有價(jià)值的規(guī)律。

發(fā)現(xiàn)x與y存在某種關(guān)系的時(shí)候,最好通過數(shù)據(jù)進(jìn)行再次驗(yàn)證。選擇另外一組數(shù)據(jù),再次進(jìn)行分析,看確定的關(guān)系是否再次被復(fù)現(xiàn)。

當(dāng)然,最重要的驗(yàn)證是在業(yè)務(wù)實(shí)現(xiàn)中體現(xiàn)。

數(shù)據(jù)分析,一種必備能力

數(shù)據(jù)分析,是認(rèn)識(shí)事物的重要方式之一,它的特點(diǎn)是定量的非定性的、過去的非未來的、相關(guān)的非因果的,有其適用范圍,但一定是所有業(yè)務(wù)人必須掌握的能力。

對(duì)于業(yè)務(wù)人,不用太崇拜于方法和工具,首先需要錘煉分析思維,尋找兩個(gè)變量的關(guān)系,真正指導(dǎo)業(yè)務(wù)才是關(guān)鍵。

而在分析的過程中,「提出假說」和「選擇表征」是關(guān)鍵所在,也是很多業(yè)務(wù)人沒有能夠作出有效分析的關(guān)鍵所在。

 

本文由 @個(gè)家 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 你好,文章是很不錯(cuò)的,但是看完結(jié)合我自己自身的數(shù)據(jù)分析,產(chǎn)生了一個(gè)疑問,想請(qǐng)教下作者。
    提出假說部分,給出的(y)和(x)都是非常明確的單一變量,但是在業(yè)務(wù)分析中,很可能會(huì)遇到自變量的情況。
    比如想探究用戶付費(fèi)率(y)和產(chǎn)品試用領(lǐng)取情況(x)之間的關(guān)系,此時(shí)的(x)就是自變量,(y)就是因變量,需要通過兩者之間的關(guān)系來驗(yàn)證。比如領(lǐng)取試用的用戶付費(fèi)率是10%,沒有領(lǐng)取試用的用戶付費(fèi)率是5%,以此說明(x)對(duì)(y)有促進(jìn)作用。但是這種分析方式無法剔除領(lǐng)取試用這一用戶客觀行為是否存在主觀性(即領(lǐng)取試用可能本身存在較強(qiáng)的付費(fèi)傾向)
    想問的內(nèi)容是:
    1.上述情況是否和本篇文章宗旨相悖?
    2.如果相悖,那么針對(duì)上述情況,該如何提出假說、選擇表征?

    以上,望作者不吝賜教,感謝??

    來自江蘇 回復(fù)
    1. 感謝你的問題,不常上這個(gè)平臺(tái),回復(fù)慢了。
      你說的情況與文章的思路并不相悖,但是文章中對(duì)于這種類型的變量關(guān)系并沒有深入探討——
      你舉的例子,本質(zhì)上是付費(fèi)率與試用領(lǐng)取情況是相關(guān)關(guān)系,并非因果關(guān)系。即愿意付費(fèi)和愿意領(lǐng)取試用的用戶可能都是對(duì)于這類產(chǎn)品有需求,付費(fèi)和領(lǐng)取試用是這個(gè)因?qū)е碌膬蓚€(gè)結(jié)果,這兩個(gè)結(jié)果是相關(guān)的。但也不一定是這樣的,用戶可能是因?yàn)樵囉枚鴮?dǎo)致了對(duì)于產(chǎn)品更多了解,更大需求,從而付費(fèi)。所以,這個(gè)時(shí)候需要通過A/B測(cè)試來確定其關(guān)系,如一組自然轉(zhuǎn)化,一組增加領(lǐng)取試用的轉(zhuǎn)化,看差異。若試用組有明顯的優(yōu)勢(shì),那么你需要判斷的是,當(dāng)前提升試用比例是不是一個(gè)關(guān)鍵動(dòng)作,若是,那么你需要找試用的影響因素,比如觸達(dá)、比如包裝、比如試用周期等等,又進(jìn)入新的一輪分析中。
      但是,不管怎么說,多提取出一組y=f(x)對(duì)于理解業(yè)務(wù)都是有價(jià)值的,比如你發(fā)現(xiàn)了領(lǐng)取試用和付費(fèi)之間有一定的關(guān)系,那么你就會(huì)去探究到底這個(gè)是不是因果性的或者及時(shí)其是相關(guān)性的,你可以將它當(dāng)做一個(gè)觀測(cè)指標(biāo)來提前預(yù)測(cè)付費(fèi)結(jié)果。
      不知道是否能夠回答你的問題,可繼續(xù)探討,一起進(jìn)步。

      來自廣東 回復(fù)
  2. “定量的非定性的、過去的非未來的、相關(guān)的非因果的” 筆者這段話讓我著實(shí)困惑。

    來自廣東 回復(fù)
    1. 數(shù)據(jù)分析是一種定量分析方法,而非定性分析方法;
      數(shù)據(jù)分析是針對(duì)過去的歷史數(shù)據(jù)/現(xiàn)象進(jìn)行,而非針對(duì)未來的未發(fā)生的現(xiàn)象進(jìn)行分析;
      數(shù)據(jù)分析尋找的是數(shù)據(jù)之間的相關(guān)關(guān)系,而非因果關(guān)系。相關(guān)關(guān)系和因果關(guān)系是存在很大區(qū)別的

      來自上海 回復(fù)
    2. 感謝吳晗幫助回復(fù),很贊同你的看法。另相關(guān)和因果上面一條評(píng)論中多少涉及。

      來自廣東 回復(fù)
  3. 起點(diǎn)學(xué)院專門為0基礎(chǔ)的0-2歲互聯(lián)網(wǎng)人開設(shè)了《15天入門互聯(lián)網(wǎng)數(shù)據(jù)分析》班級(jí)哦~課程由數(shù)據(jù)思維+真實(shí)案例+實(shí)操相結(jié)合,提升你的數(shù)據(jù)分析能力!戳此了解>>http://996.pm/YNG4e

    來自廣東 回復(fù)
  4. 贊同

    來自江蘇 回復(fù)
  5. 數(shù)據(jù)分析是為了驗(yàn)證,不是為了分析去分析的!

    來自浙江 回復(fù)
  6. 看完之后對(duì)數(shù)據(jù)分析有了學(xué)習(xí)的方向,期待看到更多數(shù)據(jù)分析的文章哦!

    來自廣東 回復(fù)
  7. 分析工具是可以在短時(shí)間內(nèi)學(xué)習(xí)的,重要的還是分析的方法和思路~思想起飛才重要

    來自北京 回復(fù)
    1. 學(xué)習(xí)分析的方法和思路,有推薦的學(xué)習(xí)教程嗎

      來自廣東 回復(fù)
    2. 我個(gè)人經(jīng)驗(yàn),供參考。1、和君系單其武老師的其來有自,比較實(shí)戰(zhàn),學(xué)理上不一定嚴(yán)謹(jǐn);2、學(xué)術(shù)派(其實(shí)也是和君系)的陽志平老師的開智學(xué)堂,學(xué)理嚴(yán)謹(jǐn),需要重功夫。這是個(gè)人測(cè)試不錯(cuò)的課程。如果自學(xué)的話,其實(shí)多看兩本方法論的書就會(huì)有幫助

      來自北京 回復(fù)
  8. 看了前幾段就想留言,講到點(diǎn)上了!

    回復(fù)
    1. 哈哈,有機(jī)會(huì)探討

      來自北京 回復(fù)
  9. “要做到這些,excel的基礎(chǔ)功能,妥妥解決。通過統(tǒng)計(jì)學(xué)方法回歸分析出一個(gè)量化模型或論證其信效度”請(qǐng)問一下,如何通過excel實(shí)現(xiàn)一個(gè)回歸分析的模型?

    來自浙江 回復(fù)
    1. 很抱歉,你引用的那段文字我可能沒有表達(dá)清楚。在業(yè)務(wù)解釋的過程中,建立統(tǒng)計(jì)分析模型的意義并不一定特別大,而是直接通過可視化的方式觀察X變量和Y變量是否有相關(guān)性,描繪成曲線即可,就可以聯(lián)系上直接業(yè)務(wù),對(duì)于普通業(yè)務(wù)型,不需要高精度預(yù)測(cè)的業(yè)務(wù),相關(guān)性就能指明問題。當(dāng)然,如果要用Excel直接做回歸也是可以的,“工具-數(shù)據(jù)分析-回歸”

      來自北京 回復(fù)
  10. 很贊,如果可以落地使用就更好了

    回復(fù)
    1. 期待什么樣的內(nèi)容算落地? ??

      來自北京 回復(fù)
    2. 應(yīng)該是說的有 case的那種

      來自廣東 回復(fù)
  11. 寫的很棒,期待您能再寫1篇關(guān)于數(shù)據(jù)統(tǒng)計(jì)的文章

    來自北京 回復(fù)
    1. OK,這幾天寫一下,一起交流一下

      來自北京 回復(fù)
  12. ??

    來自浙江 回復(fù)