5個要點,讓你擁有數據分析思維

10 評論 14739 瀏覽 140 收藏 20 分鐘

本文分析了如何擁有數據分析思維的5個要點:說事實,而不是觀點、用客觀標準代替主觀判斷、不預設立場、演繹而不是歸納、找出背后的邏輯。

引言

數據分析師究竟要掌握哪些技能?

大部分的數據分析教學都會教你excel,Python,sql,機器學習,還有一些分析方法比如對比分析、漏斗分析、留存分析等等技能。

但是,很多人掌握了這么多工具和技能,依然做不好數據分析。面對具體的業務問題,我們還是容易兩眼一抹黑。

就像我們大部分人學習英語,都會學習單詞、語法、音標等等,但是一開口就跪了。而英語母語的人就算不懂語法是什么,卻能如同抬手睜眼一樣自然地用英語表達。

這其中的區別,便是因為英語母語的人擁有“英語思維”。

想要做好數據分析也一樣,單單會工具和技能是不夠的,還必須擁有數據分析思維。數據思維決定了你如何思考問題,如何搭配這些分析方法,如何得出結論,如何確定問題。

那么究竟什么是分析思維呢?我認為有以下幾個方面。

1. 說事實,而不是觀點

數據分析師第一個要訓練的思維方式便是:只說事實,不說觀點。

事實和觀點這兩個名詞看起來區別很大。但實際上在生活中我們經常會將兩者混淆。

比如說你的同事告訴你:最近的轉化率大幅下降。

這句話到底是事實還是觀點呢?

很顯然這句話是觀點。究竟下降多少算大幅下降?也許你認為的大幅下降在我看來變化并不大。

那么如果他說:轉化率下降了。這句話是事實還是觀點呢?

這句話看起來已經非常像事實了,但是實際上它依然屬于觀點。

有這樣一種情況,轉化率在短期內它看起來是下降的,但是你站在宏觀的層面上,以月為單位甚至以年為單位,它是它是上漲的,那么你究竟說他是上漲還是下跌呢?

那么什么是事實?

周一到周三的轉化率持續下降,周三相比周一已經下跌了5%。這句話就是事實,這句話不同的人都能理解,不會出現歧義。

只有分清楚觀點和事實才有繼續分析的可能性。

因為觀點的溝通會出現誤差,而事實則不會。如果我們用觀點進行溝通,自然會出現大量的誤解。

如果連背景都沒有理解清楚,后續的分析也就無從談起。

2. 用客觀標準代替主觀判斷

但是單純只有數據,對業務問題的分析沒有什么幫助。畢竟我們得知道這個數據到底帶來了哪些業務信息。所以最后事實還是要歸納成“觀點”。

不過如果我們用主觀判斷數據的好壞,那么還是回到了原來的老路上去。

那么周三相比周一轉化率下跌了5%,這個數據到底表現如何呢?

想要解讀出觀點,我們需要先找到一個標準。

標準怎么找?

  1. 可以是老板定的標準,看數據是否符合老板心中的標準。雖然這也是拍腦袋,不過老板畢竟是老板,他們心中有些戰略構想是建立在某些條件滿足的基礎上的。所以沒什么說的,如果老板不滿意,那這數據肯定是有問題的。
  2. 可以看行業和競品的平均標準,看數據下降是否是行業的普遍現象。
  3. 看企業過去的平均水平,可以在歷史數據中找到類似場景下的數據情況,和自己的過去對比。

然后我們通過數據和這些標準進行對比,得出一個觀點。比如我們可以分析每周的情況,看歷史上是否存在這一的趨勢,平均下跌是多少?如果歷史上每周三都會下跌,平均下跌7%,那么我們就可以認為目前數據比較正常,沒有問題。

這樣得出的結論全都是客觀的,如果你不找標準,而用主觀判斷數據的好壞,那么不同部門的人會溝(shuai)通(guo)很久。

3. 不預設立場

人們總是習慣于通過自己的現存經驗和知識去判斷未知事物。

這本身是進化帶來的優勢,它能讓人在信息不完備的情況下迅速做出決斷并付諸實施。

這種預設立場的思維在原始人的時代很有價值,其優勢在于:

  • 第一,不浪費寶貴的能量,大腦是能量消耗大戶;
  • 第二,快速決斷,避免因為低效決斷而錯失機會,這一點在避免傷害時尤為重要。

在數據分析的場景下,我們需要盡可能地找出真實原因。此時這種預設立場的決斷方式會造成許多錯誤,因為現有經驗和知識在應對未知事物時是不足的,是有偏差的。

而且不同崗位的人還會存在“屁股決定腦袋”的現象。

如果出現了業務問題,關聯的業務方往往預設一個立場:這事沒有看起來那么糟,或者這事和我沒關系。

比如轉化率下降了,業務方的反應往往是這個數據下降肯定跟自己無關。

自己的運營活動明明做的很成功,轉化率下降一定是行業因素、用戶質量等等其他因素導致的。于是為了證明這個觀點,他們順著這個預設的前提,找到一些相關的證據來解釋轉化率下降的現實。

實際上,想要證明一個觀點,只要你肯去找,不管觀點多么荒謬,總能找到支持你的理由。

不僅辛普森悖論這種統計學的把戲可以得出完全相反的結論,即使最簡單的“真話不全說”的方法,也能達到這種目的。

比如,我說兩個比較荒誕的列子:

1. 把正例說成反例

我想要證明一種物質是有害的,我列舉出以下論點:

  • 它是酸雨的主要成分;
  • 對泥土流失有促進作用;
  • 過多的攝取可能導致各種不適;
  • 皮膚與其固體形式長時間的接觸會導致嚴重的組織損傷;
  • 吸入該物質容易引發窒息;
  • 處在氣體狀態時,它能引起嚴重灼傷;
  • 在不可救治的癌癥病人腫瘤中已經發現該物質;

怎么樣,你會不會覺得這是一種非常危險的物質,實際上上面描述的是“水”。

2. 想要把反例說成正例也沒問題

比如中國男足,想要把男足描述成世界強隊行不行?

當然行。

  • 哥斯達黎加是世界杯史上為數不多能夠戰勝中國隊的國家
  • 即使是巴西隊這樣的世界強隊也僅戰勝過中國隊一次
  • 自2002年韓日世界杯后,中國隊在世界杯正賽上不敗紀錄已經延續12年
  • 縱觀漫長的世界杯史,中國隊也僅輸過三次
  • 中國隊從未在世界杯點球大戰中失利過
  • 中國隊在領先的情況下從未丟過球

你看,只要你想證明一件事,總能找出一些證據。

所以,預設立場再去找證據是一件相當不靠譜的事。

數據分析部門一般獨立于業務部門之外,這樣可以確保數據分析師沒有業績壓力,分析具有獨立性。

因為數據分析的獨立性,所以最終問題究竟是在產品上、運營上或者市場上,數據分析師不會有明顯的偏向,只認客觀數據。

同樣是轉化率下降了,數據分析師的職責就是找出下降的真實原因。他們要梳理出和轉化相關聯的各個環節,獲取數據,根據數據推演出合理的結論。

有些資深的數據分析師有一定的業務敏感度,他們會提出一些可能性很大的假設。比如他們猜測可能是運營出現了問題,那么就需要找到一些數據來驗證這個假設。

但是假設驗證和預設立場不同。

預設立場,是要找到證據來證明猜想,一個數據不行,那就換另一個數據。直到能證明這個觀點為止。

而驗證假設,則是事先規劃驗證這個假設需要的數據。如果數據最終不符合假設,那么就拋棄這個假設。

好的數據分析師,能夠根據客觀數據,隨時拋棄舊的假設,并建立新的假設。

拋棄固有的思維定式,這是非常反人性的,這也是為什么說數據分析需要專業訓練的原因。

4. 演繹而不是歸納

邏輯思維方法分為歸納法和演繹法。

歸納法是從特殊到一般的推理,是從結果找原因的方法。

也就是說,通過觀察很多個別事物的特殊性,然后概括出同類事物的特征。

但是我們一般不可能觀察到這個事物的所有樣本。所以歸納法得出的結論是不確定正確性的。

你有沒有聽過這個故事:

在一個火雞飼養場里,一只火雞發現,不管是艷陽高照還是狂風暴雨,不管是天熱還是天冷,不管是星期三和星期四,每一天上午的9點鐘,主人都會準時出現,并給它喂食。
于是,它得出了一個驚天大定律:“主人總是在上午9點鐘給我喂食。”
時間來到圣誕節的前一天,上午9點,主人又一次準時出現,但是這一次,主人帶來的并不是食物,而是把它變成了食物….

這個是英國哲學家伯特蘭·羅素提出的一個問題,被稱為「羅素的火雞」,用來諷刺那些歸納主義通過有限的觀察,得出自以為正確的結論。

大部分人思考問題,會優先使用歸納法。因為這是人類認識世界的方法,這是人性決定的。

比如一月到三月的成交金額連續上升,初級分析師往往會說:成交金額呈現上升的趨勢。

這句話的潛臺詞是,預計交易金額在四月份也會上升。

這是典型的歸納法思維:因為過去是這樣的,所以未來應該也會繼續這樣。這和那只火雞的思維其實也沒有什么本質的差別。而且這和沒分析一樣,你把數據丟給業務方,他們也能看出目前呈現上漲的趨勢。

如果想要做好數據分析,就不能濫用歸納法,這點依然很反人性。

那我們用演繹法,如何思考這個問題的呢?

演繹法是從一般到特殊的推理,是從原因找結果的方法。

要想預測四月份的成交金額會如何,首先需要分析前三個月的成交金額為什么會上漲?當時的背景是什么?上漲需要哪些條件?四月份的這些條件是否依然存在?如果維持成交金額上漲的條件不變,我們才能說四月份會繼續延續這種上漲的勢頭。

經過演繹法推理的結論才是合理的,而且我們通過深挖找出了內部的原因,這才是業務人員想要知道的。

數據分析的價值就體現在這。

5. 找出背后的邏輯

數據分析師是需要大量的邏輯思維訓練,但我們自己做好還不夠,我們的工作必需和業務方溝通,幫助他們解決實際的業務問題。

但是很多業務人員沒有考慮清楚就跑來溝通,他們的需求可能充滿了邏輯問題,這時我們就需要幫對方理清思路,找出對方表述背后的邏輯。

數據分析師往往會聽到業務方這樣問:本周的轉化率相比上周已經下降了5%,怎么辦?

這句話聽起來感覺沒什么問題,實際上邏輯并不是特別嚴密。

首先,這句話的前半部分很好地表達了事實,值得表揚。如果前半句是一個觀點,我們還要先找到事實。

但是這句話的后半句有問題,后半句的“怎么辦”,放在這個語境中,潛臺詞其實是這樣的:

  • 本周轉化率相比上周下降了5%
  • 這是個不好的情況
  • 需要解決這個問題
  • 怎么辦?

相比最開始的表述,我們分析出這句話中間出現了兩個衍生的問題。

問題1:轉化率下降5%真的是不好的情況嗎?

這就涉及到了標準了,之前提到了我們要找到一個客觀標準,通過標準解決出數據的業務含義。

因此我們首先要協助業務方找到一個標準。

問題2:如果數據表現真的不好,那么這是現在急需解決的問題嗎?

這個問題的答案也是不一定。

商業世界要解決的問題太多,在同一時刻,永遠存在著各種各樣的問題。

而企業的資源是有限的,不可能同時解決所有的問題。問題的解決必然有輕重緩急之分。

那么憑什么要先解決轉化率的問題,而不是解決引流的問題、留存的問題、活躍度的問題?

數據分析師必須了解企業當前的戰略方向,把有限的資源投入到更重要的方向上。

如果上面這兩個隱藏的問題不想清楚,就開始分析怎么辦,那么這類分析師的工作往往會費力不討好,做很多低績效的工作。

技藝理性需要長時間的練習

說到這兒你有沒有覺得,分析師的工作和法律工作者非常的像。

法官只看事實,一切都講證據。

法官需要標準,標準就是法律文本。即使被告的行為看起來多么地不符合社會道德,只要法律沒有規定不允許,那么法官就不能認為有罪。

法官不預設立場,法律的原則是無罪推斷,任何人在未經證實和判決有罪之前,都視其無罪。

法官要用演繹法推斷。法官的判決講究證據鏈完整。證據鏈中的鏈字,就有一環扣一環的含義在其中。很明顯就是需要用演繹法來進行分析。

最后律師要理清當事人的邏輯,大部分人是說不清一件事的,當事人在律師的引導下把事情逐漸還原。

法律史上有一個非常著名的故事,可以為我們帶來一些啟發。

在1608年,英國國王詹姆斯召見了法官,提出一項要求:既然法官只是國王的代理人,國王自然有權直接裁決訴訟案。

但大法官柯克反對說:國王本人不能裁決任何案件。

詹姆斯一世說:“法律以理性為基礎,除了法官之外,我和其他人一樣具有理性,為什么就不可以裁決訴訟案?”

柯克大法官很聰明,先夸了國王一番:“確實,上帝賦予了陛下卓越的技巧和高超的天賦;”

接著,他又說:

“但陛下對于英格蘭本土的法律并沒有研究,而涉及陛下之臣民的生命或遺產、或貨物、或財富的案件,不應當由自然的理性,而應當依據技藝理性和法律的判斷來決定,而法律是一門需要長時間地學習和歷練的技藝,只有在此之后,一個人才能對它有所把握?!?/p>

這個故事中非常重要的觀點就是“自然理性”不等同于“技藝理性”,而技藝理性是需要長時間的專業練習的。數據分析也一樣。

總結

很多人想要數據分析速成。他們認為“自然理性”加上“分析工具和方法”就能做好數據分析。分析工具、分析方法等技能確實可以速成,但是數據分析的能力不是自然理性能夠駕馭的。想要做一個好的數據分析師,必須擁有數據分析的思維,這是一種“技藝理性”,有一點反人性,必須花大量的時間訓練才能掌握。

如果你學會了很多數據分析的工具和技巧,依然做不好數據分析。建議嘗試練習本文提到的思維。要點很簡單,堅持,堅持,堅持。

#專欄作家#

三元方差,公眾號:三元方差(sanyuanfangcha),人人都是產品經理專欄作家。專注用數據驅動業務增長,擅長數據分析、用戶增長。喜歡閱讀、思考和創作。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 演繹推斷和復盤有什么區別

    回復
  2. 受益匪淺,謝謝

    回復
  3. 很受啟發!??!
    想學習下數據分析思維,能否推薦一些相關書籍?

    來自北京 回復
    1. 一直沒有找到比較適合的書,真要推薦的話麥肯錫的一些書可以看看。
      文中的幾個要點能學習下來就已經不容易了。

      來自浙江 回復
    2. 蠻贊同

      來自浙江 回復
  4. 寫的真好

    回復
  5. 為什么這個APP不在底部欄顯示點贊按鈕,卻顯示收藏按鈕,然后不喜歡的按鈕和點贊按鈕等價顯示呢?而且放在右手邊,感覺地位更重

    回復
  6. 邏輯清晰,事例有趣。寫的很好吶~加油

    回復
  7. 感謝您的分享。
    能否推薦一些練習思維的資料或書籍?

    回復
    1. 一直沒有找到比較適合的書,真要推薦的話麥肯錫的一些書可以看看。
      文中的幾個要點能學習下來就已經不容易了。

      來自浙江 回復