數(shù)據(jù)之美 | 數(shù)據(jù)可視化三節(jié)課之一:可視化的意義
編輯導讀:對于復雜難懂的數(shù)據(jù),用圖表的方式能夠更直觀地呈現(xiàn)數(shù)據(jù)背后的信息。好的可視化能夠幫助我們快速發(fā)現(xiàn)規(guī)律,找到原因;不好的可視化有可能會得出錯誤的結論,產(chǎn)生誤導。想要做好數(shù)據(jù)可視化,先要明白,數(shù)據(jù)可視化是什么、能做什么。本文將從三個方面展開分析,希望對你有幫助。
“?推測未來將要發(fā)生什么的最好方式,就是記住過去曾經(jīng)發(fā)生了什么。?”—— 喬治·薩維爾
金錢永不眠,屠夫問候各位早安。
近期因為工作需要,屠夫梳理了自己在投資和工作實踐中對「數(shù)據(jù)可視化」的經(jīng)驗和思考。我將用三節(jié)課講述“數(shù)據(jù)可視化”的話題,希望給你一些啟發(fā)。
有句話叫“一圖勝千言”,對于看似復雜難懂的數(shù)據(jù)而言,尤其如是。數(shù)據(jù)可視化,是將數(shù)據(jù)轉換成圖或表進行呈現(xiàn),以一種更直觀的方式展現(xiàn)數(shù)據(jù)。對于經(jīng)常需要用數(shù)據(jù)、做分析、理邏輯的投資者來說,數(shù)據(jù)可視化是一項利器。
許多人看過數(shù)據(jù)可視化,但未必都明白如何做好數(shù)據(jù)可視化。好的可視化,可以幫助我們快速發(fā)現(xiàn)規(guī)律、找到原因、作出判斷;不好的可視化,可能讓人作出似是而非的結論,甚至引向大錯誤。
一、「數(shù)據(jù)」可以用來做什么?
在了解知識、技能或工具前,屠夫總喜歡先了解它的“作用”,或者說“它究竟能解決什么問題”。數(shù)據(jù)可視化和數(shù)據(jù)緊密相關,更具體地說是和“數(shù)據(jù)分析”緊密相關。所以,對于任何一個想要了解可視化的人來說,弄懂“數(shù)據(jù)”和“分析”解決了什么問題應當排在首位。關于“數(shù)據(jù)究竟解決什么問題”,屠夫歸結為“FIVE”4個字母:
- Forecast 預測
- Insight 洞察
- Validation 驗證
- Evaluation 評估
一年前寫的《數(shù)據(jù)的F.I.V.E.用法》里的“I”是“Inspiration 啟發(fā)”,如今覺得還是改為“Insight 洞察”更貼切預測,是數(shù)據(jù)應用的最高級形態(tài)。
從數(shù)據(jù)獲得啟發(fā),以數(shù)據(jù)驗證想法,用數(shù)據(jù)評估現(xiàn)狀,都服務于對未來的預測,最好能夠“運籌帷幄之中,決勝千里之外”。作為最高級形態(tài),預測又是困難的。理想模型在落地時往往需要層層假設,這些假設里任何一個參數(shù)的偏差,都有可能“失之毫厘謬以千里”。
正如《關于預測,你應該明白的3個道理》所說,預測的尺度越小越精確,卻越不容易準確。所以,在預測的精確性和準確性之間,最終取得的妥協(xié)往往是“模糊的正確”。
洞察,是假設和靈感的來源。許多規(guī)律在得到嚴謹?shù)臄?shù)據(jù)驗證之前,都是先從歷史數(shù)據(jù)中獲得洞察。我們可以從標普500和滬深300的部分歷史數(shù)據(jù)中得到“寬基指數(shù)長期上漲”的想法,這就是數(shù)據(jù)的“洞察”作用,而且往往是通過數(shù)據(jù)可視化實現(xiàn)的。至于這個想法到底對不對,要用數(shù)據(jù)加以驗證才知道。
驗證,是數(shù)據(jù)驅(qū)動決策的試金石。一些似是而非的假設和靈感可能將人帶入歧途,而用數(shù)據(jù)進行驗證,將大大減少這類情況發(fā)生。
驗證的方式有許多:
在投資里,對量化策略進行“回測”,是典型的驗證;數(shù)據(jù)分析時,構造蒙特卡洛模擬進行試驗,也是驗證;互聯(lián)網(wǎng)行業(yè),采用A/B測試檢驗策略有效性,同樣是驗證。
驗證的天花板是?“absence of evidence”?——“沒有證據(jù)證明您有癌癥”和“有證據(jù)證明您沒有癌癥”,不是一碼事。感興趣的同學可以看看《決策與判斷的誤區(qū)》中的詳細解釋。評估,是使用數(shù)據(jù)的基本立足點。數(shù)據(jù)的“評估”式用法,實際上是通過數(shù)據(jù)構造出一個框架,然后將現(xiàn)狀與框架對比。
可以對同一對象,橫跨不同的時間段,縱向?qū)Ρ?;也可以對多個對象,選取同樣的時間段,橫向?qū)Ρ取?/p>
屠夫曾以“地圖”和“六分儀”作比喻:
預測就好比使用地圖,而評估則是使用六分儀。
先以六分儀測量出經(jīng)緯度,確定“當前在哪兒”,使用地圖時才會心中有數(shù);先用數(shù)據(jù)進行評估,判別清楚當前的狀況,你的預測才不會成為無源之水。
數(shù)據(jù)可以用來做什么?屠夫的看法是:【數(shù)據(jù)能用于預測】預測是數(shù)據(jù)應用的圣杯,是啟發(fā)、驗證和評估的最終目標【數(shù)據(jù)能帶來洞察】在歷史數(shù)據(jù)的啟發(fā)下,我們可以形成新的靈感或假設【數(shù)據(jù)能驗證假設】經(jīng)過驗證的假設才有機會成為結論,反之只是一種猜想【數(shù)據(jù)能評估現(xiàn)狀】有數(shù)據(jù)支撐的現(xiàn)狀評估,讓預測和驗證成為有根之木。
二、「分析」能解決哪些問題?
有了數(shù)據(jù),還需要分析才能解決問題。
“分析”究竟能解決哪些問題?屠夫歸結為4類:是什么、為什么、怎么辦和好不好。
回答“是什么”的問題,屬于描述統(tǒng)計。我們?nèi)粘R姷降内厔菡劬€圖、頻率分布直方圖,都是通過對數(shù)據(jù)特征進行描述,一般稱之為描述統(tǒng)計。立足于歷史和現(xiàn)狀,側重在現(xiàn)象和特性的展示?!笆鞘裁础逼鋵嵅⒉凰阏嬲饬x上的分析,許多數(shù)據(jù)看板和BI都能實現(xiàn),其威力大小取決于使用數(shù)據(jù)的人。然而這并不妨礙描述統(tǒng)計在分析領域的地位 —— 它是許多規(guī)律、假設和猜想的源頭。除此之外,如果回答的是“未來是什么”,這種描述又帶上了預測色彩了。
回答“為什么”的問題,屬于歸因分析?!皻w因分析”一般指互聯(lián)網(wǎng)渠道運營對不同渠道產(chǎn)生的價值貢獻進行歸因。屠夫借這個詞推而廣之,將“尋求原因和解釋”一類的“為什么”問題,都算作歸因分析。人類是一種對“解釋”有著極度狂熱的動物。當我們通過描述性統(tǒng)計發(fā)現(xiàn)了一些現(xiàn)象時,自然而然會想要知道現(xiàn)象背后的根源,以便復現(xiàn)、加強或者削弱這類現(xiàn)象。
回答“怎么辦”的問題,屬于策略分析?;ヂ?lián)網(wǎng)行業(yè)有不少數(shù)據(jù)分析崗位,但是 ——只解答“是什么”,充其量就是人肉取數(shù)工具;只解答“為什么”,不過是產(chǎn)出專題分析報告;只解答“好不好”,只能完成效果復盤和回測。
上述3者聽起來都不夠給力,是因為你的分析,沒有轉化成可操作的策略,分析結果距離落地太遠了。
上面是互聯(lián)網(wǎng)領域的例子,對于投資領域來說更好理解:制定投資策略,通過分析確定約束規(guī)則,決定在什么條件該做什么事,就是策略分析。
回答“好不好”的問題,屬于效果檢驗。投資領域提到的“歷史回測”,和職場工作里常常需要進行“效果復盤”,都是在回答“好不好”的問題。仔細想想就會發(fā)現(xiàn),“好不好”其實和上面提到的“驗證”關聯(lián)非常緊密。事實上,數(shù)據(jù)分析里有一部分工作就是用數(shù)據(jù)來驗證效果,和預期作對比確定“好不好”。
分析能解決哪些問題?屠夫的看法是:【回答“是什么”】描述統(tǒng)計,可以展示現(xiàn)象和特性,立足歷史和現(xiàn)狀,是規(guī)律和猜想的源頭。【回答“為什么”】歸因分析,可以深挖現(xiàn)象背后的原因,通過回溯根源,最終利用這些現(xiàn)象?!净卮稹霸趺崔k”】策略分析,是為了將分析轉化成可操作、可落地的、實實在在的策略。【回答“好不好”】效果檢驗,是為了驗證落地操作后的結果是否符合預期。
三、「可視化」的意義是什么?
說到這里,我們不妨把「數(shù)據(jù)」和「分析」的作用,做一個連線?;卮稹笆鞘裁础眴栴}時,需要借助數(shù)據(jù)產(chǎn)生「洞察」,在一定框架對比之下進行「評估」,還可以對未來的情況進行「預測」:
回答“為什么”問題時,需要借助數(shù)據(jù)的「洞察」找規(guī)律,挖掘現(xiàn)象背后的原因,有條件的話最好有一定的「驗證」:
回答“怎么辦”問題時,需要從「洞察」和「評估」出發(fā),考慮可操作、可執(zhí)行的應對策略,甚至會利用數(shù)據(jù)進行一定程度的「預測」:
回答“好不好”問題時,以「驗證」效果是否符合預期為目的,結合「洞察」來使用數(shù)據(jù):
發(fā)現(xiàn)了嗎,洞察是被用的最多的,4大類分析問題都離不開「數(shù)據(jù)洞察」:
事實上,缺乏可視化的情況下幾乎不可能發(fā)揮出數(shù)據(jù)的「洞察」作用。洞察是最需要可視化輔助分析的數(shù)據(jù)用法,這個“輔助”體現(xiàn)在兩方面:
- 輔助分析過程的推理
- 輔助分析結果的表達
當我們希望深入分析、挖掘有用結論時,可視化可以幫助我們發(fā)現(xiàn)規(guī)律、理清思路。比如下面這張來自《經(jīng)濟學人》的網(wǎng)絡圖,把近20年美國國會的投票記錄進行可視化。如果兩名參議員對一項法案投出相同一票,就會以線相連。從圖中不難看出,美國國會的黨派分歧越來越嚴重。
來源:經(jīng)濟學人
當我們表達自己的分析結果時,可視化提供了更簡單、直接、易懂的方式。比如下圖對150萬次公共跑步、散步和騎自行車活動路線進行可視化,亮度越亮表示路線越受歡迎。這份可視化結果的背后是枯燥難懂的數(shù)據(jù),但是以這種形式表達,可以讓使用者一眼就發(fā)現(xiàn)熱門路線:
來源:語雀 · 墨者學院 · 墨者修齊
所以,對于“可視化的意義是什么”,屠夫的回答是:第一,在數(shù)據(jù)的4種用法里,「洞察」可以覆蓋“分析”的4大類問題第二,在分析過程中,「洞察」非常需要可視化的輔助,這個輔助體現(xiàn)在:
- 可視化可以輔助分析過程的推理
- 可視化可以輔助分析結果的表達
以上就是第一節(jié)課的內(nèi)容,下周將為大家?guī)淼诙?jié)課 —— “可視化的使用”,敬請期待!
作者:屠夫1868,微信公眾號:基業(yè)長紅
本文由 @屠夫1868 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉載。
題圖來自Pexels,基于CC0協(xié)議。
nice
奈斯
??