這篇文章把數據講透了(五):數據可視化(下)
編輯導讀:隨著“數智化”時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎?本文作者將為大家重新解讀數據的概念和價值,以及數據的價值是如何在“數智化”時代下一步一步得到運用與升華的,一起來看看~
一、前言
上幾期文章中,我們已經了解到“數據”是一個龐大的體系(如下圖所示),并用了菜市場的例子,為大家講解數據來源的含義;用買菜的例子,為大家講解數據采集的步驟;用洗菜、擇菜的例子,為大家講解數據清洗的方法…
而今天小陳主要給大家講解,我們學會做菜以后,怎樣把烹飪方法簡單易懂的傳授給他人,即數據可視化的過程。
二、可視化圖表的選用原則(參考麥肯錫系列書目——《用圖表說話》)
先上圖表選取原則干貨(見下圖),下面我們再針對每個表格的使用進行逐一講解!
圖片來源——公眾號【高端商務報告】
1. 成分類
(1)餅類
一般情況下,我們會選擇餅圖來呈現成分的對比關系。而餅圖使用也存在下面這些“潛規則”
a.遵循閱讀習慣,餅圖成分重要性需要呈順時針順序
在閱讀餅圖時,人們都會下意識的從12點鐘方向,順時針讀下去。所以,為了迎合人們的閱讀習慣,我們需要將數據的占比大小、重要性按照順時針方向切片展示。
b.切片數量不要超過7個,如果餅圖類別很細,對于受眾而言,對比起來是非常困難的。所以,當你發現切片數量將超過6個時,將其余不那么重要的分支整合歸為“其他”項。
c.盡量避免使用立體餅圖,除非你真的有信心避免視覺錯覺。
如下圖所示,從受眾的角度看這張立體餅圖,是不是很難分清楚兩個占比最小的扇形究竟誰大誰???而如果我們采用“俯視”的視角看這張餅圖,就會好區分很多!
2. 項類對比
首先,我們需要明確項類對比的含義是什么,以及它指的對比維度是什么?一般來說,常見的維度對比無外乎數據大小、占比這兩類。而就圖表類型而言,項類對比最常用圖表類型為條形圖,下面我們來談一談條形圖使用的原則。
(1)符合嘗試的默認排序(從大到小、從高到低、從好到差),除非你需要遵循其他邏輯排序
一般來說,人們看條形圖比較想要獲取的是頭部項類對比訊息,沒有人會特別注意尾部項類的占比和對比。所以為了迎合人們的閱讀習慣,我們需要按照從大到小、從高到低、從好到差的默認條形圖排序實現繪制。
當然,遵循其他特定的邏輯排序也是可取的。例如,某公司對比業內競爭者市場占比時,特意按照進入市場的時間長短進行條形圖排序。如下所示,是按照品牌邏輯對條形圖進行展示。
(2)條形圖間隔<條形圖本身寬度
麥肯錫條形圖的分類間距一般設置為本身寬度的20%-50%;而經濟學人的分類間距則為50%-80%,保潔等大型公司的報表中也呈現10%-30%不等。如下所示,是經濟學人一篇文章中的散點圖和條形圖。
雖然,間距不一,但不難發現,業內幾乎沒有分類間距>條形寬度本身的。
3. 時間序列、頻率分布
時間序列,顧名思義,就是一條時間線下數據類別、變量的變化;而頻率分布可能會稍微難懂一點,但我相信看到下面這個例子,你就不陌生了!
相信大家大學上《概率論》的時候,都看過這個函數!概率密度函數,沒錯,他就表示了頻率分布!
時間序列、頻率分布制圖時,通常選取柱形圖、折線圖兩類,而這兩類值間應該怎樣進行選取呢?
在麥肯錫的《用圖表說話》一書中,建議以8個時間點為區分界限,當時間點>8時,采用折線圖,減少視覺對比疲勞,當時間點<8時,選取柱形圖。以下是柱狀圖、折線圖兩種圖表的使用規則。
其次,柱狀圖和折線圖的選擇還和數據特征有關,當你想凸顯特定時間段內產量、銷量等數據指標的時間序列變化,用柱狀圖比較合適,因為它還能夠凸顯程度、數量;而折線圖則更注重變化、變化趨勢,在表現數據發展趨勢和時間序列預測分析中較為常用。
(1)柱形圖
a.柱形圖間隔<柱形圖本身寬度
這一點其實和條形圖類似,此處就不做贅述了
b.堆積柱狀圖使用有度,避免對比混亂
堆積柱狀圖適用于對比多個項目、類別的成分關系,是表達成分對比關系的重要方式。
但需要特別注意,百分比堆積圖盡量不要對比每個類項超出3個細分成分,否則會帶來對比混亂。如下所示,堆積柱狀圖的類項已然超過3個,對比起來就會很混亂。
(2)折線圖
a.趨勢線要突出(顏色、粗細等)
折線圖是以上圖表中,最能夠直觀展示上升、下降、波動、維持原狀趨勢的圖表,它側重于勾勒變化和變化趨勢,用于表達數據的發展趨勢。
但,趨勢線作為折線圖中的主體,一定要突出。而這個突出,可以是顏色上的突出,使用紅色等重點色;也可以是粗細上的突出,比如,我們一定要注意到折線圖趨勢線比網格線、刻度線粗!
4. 相關性
相關性分析中,我們常使用散點圖直觀地顯示變量間的相關強度、相關方向,并用于探索性數據分析,做出擬合曲線和回歸方程,對未來趨勢進行探索性預測。
(1)散點、氣泡圖
a.散點、氣泡大小需要直觀
人都是視覺動物,而圖表需要做到就是把人的視覺利用到極致!散點圖、氣泡圖中,每一個散點、氣泡就代表著一個樣本個體,而散點、氣泡的大小就能只管的展示出該樣本的大小。所以,我們在制作圖表時,需要充分利用這一點,用散點、氣泡大小直觀的展示樣本間的關系。
三、結語
以上,就是本期可視化圖表選取原則的全部內容!我們【這篇文章把數據講透了】系列到這里也就完結了!撒花??!
接下來,你想看哪方面的文章呢?
#相關閱讀#
本文由 @小陳同學ing. 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
- 目前還沒評論,等你發揮!