這篇文章把數據講透了(五):數據可視化(中)
編輯導讀:隨著“數智化”時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎?本文將為你重新解讀數據的概念和價值,以及數據的價值是如何在“數智化”時代下一步一步得到運用與升華的。因內容頗多,筆者將分幾期為大家進行講解。
一、前言
上幾期文章中,我們已經了解到“數據”是一個龐大的體系(如下圖所示),并用了菜市場的例子,為大家講解數據來源的含義;用買菜的例子,為大家講解數據采集的步驟;用洗菜、擇菜的例子,為大家講解數據清洗的方法…
而今天小陳主要給大家講解,我們學會做菜以后,怎樣把烹飪方法簡單易懂的傳授給他人,即數據可視化的過程。
二、數據可視化——圖表使用的基本原則
1. 條形、柱狀圖從零開始
條形圖、柱狀圖的圖表展示原理其實很簡單,依靠長度來直觀的顯示判定值的大小和變化趨勢,而當基線改變時,這就會扭曲你的視線,給你造成錯覺和假象。
看下面這張柱狀圖,我們就能有直觀的感受~我們可以看到,從左到右分別為基準線為0直至基準線為50的情況,我們可以看到從左到右第一根柱狀圖漸漸消失了,這就是所說的視覺假象。
2. 柱狀圖過寬或過窄
柱狀圖使用時,需要注意”口徑“(也就是寬度)統一,這樣才能更直觀的給受眾顯示數據的大小差距。
其次,發現柱狀圖的間隔最好調整為寬的一半,這樣比較符合人體視覺觀感。而下圖柱狀圖的口徑顯然不統一,如此一來高度就不能對數量大小進行直觀的度量的(面積=長?寬,一般柱狀圖“寬”統一,那么通過長就能直觀的區分大小)。
3. 切忌過分使用扇形圖
我們先來看一個“過分使用扇形圖”的案例,以下的扇形圖有意義嗎?
一般來說,使用扇形圖樣本類別最好在7個以內,因為餅圖是體現數據之間的對比,扇形數量越少,它們的對比就越清晰。
4. 切忌扇形圖比例順序不當
下面兩個扇形圖中,我們可以看到左邊的扇形圖,并沒有按照扇形占比進行排序,這導致我們需要“跨域”對比,往往會導致視覺疲勞,而右邊的扇形圖則貼心的講板塊占比進行順時針排列。
5. 切忌線型圖中使用虛線
線型圖盡量避免使用虛線,我們看下面這個例子你就能明白。左邊這張線型圖使用了虛線,但使用虛線往往會使人分心,而且一段段虛線會給人造成視覺疲勞,我們容易把虛線看成是節點,而實線就不會有以下煩惱。
6. 尊重整體,但不忽略樣本間的關聯
其實,所有圖表信息無非表達了兩種關系,第一,樣本A與樣本B之間的對比;第二,樣本A與總體的關系。如果這么說,你還有點迷糊,那么我們再舉一個栗子~
看下面這張圖表,它想表達什么信息呢?
- 樣本A與樣本B的對比——此處體現為Bored、Not great之間的百分比對比;
- 樣本A與總體的對比——此處體現為Bored所占How do you feel about doing science?的比例
7. 顯示數據區分度
可視化圖表的初衷是什么?
——更清晰的展示數據背后的規律那么,當數據間毫無區分度可言時,數據可視化又有什么意義呢?
所以,在進行數據可視化項目時,我們還是需要秉持“少即是多”的信條。
切忌為了展示數據而展示數據!就像下圖,一味的追求數據“多”,然后把每一個數據都標出來,甚至看不出點陣的分布趨勢
8. 切忌遮蓋數據
在進行圖表可視化前,我們必須明確一點,即可視化不是最終目的!我們不要為了展示精美的圖表而進行可視化,這樣就本末倒置了。
始終記住圖表可視化是錦上添花,數據真實性才是雪中送炭!
如上圖所示,上面的面積圖因為“覆蓋”原因,數據已經失真了,而下面改良后的面積圖,調整了透明度,我們能夠通過各種顏色的覆蓋面積得出品類占比,不僅保持了數據真實性,而且圖表更為清晰。
9. 同比呈現數據
如下氣泡圖所示,兩張圖想傳遞的主旨都是一樣的,即大氣泡(2X)是小氣泡(X)的兩倍,而左邊的錯誤示范中,就最直觀的面積而言,大氣泡(2X)的面積遠遠大于兩倍的小氣泡(X),而右邊的氣泡圖就真實的多了。
10. 數據對比更直觀
在圖表可視化過程中,我們始終要秉持選擇合適圖表的初衷,讓數據對比更明顯、趨勢更清晰。
如下圖所示,我們想要進行數據的對比,而此時選擇在同一水平面的柱狀圖,我只需要輕輕一瞥,就能明晰的感知誰多誰少,具體占比;而在餅狀圖中,雖然也能夠進行對比,但明顯不如柱狀圖來得快。
三、結語
以上,就是本期可視化圖表使用基本原則的全部內容!
小陳下期繼續為你揭秘,針對不同領域、技術基礎,怎樣針對性的選擇可視化圖表!
往期文章:
本文由 @小陳同學ing. 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
- 目前還沒評論,等你發揮!