怎么更好地進行數據可視化?
在數據分析領域,有效的數據可視化對于清晰傳達信息至關重要。林驥分享了兩本關于數據可視化的書籍,著重介紹了數據可視化的指導原則、圖表類型及樣式指南,幫助我們通過視覺工具更高效地理解和展示數據。
你好,我是林驥。
在日常工作中,我們常常需要借助數據可視化的方法,更好地展示自己的洞見,讓信息傳遞變得更加高效。
最近,我看了兩本與數據可視化相關的書,分別是《更好的數據可視化指南》和《Excel 數據可視化實操指南》,作者是美國的喬納森·施瓦比什(Jonathan Schwabish),他是一個經濟學家、作家、教師,也是一個數據可視化的專家。
這兩本書的譯者是易煒老師,他認為要做好數據可視化,需要非常廣泛的知識,包括但不限于格式塔心理學、設計原理、色彩規則、圖表類型等。
《更好的數據可視化指南》這本書包括 3 個部分,主要介紹了數據可視化的指導原則、圖表類型和樣式指南,目的是提升圖表素養,豐富圖表工具箱。
1、數據可視化的指導原則
結合《更好的數據可視化指南》和作者博客中的內容,下面介紹 5 個數據可視化的指導原則:
① 展示數據 ② 減少混亂 ③ 圖文結合 ④ 前注意加工 ⑤ 從灰色開始。
這些指導原則能幫我們更好地理解和滿足受眾的需求,為制作合適的圖表奠定基礎。
① 展示數據
突出展示與主題相關的數據,而不是所有的數據。例如,下面兩張散點圖,右邊突出顯示幾個想要強調的數據點,這樣更容易閱讀。
② 減少混亂
刪除不必要的視覺元素,例如:加粗的網格線、紋理填充、漸變等都可以去掉。
③ 圖文結合
把圖表與文字融合在一起,各自為信息傳遞做出貢獻。例如:在折線圖的尾部直接標注相應的文字,而不是用圖例。
④ 前注意加工
前注意加工是心理學中的一個概念,指的是在注意力集中之前,大腦會快速自動進行初步處理,幫助我們瞬間篩選出差異比較大的信息。
⑤ 從灰色開始
剛開始把整個圖表設置為灰色,然后思考需要強調的地方,再給這些地方設置相應的顏色。
我們在制作數據圖表的過程中,不妨試著遵循這些指導原則,提升數據可視化的效果。
2、數據可視化的圖表類型
市面上教你怎么制作出漂亮、炫酷、華麗圖表的資料比較多,但真正從源頭上厘清怎么正確選擇圖表類型的資料卻很少。
我曾在「數據可視化的方法和工具」一文中介紹過一些圖表類型,后來 Chart.Guide 又增加了一些新的圖表:
在《更好的數據可視化指南》這本書中,作者基于圖表的用途,把 80 多張圖表分為 8 個大類:比較、時間、分布、地緣、關系、構成、定性和表格,比 Chart.Guide 中多了 2 個分類:定性和表格。
各類圖表是如何起作用的?它們的優缺點分別是什么呢?
① 比較
用于比較的圖表有很多,包括各種各樣的條形圖,還有點狀圖、馬賽克圖、單元圖、同型圖、華夫圖、熱力圖儀表圖、子彈圖、氣泡圖、?;鶊D、瀑布圖等。
雖然條形圖很容易閱讀和理解,但是千篇一律的條形圖會讓人感到無聊,因此有時需要找到更有吸引力的圖表。
例如,把?;鶊D用來展示公司的財務數據指標,可以幫助受眾更加清晰地知道公司的主要經營模式。
② 時間
表現時間變化的圖表,除了常見的折線圖之外,還有斜率圖、迷你圖、凹凸圖、周期圖、面積圖、流圖、地平線圖、甘特圖、流程圖、時間線等。
雖然折線圖清晰易讀,但當不需要顯示時間序列中的所有數據時,斜率圖是一個不錯的選擇。例如,我們可以根據線條的陡峭程度,直觀地感受到變化的幅度。
③ 分布
呈現數據分布的圖表有直方圖、金字塔圖、誤差條形圖、置信區間圖、漸變圖、扇形圖、箱線圖、蠟燭圖、小提琴圖、山脊圖、蜂群圖、麥穗圖、云雨圖、莖葉圖等。
對大多數普通讀者來說,理解這些圖表可能會有點困難,因為需要具備一定的統計學知識。例如,小提琴圖可以用來顯示數據的整體分布情況,其中越厚的區域表示這部分觀測值越多,反之則越少。
④ 地緣
數據地圖可以讓受眾從中找到自己與主題的關聯,這是其他圖表無法比擬的一個優勢。然而,地理區域的大小與數據的重要程度可能并不相符,在繪制數據地圖之前,要停下來想一想,這是一個正確的選擇嗎?
我們可以權衡數據可視化的準確性與地圖的熟悉度,通過變形地圖的方式,來調整數據失真的問題。例如,用六邊形表示每個省份,填充的顏色深淺與數值大小相對應。
⑤ 關系
展示變量之間關系的圖表,除了散點圖之外,還有氣泡圖、平行坐標圖、雷達圖、和弦圖、弧線圖、網絡圖、樹形圖等。其中有些圖表不常用,讀者理解起來比較困難。
這并不是說要刻意復雜化,或者干脆不使用,而是要促進自己思考,從而更好地呈現想要傳遞的信息。例如,可以使用標簽、注釋、標題、顏色、圖例和提示來讓圖表更容易被理解。
⑥ 構成
展示整體與部分之間關系的構成類圖表,除了最常見的餅圖之外,還有圓環圖、樹圖、旭日圖、南丁格爾圖、維諾圖等。在數據可視化領域,大家對餅圖的使用存在一些爭議。
從感知層面來看,我們難以識別和對比每塊餅的面積大小,但作為一種大眾熟悉的圖表,熟悉度本身就是有用的。如果你的目標是清晰、準確地判斷數據的大小,那么餅圖通常都不是最好的選擇。
但當扇形占比是我們熟悉的 25%、50% 或 75% 時,你可以用餅圖輕松引導讀者的注意力。假設你要寫一份數據分析報告,想要說明某個類別的占比超過 50%,讓讀者了解顯著的差異或關注某個類別,餅圖就會很有用。
⑦ 定性
對于非數字信息,我們可以用定性的方法來講故事。
比如,圖標、圖像、表情符號等視覺語言,可以吸引讀者的注意力,便于讀者對定性數據進行分類。
詞云圖是可視化定性數據的一種流行方式,單詞的大小與其出現的頻次有關。例如,下面是朋友們描述我的一些詞語,其中形容我最多的 3 個詞是:自律、專業、嚴謹。
⑧ 表格
設計良好的表格,可以幫助讀者快速找到重要的數值,并從中發現規律。
例如,下表是我 2023 年每天的情緒能量評分,從數據中可以看出,上半年的情緒能量比較高,而下半年的情緒能量比較低,尤其是 2023 年 12 月 24 日這一天,情緒降到低谷。
通過時間記錄,我可以找到這一天情緒低落的原因。
3、數據可視化的樣式指南
數據可視化的樣式指南包括:定義構成要素、規定相應格式以及如何正確使用,例如字體、顏色、線條、樣式、網格線、刻度線等元素,都會影響圖表的清晰度和吸引力。
樣式指南定義了設計圖表的規范和策略,有點類似于論文的格式,其中包括數據可視化中構成要素的詳細建議。
例如,標題應該放在什么位置?字體的大小、樣式和顏色是什么?
下面是美國陽光基金會的圖表樣式指南:
來源:https://github.com/amycesal/dataviz-style-guide/blob/master/Sunlight-StyleGuide-DataViz.pdf
我們可以根據樣式指南,制作相應的數據可視化模版,然后直接套用,這樣就能節省自己的時間和精力,讓工作變得更加統一和高效,還能形成品牌效應。
圖表的配色非常重要,因為顏色能喚起人們的情感并引起注意,人們注意到圖表的第一個因素可能就是顏色。
4、最后的話
身處信息時代的我們,很容迷失在信息海洋中,但借助好的數據可視化圖表,我們可以撥云見日,從數據中看見有趣的信息,從信息中洞見有用的知識,并從知識中預見行動的智慧。
看完《更好的數據可視化指南》和《Excel 數據可視化實操指南》之后,我把其中的一些知識應用到《數據可視化》流程中,重新設計了一版流程圖:
數據可視化需要我們不斷提升自己的審美能力,并在科學與藝術之間找到某種平衡。
雖然有些圖表看起來不夠精確,但是能夠有效吸引人的注意,所以,在某些場合下,對圖表適當進行修飾還是有必要的。
本文由人人都是產品經理作者【林驥】,微信公眾號:【林驥】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!