數據可視化(1):從認知心理學角度的理解
同樣一組數據,只是把數字羅列出來,和用簡單的線圖表達數據,這兩者的效果可能完全不同。本文作者從認知心理學的角度,對數據可視化進行了分析,一起來看一下吧。
一、為什么可視化?
下面是一組非常簡單的數據,Excel 里面 6 個月的分渠道銷售額。請問你能快速找出什么規(guī)律?
雖然只有 6 個月乘以 3 個渠道 18 個數字,迅速搞清楚也不沒那么容易,我們要把數字一個個進行對比,甚至要刻意背下來一些信息才能發(fā)現(xiàn)規(guī)律。不然有時候看了幾個數字前面的就忘了。人類短期記憶只有 6-7 個單元。
那么用簡單的線圖表達同一組數據呢?
我們可以看出,會展渠道在 6 月效果異常突出,而官網渠道從七月份起效果有明顯下降。而我們得到這個理解只需要一瞬間,和之前找規(guī)律的難度對比鮮明。
假設根據上面信息,我們得知 6 月份有個重要峰會導致業(yè)績上升,同時官網在 7 月份有改版,那我們甚至可以再加工一步,用不同的色相突出想表達的線圖(官網渠道),并用醒目的紅色標出重要事件,更好的表達需要調查官網改版以及進行修補。
但是也許有人會說,通過統(tǒng)計數據,比如平均值,不也可能快速理解和掌握數據嗎?那我們看下面四組統(tǒng)計:
這四組數據應該一模一樣吧?
那我們再看下,這四組數據,畫成圖表的樣子:
Source:https://en.wikipedia.org/wiki/Anscombe%27s_quartet
是不是明顯不一樣,要不是看到可視化,我們差點被統(tǒng)計騙了?這幾組數據由英國數學家 Anscombe 在 1973 年設計,就是為了突出只有統(tǒng)計數據是不夠的,可視化至關重要。
數據可視化給我們帶來的是,幫助我們理解,洞察,和表達數據,做更好的決策,以及影響他人。數據可視化一般分為兩類,explanatory 解釋性數據可視化,以及 exploratory 探索性數據可視化。實際應用場景普遍為數據看板輔助決策和監(jiān)控,數據探索進行數據分析,以及通過可視化講故事影響他人。
數據可視化帶來的價值巨大,本身市場也在快速增長,F(xiàn)ortune Business Insights 預估其年增長率約為 10%,會在 2027 到達約 200 億美金。
二、認知心理學角度
近幾年開始流行一個詞“中國式報表”,密密麻麻的一片數字放在 Excel 一樣表里,作為中國特色。甚至有人認為,中國人不需要圖表,只需要看數字,報表不適合中國人。
其實,歐美曾經的報表也是那樣,比如 VisiCalc 和 Lotus 1-2-3 的年代:
Source: https://www.wired.com/2009/01/jan-26-1983-spreadsheet-as-easy-as-1-2-3-2/
之后數據可視化的逐漸勝出,是基于人類本性,基于人類無數年進化獲取的視覺感知,認知,及短期記憶特性。這些本質,讓可視化變成人類洞察和理解抽象信息的重要工具。
暫時回到一開始用過的例子:
其實一個認真負責很專業(yè)的員工,在對以上數據非常熟悉的狀態(tài)下,完全掌握公司經營狀態(tài),只看這種表格也是可以的,而且數字密度高反而會有效率高的錯覺。很多努力工作的小伙伴可能都在這種狀態(tài)。但是如果以上數字再乘以幾倍幾十倍幾百倍的復雜度呢?比如加上產品分類,產品分類細分,活動,活動分類等。這時候有效找出規(guī)律和問題,就不得不需要正確的工具支持了。
接下來讓我們探索認知心理學,視覺感知中的先意識屬性,以及格式塔原則。
三、先意識屬性 Pre-Attentive Attributes
在下圖中,數出一共有幾個數字 9,需要多久?
把上圖稍微改下呢?
找出數字 9 變成了一瞬間的事情,再數一下就好了。
在大腦過濾和整理視覺信息并傳給意識之前,所有采集的視覺信息會先由潛意識進行處理。即先意識處理 Pre-Attentive Processing,先意識屬性 Pre-Attentive Attributes 會被先意識處理快速提取出來。我們在第二張圖能迅速找出數字 9 就是因為色相差是先意識屬性之一。
先意識屬性與處理就像人類的神經反應一樣,如果不小心摸到滾燙的鍋,我們會在大腦反應過來之前,迅速的自動把手縮回去。
先意識屬性分為色相 Hue,形狀 Form,空間位置 Spatial Position,以及動作 Motion。因篇幅限制這里一筆帶過(色彩尤其重要和值得研究,會在未來另一篇文章深入探討)。以下為一些常見例子:
下圖為一個運用先意識屬性的例子,每月支出超出或低于預算狀況:
數據為 1-8 月份實際支出和預算的對比。目標是每月支出都在預算 95% 以內,用灰色標注線注明,支出超過預算 105% 視為嚴重超出預算,用紅色。每個條形的長度為低于或超過目標的量。
我們第一眼就能看到紅色部分,即 7 月份支出超過預算的 105%,第二會看到 4 月份和 7 月份超出預算但是還沒到 105% 的部分。因為到達目標的月份條形方向朝下,我們也可以一眼看出 1,2,5,6 月份達到了目標。8 月份因為還在進行中,條形是虛的。整個 YTD 支出與預算對比一目了然。
四、格式塔原則 Gestalt Principles
格式塔在德語中意思為形狀或規(guī)律,代表人類如何把看到感知到的信號,整理成信息并賦予理解。以下為六種大腦根據視覺信號創(chuàng)建感知的方法:
1)相近
我們的大腦會自動把下面左圖按大概位置分成三組數據,中間圖分成上中下三組數據,右圖按左右分成五組數據。
2)相似
同理,我們會按照圖形的相似度進行分組。
3)圍繞
4)閉合
我們自動的“腦補”了圖形,甚至文字的缺口。
5)持續(xù)
同樣是腦補缺口,但是效果為持續(xù)。
6)相連
通過連接,把不同的物件放到一起。
下面是一個運營格式塔原則的例子,下圖為某季度末,對兩個團隊一共 10 個員工的評分,每個三角或者圓圈都是一個員工:
能力評分低于 3.5 同時業(yè)績評分低于 2.5 的同學,可能會被畢業(yè)輸送給社會,要重點關注,于是用淺紅色背景“圍繞”起來。能力和業(yè)績評分都很高的優(yōu)秀同學同理。
而同樣團隊的員工們用同樣的圖形標注,也能輕易看出團隊 A 的員工普遍能力更強,但是團隊 B 的員工業(yè)績更好。
當然,視覺感知的原理也是為什么我們能被自己的眼睛欺騙,比如下圖的直線,怎么看起來似乎歪歪扭扭的:
Source:https://en.wikipedia.org/wiki/Caf%C3%A9_wall_illusion
或者下面兩個橙色的點其實一樣大小,但是看起來感覺就是不一樣:
Source:https://en.wikipedia.org/wiki/Ebbinghaus_illusion
五、結語
我們在演示或探索數據的時候,無論是做 ppt,報告,BI 看板,設計產品,還是分析,若能有效使用可視化,可大幅度提高我們自己對數據的洞察,以及更好的傳達我們的主張。
這篇文章只是講了些基礎以及簡單運用方法。數據可視化是一個龐大的跨學科領域,包括設計,人機交互,統(tǒng)計學,計算機科學,以及本文中觸及的視覺感知,認知科學等。
而本文想強調的,是數據可視化的力量來源和直接效果,都是基于人類本身,輔助認知,擴大認知。
Max(微信號 invicti 公眾號 SaaS 沉思錄)。硅谷海歸,Salesforce 和 Intuit 高級工程師。ThoughtSpot 初期員工。曾管理 ThoughtSpot 全公司市場運營,銷售運營,和數據分析。UC Berkeley 電子工程與計算機科學。
作者:Max,公眾號:SaaS 沉思錄,微信: invicti
本文由 @Max 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
人類如何把看到感知到的信號,整理誠信息并賦予理解?!罢\”是個錯別字。
收到,非常感謝指出!!