3個(gè)方面研究:圖與表展示
圖與表,是數(shù)據(jù)展示的兩種形式,它們分別適用于不同的場景。文章從三個(gè)方面研究,圖與表的展示,一起來文章中看看~
一、圖與表的優(yōu)劣勢和適用場景
圖的優(yōu)勢是直觀、易讀,往往讀者只需要簡單掃一眼,就可以對數(shù)據(jù)有一個(gè)基本的了解。圖的劣勢是數(shù)據(jù)承載能力差。由于圖的空間限制,往往不能承載大量的數(shù)據(jù)。
表和圖恰恰相反,表由于可以翻頁的特性,能夠承載大量的數(shù)據(jù)。但由于數(shù)據(jù)分布在不同的頁,信息結(jié)構(gòu)復(fù)雜,表的內(nèi)容并不能夠直觀地一眼讀完。
由于圖與表各自的優(yōu)劣勢,以及不同的使用場景的具體需求,我們在數(shù)據(jù)展示中往往會(huì)靈活地使用不同的方案。
1. 只用圖
在關(guān)注整體、趨勢,不在意細(xì)節(jié)的數(shù)據(jù)展示場景下,一般只用圖,如各種數(shù)據(jù)概覽或BI。該頁面內(nèi)會(huì)放置多個(gè)圖用來展示數(shù)據(jù),用戶在頁面使用瀏覽、掃閱的方式來獲取信息,關(guān)心整體勝過細(xì)節(jié)。
這種頁面里,使用表格會(huì)造成頁面空間的不必要占用,且表格的易讀性差,用戶不能快速獲取信息。
2. 只用表
需要展示的數(shù)據(jù)項(xiàng)特別多時(shí),使用圖是不合適的。如廣告后臺的數(shù)據(jù)展示,往往會(huì)有數(shù)十個(gè)渠道的數(shù)據(jù)需要展示。如果使用圖,這數(shù)十個(gè)渠道是無法完整展示的。這樣的情況下,往往只使用表格來展示數(shù)據(jù)。
3. 圖表結(jié)合
大多數(shù)數(shù)據(jù)展示的主流場景下,用戶往往是先看圖,快速獲取信息后,再選擇要不要繼續(xù)通過表查看具體數(shù)據(jù)。這時(shí),圖表結(jié)合就是最合適的方式。
二、數(shù)據(jù)展示的本質(zhì)
數(shù)據(jù)展示的數(shù)據(jù),是從數(shù)據(jù)庫來的,是通過sql語句從數(shù)據(jù)庫提取出來的。數(shù)據(jù)庫內(nèi)的主要內(nèi)容就是表。
下面是一個(gè)表的例子:
表的結(jié)構(gòu)
表由行和列構(gòu)成,每一行是一條數(shù)據(jù)記錄,列是每條記錄擁有的字段,表中的國家、省都是列字段。
我們將字段分為兩類:計(jì)數(shù)型字段和計(jì)算型字段。
- 計(jì)數(shù)型字段只能計(jì)數(shù),如表中的國家、省、市、性別;
- 計(jì)算型字段除計(jì)數(shù)外,還可以進(jìn)行求和、求平均等運(yùn)算,如表中的人和就業(yè)率。
數(shù)據(jù)提取時(shí),往往會(huì)有這樣的例子:按國家展示人口。即把國家相同的行的人口做一個(gè)匯總,得出的數(shù)據(jù)結(jié)果會(huì)是:
理解了這些基礎(chǔ)知識后,我們提出這樣一個(gè)觀點(diǎn)。數(shù)據(jù)展示的本質(zhì)是:按維度展示指標(biāo)。
按什么展示,什么就是維度;展示什么,什么就是指標(biāo)。如上文中的例子:按國家展示人口,國家就是維度,人口就是指標(biāo)。有懂SQL的同學(xué),對這部分會(huì)理解的更好一點(diǎn)。Sql語句里,select的就是指標(biāo),group by的就是維度。
然后,我們在引入一些概念:維度的數(shù)量、維度的實(shí)例數(shù)量、指標(biāo)的數(shù)量。
維度的數(shù)量:我們按維度查看時(shí),是幾個(gè)維度?
如上文中按國家查看,維度的數(shù)量就是1,但按國家和性別查看,那么維度的數(shù)量就是2,如下圖:
維度的實(shí)例數(shù)量:我們按維度查看時(shí),一個(gè)維度有幾個(gè)實(shí)例?
如上文中按國家查看,美國和中國就是國家的實(shí)例;按性別查看,男和女就是性別的實(shí)例。
指標(biāo)的數(shù)量:我們查看的指標(biāo)的數(shù)量。如上文中,我們只查看了人口這一個(gè)指標(biāo)。
三、為數(shù)據(jù)展示選取合適的圖表
折線圖、柱狀圖、餅圖…我們見過各種各樣的圖,不同的圖適用于不同的目的和場景。
我們會(huì)發(fā)現(xiàn),用圖來展示數(shù)據(jù),是有適不適合的分別的。讓你用餅圖來展示時(shí)間趨勢的數(shù)據(jù)變化,你會(huì)發(fā)現(xiàn)基本不可能。同樣,讓你用折線圖展示構(gòu)成,也是不合適的。那么,這些合不合適,有沒有什么內(nèi)在的關(guān)聯(lián)和根本的邏輯?
我們在上文的數(shù)據(jù)展示的本質(zhì)中說過:數(shù)據(jù)展示的本質(zhì)就是按維度查看指,維度的數(shù)量是1個(gè)或多個(gè),維度的實(shí)例數(shù)量一般是多個(gè),指標(biāo)的數(shù)量是1個(gè)或多個(gè)。
按維度展示時(shí),每個(gè)維度都需要在圖中能夠區(qū)分。單個(gè)維度的多個(gè)實(shí)例,也是需要能夠區(qū)分的。同時(shí)展示多個(gè)指標(biāo)時(shí),指標(biāo)之間是需要有區(qū)分的,例如通過顏色、形狀等來區(qū)分。
我還是以上文的例子來說明:
這個(gè)數(shù)據(jù)集有兩個(gè)維度:國家和性別。國家維度有兩個(gè)實(shí)例:美國和中國;性別維度有兩個(gè)實(shí)例:男和女。有兩個(gè)指標(biāo),人口和就業(yè)率。這樣的數(shù)據(jù)集,應(yīng)該以怎樣的圖來展示?
這個(gè)圖能夠完美地表現(xiàn)數(shù)據(jù)集中的數(shù)據(jù)。但我們會(huì)發(fā)現(xiàn):當(dāng)國家的實(shí)例不止一個(gè),而是200個(gè)時(shí),這樣的圖就不合適了。因?yàn)闄M軸的空間是有限的,不可能容納這么多的國家。
由此我們可以說,圖的軸對數(shù)據(jù)集的維度的實(shí)例數(shù)量是有要求的,不能太多。其實(shí)這樣說,也不是特別嚴(yán)謹(jǐn)。你會(huì)發(fā)現(xiàn):如果橫軸是時(shí)間軸的話,好像放個(gè)幾百天的時(shí)間也不是問題,大不了中間的部分時(shí)間不顯示罷了。
在此,我們引入另外一個(gè)新的概念——維度的實(shí)例的離散和連續(xù)。例如:國家維度的實(shí)例就是離散的,你不能在顯示200個(gè)國家的時(shí)候,只顯示首尾幾個(gè)國家,就代表了所有國家。但是,日期維度的實(shí)例就是連續(xù)的,你要顯示100天,只需要顯示第一天和最后一天,別人自然會(huì)知道中間包括了這所有的天數(shù)。
所以,我們得出結(jié)論:圖的軸對展示的維度的實(shí)例數(shù)量是有要求的。離散型的維度,只能展示較少的維度實(shí)例;連續(xù)型的維度,可以展示較多的維度實(shí)例。
說完數(shù)據(jù)集,我們來說回圖表。數(shù)據(jù)集有維度,圖也有維度,我們把圖的維度叫做圖維。圖維是能夠區(qū)分圖的信息的方式的數(shù)量。如橫軸、縱軸、顏色、尺寸、樣式。
如下圖,這是一個(gè)三個(gè)圖維的圖:橫軸、縱軸、點(diǎn)的顏色。
下圖是一個(gè)4個(gè)圖維的圖:經(jīng)度、維度、氣泡尺寸、氣泡顏色。
相對于數(shù)據(jù)集維度的實(shí)例數(shù)量,圖維也是有實(shí)例數(shù)量的。如:顏色維度,一般只使用較少的顏色,較多的顏色會(huì)讓數(shù)據(jù)區(qū)分困難。
我們把數(shù)據(jù)集和圖結(jié)合起來看:數(shù)據(jù)集有維度、維度的實(shí)例數(shù)量、指標(biāo)數(shù)量;圖有圖維數(shù)量,圖維的實(shí)例數(shù)量。數(shù)據(jù)集展示成圖,就是講維度。指標(biāo)區(qū)分都對應(yīng)到了圖維上,維度的實(shí)例都對應(yīng)到了圖維的實(shí)例。
一個(gè)數(shù)據(jù)集能夠在圖中展示的前提條件時(shí):圖維數(shù)量>=指標(biāo)數(shù)量+維度數(shù)量,圖維實(shí)例數(shù)量>=數(shù)據(jù)集維度實(shí)例數(shù)量。
一個(gè)典型的圖表頁面:
常規(guī)場景下的圖選擇:
本文由 @?流風(fēng) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
統(tǒng)計(jì)圖表一直是我的短板,受益匪淺
不錯(cuò)