如何七周成為數據分析師05:數據可視化之打造升職加薪的報表
本文是《如何七周成為數據分析師》的第五篇教程,如果想要了解寫作初衷,可以先行閱讀七周指南。溫馨提示:如果您已經熟悉數據可視化,大可不必再看這篇文章,或只挑選部分。
前一篇文章列舉了常用的分析圖表,今天主要圍繞Excel常用的圖表技巧,以及圖表的設計規范展開。相信大家練習后,圖表設計能力會從下圖:
進化到:
數據分析師應該會設計圖表和報表。這里并不是要求大家像設計師一樣運用Photoshop等軟件繪制,而是知道數據元素如何用圖表更好的表達,將數據蘊含的信息展現出來。理解數據是分析師的工作,展示數據也是分析師的工作。
對于非數據分析師的崗位,諸如運營、產品和市場,每天也會接觸大量的報表,日報周報項目報,用好圖表,讓枯燥的數據變成豐富的視覺,也是一種幫助。
重新認識圖表
好的數據可視化,應該設計和數據并存。數據分析師拿到很多數據,把它們像食材般加工成美味佳肴,但是菜色賣相不好,就讓人下不了筷子??梢暬褪菙祿纳阄?,也是溝通和匯報的工具。圖表給自己看,再難看也無所謂,如果需要匯報給領導和同事,美觀和易讀至少需要吧,不然大家怎么了解你的分析成果。
今天的內容傾向于報表化圖表的制作,好的圖表應該有以下幾個要素:
可讀性
圖表的首要功能是解釋,而不是設計,尤其大部分圖表都會落入到過度設計的陷阱。
圖表設計,首先應該是沒有設計
上圖是Excel老版本的默認模板,連直男也無法忍受的酷炫3D漸變陰影風。想當年小鮮肉的我也為此目眩神迷,給翠花完成PPT作業都是用得這類設計……然后就沒有然后了。
當我們使用這類圖表,反問一句,這些設計有必要么?我們只需要用到柱形圖的對比,那么陰影用來干什么?漸變用來干什么?背景黑色用來干什么?
這些元素對我們解讀數據沒有任何幫助,甚至會阻礙讀者閱讀數據。
其次,好的圖表要能解釋數據,不同圖表有不同的使用方法,如果我要觀察銷售額的增長,我就不應該用餅圖。如果數據量過少,就不應該使用散點圖。圖表使用可以看《如何七周成為數據分析師04:數據可視化之經典圖表合集》。
精準性
為了使數據的解讀不失真,數據應要求精確到小數位。12.5比12好,尤其在對比數據的情況下。數據若再近一步精確,對解讀的意義就不大,反而對解讀者進行干擾。
另外一種情況是單位換算造成的數據失真。例如3145米換算成3.1公里等,雖然是小細節,但不要出現某餅圖的各比例相加不等于100%的案例。
客觀性
數據的解讀因為每個人的觀點和視角不同,可以呈現諸多的結果。這也是我們常說統計學會撒謊的原因。
有經驗的數據分析師甚至能夠引導分析的結果。
下圖是一張銷售額柱形圖,看來銷售額沒有啥特大變化嘛。
我們換另外一種圖表展示。就看到了變化的增長趨勢。
實際上兩張圖表的數據沒有任何差異,為什么呢?區別只在坐標軸。第一張圖的Y坐標軸起始為0,第二張圖起始是2.45。第二張是截取了部分的柱形圖。
只是隨便動動手腳,數據表達就那么大差異,看來數據分析師也可以是陰險角色啊。其他方法還有銷售額細分??匆幌虏煌貐^的增長,如果某幾個地區的增長好,就單獨拎出來作圖,美其名曰抽樣。
統一性
統一是規范和約束圖表,當圖表過多時,一個統一標準不會讓人眼花撩亂。
如果圖表整體顏色是冷色調,那么就不要再加入暖色。
如果圖表文字是雅黑,就不要再加入宋體。
如果某地區數據,用了柱形圖對比,其他地區也遵循柱形圖樣式。
如果某圖表,女性使用紅色,男性使用藍色,那么這一規范應該在所有圖表體現。除了顏色,其他設計元素同理。
如果有多張圖表,圖表元素應該統一,如標題、坐標軸刻度、坐標軸位置等。
統一性是為了可讀性服務的,如果圖表樣式混亂,解讀者會非常困惑。你做一份男女差異的數據報告,前面男性數據都用藍色表示,突然換個粉色誰會受得了?
后文的教程,都會遵循以上要素進行設計。
如何設計
好的配色決定了圖表整體美觀上限,一般只選取兩到三種顏色加黑灰白。過多的顏色無法聚焦于圖表本身,會讓圖表變得像瑪麗蘇。
配色屬于設計領域的技能,分析師就不要學怎么搭配輔色對比色了。直接借助Adobe Color網站的色彩主題選取顏色。
第一個配色方案不錯,高貴冷艷的商務風。后續圖表我們均用此配色方案,下面是十六制顏色編號:
404B4F
82DFFF
CEF2FF
416F7F
A5C2CC
利用rand( ) 函數隨機生成示范數據,生成一張默認的柱形圖。
比起酷炫3D漸變陰影風,Excel2016的默認圖表更易讓人接受,這張圖表在設計方面其實已經合格。不過男同胞若要為姑娘們的PPT和Excel排憂解難,我們得再深入設計。
首先將數據和圖表分離在兩張sheet。
新sheet背景涂成灰色,記住是灰色?;疑且环N中立的顏色,它和任何顏色結合都不會顯得突兀。
接下來就是砍砍砍時間,我們將圖表上所有與數據表達無關的元素全部刪除:銷售額標題移除、背景色設置為透明,柱形圖顏色調整為配色方案。
很多人會疑問,為什么連標題、背景色都要刪除。它和word的原理近似:設計樣式和內容分離。圖表只需要聚焦于數據表達本身。標題可以通過Excel的單元格添加,別用圖表的元素。
對第一列單元格顏色填充,拉高,開頭空兩格,輸入配色文字。
此時標題的設計比圖表自帶標題不知道好看到哪里去了。旁邊的單元格可以配上文字注釋,輔助閱讀者理解。設計的核心思路是通過單元格完善圖表,圖表只專注數據元素。
更優秀的報表,會加入重點數據,引入更多圖表,用顏色劃分區塊,每一區塊對應相應的數據內容,使之具有Dashboard的雛形。
因為時間有限,就不更多展開了(上海我直接復制的)。熟練后制作這樣的報表大約只要5分鐘,但是報表整體會直觀不少,隱性價值高(老板也會喜歡)。多補充一點,如果設計過程中圖表大小位置因為單元格一直變化??梢栽谶x項中選擇固定大小和固定位置,方便設計。
PPT和Excel是通用的,以上設計方法也適用在PPT中,相信大家已經了解怎么設計出商務范的報表。大家可以參考Excel2016的默認模板,都是出彩的設計。
我希望大家看到這里,能了解Excel圖表和報表的設計原理,但日后不要陷入一味追求美觀的道路。圖表是最終結果的呈現,作為報告讓它美觀無可厚非,但是在分析過程中,馬馬虎虎也就得了,畢竟自己看。在我的工作場景中,除了有需要,我也不會專門設計這類報表。
另外悄悄告訴大家,不要展示太牛逼的圖表設計技巧,不然以后老板都會讓你設計的……
ok,了解完圖表和報表設計,接下來講解中高級技巧。
復合圖表
復合圖表和次坐標軸堪稱圖表屆的vlookup。它能給圖表添加更豐富的視覺表達。
前文中我增加了利潤數據,現在我們需要計算利潤的變化趨勢。因為利潤和銷售額不是同一個維度,再用柱形圖不合適,此時可以用折線圖。
點“選擇數據”,添加利潤,Y軸選取利潤所在數據區域。
這時候橙色就是利潤。我們點擊橙色柱形圖,右鍵更改圖表類型為折線圖。
更改配色,雖然橙色也挺好看的,但為了統一性嘛。線條改為平滑。
利潤和銷售額的數值在同一個度量范圍,可以共用坐標軸。如果利潤數值過小,比如零點幾,或者30%這種比例,那么在圖表上會近似一條平緩的直線,視覺表達欠佳。本圖的數據類型我不建議用次坐標軸。下圖僅是舉例。
點擊折線圖,選擇坐標軸系列選項,點次坐標軸??梢钥吹綀D表兩邊都出現了坐標刻度。左邊是利潤刻度,右邊是銷售額刻度,但在不做說明的情況下閱讀者根本不會了解。為了可讀性,需要額外的增加元素說明。這又無形中增加了設計復雜度。所以圖表的元素取舍有多方面的考慮因素。
輔助列
如果復合圖表及次坐標軸堪稱圖表屆的vlookup,那么輔助列就是圖表的數據透視表。
在我之前的文章《Excel技巧:如何繪制一份優秀的甘特圖(項目管理)》,里面甘特圖的繪制借助了輔助列。
這里講解如何利用輔助列繪制漏斗圖。
下圖是牛逼逼有限公司電商APP的銷售流程轉化,每一行代表用戶操作類型和對應達成的用戶數。
漏斗圖的本質是堆積條形圖。我們增加兩個輔助列,計算方式為(最大用戶數-當前用戶數)/2。
將列順序更改為輔助列1,用戶數,輔助列2的排序。然后新建圖表為橫向堆積條形圖。相信在這里大家已經看出輔助列的作用了。
形狀出來了,接下來我們還需要幾步操作。點擊Y軸,選擇設置坐標軸格式,逆序類別上打上勾。
圖表成功翻轉,將左右兩邊的條形圖顏色設置為無。對圖表元素砍砍砍,只保留核心元素。
接下來我們將圖表放到報表上,進行適當的裝飾,搞定
輔助線/誤差線
輔助線和輔助列不一樣,輔助線是圖表附加的元素。輔助線能繪制高級圖表。
甘特圖在項目管理中用來統籌時間進度。如果我需要在現有的圖表基礎上增加原計劃實際計劃,應該怎么做?下圖是牛逼逼公司在其APP上準備的雙十二促銷活動計劃表。如何直觀的用甘特圖表示活動進度?
先增加一列輔助列。該列輔助列用于后續定位。數值等值增加即可。
選擇計劃開始時間和輔助列,插入圖表,帶折線的散點圖(只選數字即可,不要選自段名)。
現在看不出這是甘特圖,不要緊,對Y軸進行逆序排列。點擊圖表的添加元素,增加誤差線-標準誤差,誤差線就是我們的輔助線。
誤差線是高級圖表經常用到的功能,箱線圖、標靶圖/子彈圖都能用誤差線做出來。下圖十字狀的線條就是誤差線。
選擇橫向的水平誤差線,點擊設置格式,方向正誤差,無線端,誤差值自定義,選擇計劃使用時間這一列。
刪除垂直誤差線,對誤差線線條加粗,設置顏色?,F在有一點甘特圖的樣子了。
點擊圖表選擇數據,新增加一個系列,數據源選擇實際開始時間和輔助列(在最開始建立散點圖時,其實可以一并選擇的)。
點擊橙色這條線,重復誤差線的建立。在誤差線自定義值時,不要選擇計劃使用時間,而是實際完成時間。設置線條顏色的時候,用另外一種顏色和樣式,以便區分。
將橙色和藍色填充為無,移除無用的設計元素。我們把甘特圖放到報表中。
因為時間關系,甘特圖還是缺漏部分說明元素的。大家有興趣可以自己優化。
誤差線是一種高級用法,在高級的可視化分析中我們會用誤差線進行統計型的分析,后續的章節內容中會再次學習。
最終這幅報表就是成果,不知道大家有沒有掌握。其實Excel還有更強大的功能,比如切片,比如動態圖表,比如各插件,通過一系列的組合可以做出半自動報表,像財務報表、咨詢公司報表,都有各自的風格,大家可以網上查詢學習。
下節課將教大家BI,繪制真正的Dashboard。如果大家的工作涉及到很多excel和分析,那么你會上升到新的臺階。下圖是范例。
相關閱讀
如何七周成為數據分析師01:常見的Excel函數全部涵蓋在這里了
如何七周成為數據分析師:Excel技巧之甘特圖繪制(項目管理)
#專欄作家#
秦路,微信公眾號ID:tracykanc,人人都是產品經理專欄作家。
本文由 @秦路?原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自PEXELS,基于CC0協議
柱形圖旁邊的數據是怎樣插入進去的呀
添加誤差線 為什么沒有水平的呢? ?
我的線形圖也沒有水平誤差,換成散點圖就有了。在散點圖上做水平誤差;然后新加一個系列,數值和之前的一樣,用線形圖顯示。這樣線條和水平誤差就都有了。
忽略上一回復。直接選擇scatter with smooth line類型的圖表即可。
大神