用數據說話(一)
在日常工作中,數據是十分重要的呈現因素,通過數據,你可以清晰地展現你的工作成果,也可以讓業務得到更強有力的支撐。不過,你知道如何才能更有效地呈現數據,實現高效的數據溝通嗎?不如來看看作者的經驗分享。
一、前言
“Claire,我來公司3個月了,你是第一個給我講清楚這些圖表到底是干什么的人?!?/p>
“Claire, where do you learn your presentation skills? You did a great job!”
“Your analysis and presentation is very insightful, Claire. I love the way how you presented the findings.”
以上來自我工作中同事、老板對我presentation的評價。在我近三年的數據分析生涯中,數據可視化和presentation一直是工作中的重要部分,present的對象包括但不限于公司內部技術和非技術人員、高管以及客戶中的高管。正是這些經驗的積累,本文我想針對“用數據說話”這一主題,分享給大家我踩過的坑和有效的用數據溝通的技巧,希望能幫你也在工作中清晰有效的呈現數據。
本文內容受眾不只限于數據分析師,因為事實上,不管是金融分析師、產品經理、項目經理、運營專員、市場營銷專員或是銷售經理,在工作中都或多或少需要向同事、老板、高管、或者客戶用數據來展示自己的業績/項目成果、公司的運行現狀或者客戶的需求滿足。眾所周知,數據讓你的statement(論據)更具說服力,量化結果也更容易讓人留下深刻印象。
但事情沒有那么簡單,現實是沒有良好的溝通表達,對方不一定完全理解你的意思,下面讓我們來看看如何“用數據說話”。
作者注:
- 本文側重點在于如何用數據更好的表達自己的觀點,里面涉及的數據可視化建議與咨詢公司的報告圖表(更偏靜態和需要閱讀)有一定區別。
- 請讀者容忍作者中英混雜的文風。
- 作者的工作經歷都是to B(面向企業)的數據分析。
- 這部分想分享的內容太多,所以會寫成一個系列。
二、有效數據化溝通的知識點
1. 上下文的重要性
一次好的數據化溝通要從介紹需求背景/上下文開始,比如本次meeting的目標是什么,誰提出了這個分析的需求,需求方想實現什么效果。再者,不同公司、環境、職級的人對同樣事物的認知和熟悉程度是不同的,比如說某公司第二季度revenue是$1M,很多人可能并沒有概念這個數字的大小、反映的業績好壞,但如果你加上與去年同期的對比、有沒有達到我們的預期(OKR),就會更容易被人理解。
2. knowing your audience is key(了解你的聽眾)
通常情況下,對不同audience做的dashboard都是不同的,比如面向公司內部市場和銷售團隊使用的dashboard,他們希望分析盡量細節(granular),這樣他們可以選取對不同客戶有效的信息進行pitch(產品推銷)或者回答客戶關于一些細節指標的提問。
但如果dashboard是面向客戶企業的非技術人員和C-level的高管來使用,就要更偏向戰略宏觀角度的分析,作圖尤其要注意簡單易懂,不僅一張圖不要放太多內容,也切忌堆砌圖表。
3. a picture is worth a thousand words(一圖勝千言)
有效的圖表可以讓聽眾更好的記住你的結論,而一個好的圖是不需要使用者思考太多的。下面分享一個技巧和案例:
1)pre-attentive attributes
這是人類大腦對圖表處理的一種潛意識表現,比如顏色的不同、深淺,線的長寬大小、方向,形狀,2-D散點圖等。
正是人類的這種信息處理特質,我們應該在數據可視化的時候利用起來,用這些特點來highlight我們想突出的insights。
顏色最容易被人們觀察到,但不要使用過多顏色,會分散人們的注意力;盡量不使用傾斜的axis label,因為人們需要更多的時間來process,必要時使用縮寫;去掉圖表的邊框而選擇用空白來劃分邊界,因為邊框會吸引受眾的目光,而我們需要受眾的注意力在圖標的細節里。
2)同樣的數據,目標不同,選取的圖表也應不同
比如我們有麥當勞不同地區不同月份的銷售額,如下表(fake data)。
當我想知道哪個地區哪個月銷售額最高,一個好的visualization是直接在上表highlight最大值,如下圖:
當我想知道哪些數據達到了每月$100K的銷售目標,用不同顏色的柱狀條形圖+目標水平線來展示。注:這里需要先unpivot上表。
4. 數據的粒度(granularity)
任何人都能給出一個數字化的結果,但是注意你數據的level of details/granularity 是保證你結果正確的重要前提。比如下表:
同一個電影可能有多個類別,這里不同的類別被分在了不同行。如果要算每個制片廠制作電影的的平均票房,就不能只按制片廠group by算票房的avg,因為同一電影的票房數有重復計算,種類越多的電影,票房的加權也越重。
正確的算法是先去重(de-duplicate),保證每個制片廠的每部電影只有一個票房紀錄,再按制片廠算票房平均值。另外,這一點在你需要寫SQL進行table join的時候也尤為重要!
5. actionable next steps
判斷自己數據化溝通的成效之一,是在meeting或者presentation的最后,看audience能否帶著你提供的insights進行一定的決策或者有清晰的下一步規劃,這才保證我們的溝通是有效并能解決實際的問題。
數據分析師在做dashboard時的好習慣:
1)理解你要解決的問題
先自己想想你需要什么樣的數據支持,再看你要從哪些database或者source table 中獲取數據。
然后寫SQL的時候,對你的結果有一個expectation, run出結果再和自己的expectation比較,起到verify你工作的效果。
2)數據分析師很重要的一個品質我愿稱之為skepticism(懷疑精神)
很多時候當你看到一個奇怪的結果時(比如近三個月銷售額一直在下降),與其立馬投入業務分析,不如先去看看這個結果的生成用了哪些數據,進行了哪些數據轉化,可視化的操作對不對等等。
如果是數據源頭的問題(例如數據捕捉不完整),那就需要先把data pipeline的處理修正,再進行分析。
有時候你甚至會發現業務部門讓你做的分析還沒開始就結束了…
3)拿到數據后別急著畫圖,現實生活中已有的數據很可能不是你直接能用來可視化的數據,你需要進行一定的數據清理和數據轉化
比如算消費者隨月份的平均訂單花費變化趨勢,你一方面要保證納入計算的數據中銷售量>0,另一方面可以觀察一下消費者平均訂單花費的分布,必要時去掉一些極端值,或者用quantile來表現趨勢而不是單一的平均值(易受極值影響)。
三、總結
一個好的可視化報表(dashboard)還有很多細節需要注意,數據可視化作為“用數據說話”的重要工具,下一節我們會講更多的設計細節。
本文由@一個數據人的自留地 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!