雷達圖在數據可視化中的應用價值
編輯導語:雷達圖,也稱網絡圖、蜘蛛圖,是以從同一點開始的軸上表示的三個或更多個定量變量的二維圖表的形式顯示多變量數據的圖形方法。雷達圖對于查看哪些變量具有相似的值、變量之間是否有異常值都很有用,也可用于查看哪些變量在數據集內得分較高或較低,因此在數據可視化中經常會用到。
相信大家一定都有經歷過各種考核吧,你的各項能力水平會被量化為數據評分,那么如果現在有個機會讓你來考核別人,你會通過什么樣的方式來進行考核呢?
假設你現在是一個20人售前客服團隊的客服主管,需要來量化團隊中某個客服的綜合能力。
首先我們需要定義考核的指標,綜合能力的考核通常需要的指標都是多個維度的,我們以“銷售額”、“響應時間”、“詢單轉化率”這3個字段作為考核指標;
其次我們要劃定每個字段的考核依據,比如客服月銷售額達到1000w可以評定為5分等;
最后將具體客服的銷售數據,響應時間數據,以及詢轉數據轉化成評分數值,呈現在圖表上就可以非常直觀地知曉這個客服的能力水平了。
這就是雷達圖一次簡單的應用,其所呈現出來的價值是描述了一個售前客服的綜合能力,直觀地輸出了結果。本文想以此和大家討論下,雷達圖是什么?它在數據可視化中又有什么應用價值。
一、什么是雷達圖?
雷達圖是將3個或3個以上不同維度的數據,通過一定的公式,將不同維度的數據轉化為統一度量后,繪制在同一個中心點出發軸上的圖形。
適用于描述對象的數據和屬性,我們在文章開頭考核售前客服的案例中獲取到了客服A的各項評分如下圖所示,通過雷達圖我們可以對“客服A”的三項能力有一個簡單的了解,詢單轉化能力評分最高,銷售能力次之,響應時間評分最低。
作為客服主管就可以了解該客服的綜合能力,并針對性的安排工作。
例如轉化能力優秀可以多去進行催付工作,響應時間弱需要針對性的強化提高,雷達圖能直觀地呈現某一個對象多維度的數據,幫助我們了解該對象的能力分布情況,常被應用于能力評分、用戶畫像等場景。
從雷達圖中可以看出,雷達圖上有維度和度量,其中維度是存在多個的,這就要求了雷達圖所表達的數據組是一個多維度的數據組。
我們對“客服”進行考核統計到的就是一個有3個維度的數據組,客服A的銷售額1w,響應時間3秒,詢單轉化率95%。
一個數據組存在多個維度的話,就會存在多種度量單位,而雷達圖的度量是統一的,客服A的銷售額、響應時間、詢單轉化率的度量單位分別是元、秒、百分比。
而在雷達圖上這三者的度量單位是分,這就需要雷達圖的繪制過程中,需要借助一定的公式進行轉換,將多個維度不同的度量單位轉化成統一的度量。
從雷達圖的構圖來看,一個雷達圖由多個維度、統一度量2個部分組成,而每個部分又有其特殊的要求。
1. 維度
雷達圖是用來描述對象綜合屬性的,屬性往往是多樣的,這要求了被雷達圖所表達的數據組是一組多維度的數據組。
那么什么是多維度呢?
——多維度即要求數據組中的數據可以被歸類為多個互相獨立的類目。
想一下我們怎么來描述一個人的體型?通常我們會用到肩寬、臀圍、腰圍這幾個數據。
如果我們有一組數據,分別統計了5個不同身材人的肩寬、臀圍、腰圍,就可以說這組數據是一組多維度的數據,其中維度有3個,分別是肩寬、臀圍、腰圍。通過這組多維度的數據,可以描述一個人的體型。
例如當臀圍>腰圍和肩寬時,那么可以判斷出這個人的身材是A字型的身材。
從這我們可以發現,雷達圖之所以可以描述對象的屬性,是因為它直觀反應了對象不同維度的數據,而且還能找出一個隱藏條件,即:維度的數量需要有3個或3個以上,否則就無法表達為雷達圖。
因為1個維度只能成點,2個維度只能成線。
2. 度量
雷達圖是將一組多維度的數據組進行圖形化表達,在一張圖中直觀地描述對象的屬性。
多維度往往意味著不同的度量單位,而雷達圖從同一個中心點出發的軸又要求度量一致,不一致的度量會導致同一位置的點所表達的數據意義不一致。
現在有這么一個31歲的人,他的身高是160厘米體重是64公斤,我們想了解他在中青年(30-39歲)群體中的身高和體重水平,其中已知身高在150-200厘米內,體重在40-100公斤內。
從這邊可以看到3個維度,分別是年齡、身高、體重,而這3者又帶來3種不同的度量單位。如果不對度量進行統一處理,可視化成圖如下所示,非常難以理解為什么160厘米和31歲處于同一梯度的點,而64公斤卻比他們高,這樣的雷達圖不具備分析價值。
那么我們怎么來完成這一度量統一的轉化呢?
——這里就需要通過一定的公式進行轉化。
什么樣的公式才能適合這一轉化過程呢?
雷達圖有一個基礎的認知,所表達的值是不同維度里的占比、或者處于該維度里哪一個范圍。這就要求所提供的公式是一個可以劃分范圍或者確定排名的,通過這個公式,將不同的數據標準化定義下來。
下面通過對“年齡、身高、體重”的統一度量的公式來看下這個轉化過程,統計學中有一個公式——平均值加減一組標準差,可以通過描述樣本的離散程度來劃分范圍:
- 平均值為X,標準差為S
- 平均值+一組標準差是該樣本大部分值的上限,即X+S
- 平均值-一組標準差是該樣本發部分值的下限,即X-S
通過“上限值”和“下限值”可以劃分3個區間,“低于下限”、“上限和下限之間”、“高于上限”3個區間,樣本中大部分的值處于區間“上限和下限之間”,而“低于下限”和“高于上限”兩個區間內的值就是異常值。
上述就是我們所要用到的理論公式,下面我們把具體的值代入其中:
已知中青年年齡段人身高的平均值是174,標準差是10,那么我們就可以得到3個區間“<164”、“164~174”、“>174”,3個區間對應的評分是1、2、3;而我們想要觀察對象的身高是160,處于“<164”的區間,評分為1。
同理,已知中青年年齡段人體重的平均值為73,標準差13,3個區間為“<60”、“60-86”、“>86”,已知中青年年齡段人年齡的平均值為34,標準差3,3個區間“<31”、”31-37”、”>37”,代入想要觀察對象的體重和年齡數據得到評分為2,2可得到年齡、身高、體重的三項評分為2、1、2。
通過雷達圖就可以大致對這個人的身高和體重水平有個簡單的判斷,這個人的年齡和體重處于中青年中的常見范圍內,而身高則處于異常范圍。
對比統一度量前后的雷達圖,就可以明白統一度量后的雷達圖才能更準確的體現這個人的年齡、身高和體重在中青年段人群中的所處范圍。
上面的公式只是一種非常簡單的統一度量的公式,實際在工作中我們用到的公式會復雜的多,包括運用到加權、歸一、收斂等數據統計方法。
通過對維度和度量的了解,可以認為雷達圖的組成是一個遞進過程的,首先需要有一組多維度的數據組,維度數需要是3個或3個以上;
其次需要通過選擇一定的公式將不同維度的多個度量單位轉換成“統一度量”,在這個過程中,需要有一個可衡量的規則將不同維度的數據標準化;
最后將統一度量后的數據轉化成圖,就得到了可以被應用的雷達圖,表達了對象的綜合能力在對應維度里的一個占比情況或者排名。
二、雷達圖具體的運用價值
了解完什么是雷達圖以后,我們就可以來討論雷達圖實際的運用價值,具體可以分兩部分,一是在描述單一對象上的運用,二是在對比多個對象上的運用。
1. 雷達圖在單一對象上的運用
文章開頭場景中用雷達圖描述某個客服的綜合能力就是一次典型的運用了“雷達圖”來描述單個對象屬性,為什么雷達圖可以用來描述某個對象的屬性呢?
從雷達圖的定義可以看出,雷達圖是一組多維度數據組的圖形化表達,而一個對象的屬性往往是多維度的。
另外,人對于描述性文字是沒有一個明確的感知力的,比如這句對下圖客服表現的描述,銷售額1w,響應時間3秒,詢單轉化率95%。
單獨從文字描述來看,是非??斩吹?,我們無法準確判斷這個客服的能力,銷售額1w是多還是少,響應時間3秒是響應快還是慢,詢轉95%又是否足夠高?
而用雷達圖來圖形化表達后,就能對該客服的銷售能力、響應能力以及轉化能力有一個大致的了解和判斷:
因此,我們可以發現,雷達圖能直觀地描述單個對象不同維度的能力,幫助用戶快速清晰地對某一對象的綜合能力有一個了解。
再來看一個案例:2020年在香港二級市場,“醫藥公司”一直是打新市場的一大熱門,近期有一只名字叫“先聲醫藥”的公司進行公開招股,我們想了解這一新股的質地怎么樣?
假設我們要去了解一只新股,會從市值、業績(營收、凈利潤等)、保薦人、基石這4個維度去分析。
獲取到該新股的資料如下,市值:336億;業績:凈利潤10億;保薦人:大摩&中金;基石:高瓴等7個。只從文字描述來看如果是對新股市場沒有長期了解的人,很難對其有概念,不會清楚保薦人大摩有多穩定,而基石投資者高瓴的神話又是什么。
但是我們通過公式將其轉化成統一度量分值后,用雷達圖表示,先聲醫藥:市值6.5分,業績:5.5分,保薦人:7分,基石:7分,即使從沒有接觸過港股二級市場的小白也會對該新股質地好壞有一個了解。
2. 雷達圖在多個個體上的運用
從第一部分的運用價值中,我們已經了解了雷達圖能幫助我們清晰直接地描述單個對象的屬相。
那么當我們想要從多個對象中進行選擇時該怎么辦,只需要將不同個體用統一的雷達圖進行描述,將轉化后的雷達圖進行對比,就可以直觀地發現不同個體之間的差異和區別。
延續我們第一部分的案例,除了“醫藥公司”以外,“物業服務”也是市場一大熱門,近期有兩只物業服務類型的新股進行招股,而我們所持有的資金只夠進行一只申購,那么我們又該怎么進行選擇呢?
同樣的用市值、業績、保薦人和基石這4個維度來進行描述,得到的結果如下:
- 第一服務:市值:6分;業績:7.5分;保薦人:5分;基石:6.5分
- 卓越商企:市值:6.5分;業績:7.5分;保薦人:6分;基石:7分
從雷達圖上可以簡單判斷出“卓越商企”比“第一服務”的質地更加優秀,在不考慮其余因素影響下,應該優先選擇認購“卓越商企”。后續“卓越商企”和“第一服務”首日的漲幅分別是+3.50%和-26.67%也在一定程度上驗證了“卓越商企”更加優秀。
三、總結
雷達圖可以展示對象多個維度的數據,并將不同度量的維度數據轉化成統一度量,科學直觀地描述了單個對象的屬性。將同類型的多個對象進行對比,能幫助用戶了解單個對象與單個對象之間的不同和差異,為我們決策提供了數據依據。
作者:晌午,微信公眾號:晌午自習室
本文由 @晌午 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
學習了,非常棒!
這邊正好需要做一個雷達圖來對連鎖門店里的各個門店的銷售能里做評分,參考上述思路:
1、取全部門店的在某個維度的平均值作為平均值X,達到平均值則獲得80分,標準差定義為20分;
2、某個維度,門店達到整體平均值,則得分80,每超過1%,加1分,封頂100分;每低1%,加一分,筑底20分;
3、每個維度都這么轉化為評分,畫出的雷達圖確實有點參考價值了;
以上定義平均值沒有外部參考,直接取全部門店的平均值;而定義標準值的時候直接是拍腦袋(根據一些經驗)取20分;
這樣做不知是否有問題,期待回復
很棒 最近在做統計模塊,搜了好多都沒有搜到相關文章,只有作者對很多圖表樣式都做了詳細的解釋說明,非常感謝,持續關注了,希望保持更新,謝謝?。?!
學習了~