數據視覺化的首要能力——圖解能力
數據可視化是一個直觀表現數據信息的手段,而圖解能力就是數據視覺化的首要能力。
對比過去人類社會利用自然資源、人力資源,經過的工農業時代,隨著信息時代的迅速發展,各個領域的數據信息不斷堆疊和更新,產生了能夠反應人類生活習慣、自然規律和社會規律的巨量數據資源。
目前,數據資源也成為了與自然資源、人力資源同樣重要的戰略資源。因此,為了滿足用戶自身日益增長、與時俱進的需求,將數據加工成易于理解的形式,讓數據分析專家以外的人也能理解其意義才是龐大數據自身價值的提升。這時候,就需要將數據視覺化,在視覺設計行業里也有一個概念“信息圖表設計”也與此類似。
本人從事醫療衛生大數據產品工作,為了結合自身職業特點,本文將以醫療行業為例,闡述數據視覺化的首要能力——圖解能力。
目錄:
- 圖解是什么?
- 圖解的必備能力
- 圖解的制作流程
- 數據視覺化
圖解是什么?
圖解是用簡單的圖形以及簡短的文字來說明事物的一種表現方法,包括圖形、表格、統計圖等。該方法印象深刻、直觀、邏輯性強,呈現的是事物發展流程的時間軸和流程間的相互關系等等的故事性。
使用圖解可以解決以下問題:
- 單純文字無法給人留下深刻印象;
- 單純文字無法給人帶來說明感;
- 無法進行僅僅有條的說明。
圖解的必備能力
由于圖解的作用是為了突出信息數據的故事性,因此分析能力和編輯能力是必不可少的能力。
從海量數據中抽取可信度較高的信息,引導事物間的關系,這就是分析。而編輯則是設定圖解的主題,思考如何將內容通過合乎邏輯的方式表現出來。
例如對高血壓疾病的臨床數據進行挖掘,提取出“高血壓人群高危因素”的標簽,采用隊列研究,使用統計工具,最終可以得出一個用于高血壓風險預測的量表。前面的隊列研究和統計,就是分析能力;而后面的量表制作就是編輯能力。這樣就很好地構建了對高血壓疾病數據進行挖掘利用的故事。
當然,有設計能力固然很好;排版和色彩搭配方面的知識,也會為制作淺顯易懂的圖解錦上添花,但它并非必要的。
圖解的制作流程
圖解的流程可以分為六大步驟。
在把握了整體流程后,可以進入每一步的具體步驟。若在制作過程中出現需要返工的情況,也要遵循此流程進行。
- Step 1:確認使用圖解的目的
- Step 2:信息的整理
- Step 3:信息的整頓
- Step 4:故事編排
- Step 5:設計
- Step 6:檢查
Step 1:確認使用圖解的目的
首先根據需求確定好為什么要使用圖解進行解決?可以用4W(why、who、where、what)進行發問。
1)為什么?
2)誰?
3)在哪里?
4)什么?
Step 2:信息的整理
首先,區分信息整理和整頓是兩個不同的概念。
整理:所謂整理是扔掉不需要的東西,所以只要沒有垃圾,就不需要整理。整理所需的是判斷力,判斷某個信息是否需要刪除。
在醫學統計中,常需要處理觀測對象中的缺失值、異常值,以及隨訪過程中被試者脫落、退出、中止造成最終數據的不完整。
整頓:所謂整頓,目的是為了方便信息的查詢/檢索/調用,這時候需要對信息做標簽化處理,將其整頓成無論誰都能輕松查找/提取的形式。
在醫療信息系統中,也有大量的標簽體系構建方法和應用研究。目的之一是為了醫護人員方便查找和提取與患者相關的診療信息,以共對患者進行全生命周期的管理。
Step 3:信息的整頓
Step 4:故事編排
以結構化信息為基礎,將其編排故事。
上述整頓好的高血壓的危險因素,已經是結構化的信息了。為了進一步得到高危因素,從而在普通人群中獲得高血壓高危人群,予以警示。
這時候,我們可以在這些因素中繼續深挖,編排好故事,例如:什么樣的體征(什么年齡段、多少數值的BMI、血壓、血糖、心率),什么樣的生活習慣(酗酒程度、抽煙程度、熬夜情況、高糖飲食和鹽攝入多少算高危等),并有著既往病史和家族史,以上占有一項以上者都算是高危人群。
Step 5:設計
確定好想要傳達的故事內容后,就要思考以何種形式的圖解呈現最為合適了,這就是要選擇符合故事內容的圖解類型,表格、關系型圖、流程圖、統計圖、比較型圖……
上述高血壓高危人群篩查的故事是一種因果關系型的圖解,所以選擇關系型圖來表達故事內容(下面的圖解是我自己隨意編輯的,不符合實際)。
Step 6:檢查
圖解設計完成后,最后的步驟就是檢查,檢查可從三個角度展開。
1)信息的檢查
- 信息源是否可信;
- 是否信息有時效、量的問題。
2)故事的檢查
- 故事的發展情況是否有問題;
- 有沒有存在只選擇了對字友力的信息組織故事的問題。
3)設計的檢查
- 有沒有與故事內容相融合;
- 有沒有設計過度的問題。
數據視覺化
數據視覺化離不開各種圖解來對信息的分析和呈現,而圖解能力必備的是分析能力和編輯能力,更是數據視覺化的首要能力,而接下來這部分主要就是錦上添花的設計能力。
首先,來看這張關于美國人關注牙齒健康的一個宣傳報告,這張圖的標題是《How Well Do We Take Care of America’s Teeth?》。
這張圖里有四個統計圖表,如果沒有視覺化設計,可能只會呈現四個橫著的和豎著的直方圖/條形圖,也恰好是是圖解部分,雖然也呈現了與牙齒健康問題有關的數據分析,也編排了故事內容,但是對于受眾的視覺沖擊并沒有那么深刻。
而這張圖,第一眼就可以看出是關于牙齒的內容(有牙刷、牙膏、牙齒),巧妙吸引了大家的眼球從而達到宣傳牙齒健康的目的,分享了牙齒存在健康問題的信息,也能夠進行自我定位(處在哪種程度的牙齒問題,需要在哪個環節提高關注度等)。
優秀的數據視覺化的5個條件:
- 使用有意義的視覺要素;
- 簡潔、有親和力、易于理解;
- 有沖擊力、引人注目;
- 內容有價值、想要作為資料保存;
- 可以激發用戶思考。
結語
綜上,在還沒有擁有極強的設計靈感的時候,去提高信息的分析能力和編輯能力是數據視覺化的首要任務。
我在工作中也要進行大數據產品的可視化部分的設計,有時候就是很糾結美觀,色彩搭配、頁面排版等。但是,我還是會先思考數據的分析、需求是否得到解決,整個圖解是否完整表達了用戶心中的故事,這樣的圖解制作是否真實可靠,以便能夠實時應用于各類用戶等。
當然,錦上添花的技能也要去慢慢獲取,逐步提升自己的設計能力。
參考書籍:
《信息圖表設計》,作者櫻田潤。
本文由 @果凍 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
文章有2處錯誤,第1處:step3信息整頓的圖片上的:最后剩下的是19個危險因素,不是21個。第二處是:“有沒有存在只選擇了對字友力的信息組織故事的問題”,應該是”有沒有存在只選擇了對自己有利的信息組織故事的問題”。
? ?? 如果有讀到這個尷尬的地方,不好意思了,筆誤了。
還有個錯誤,僅僅有條? 應該是井井有條吧
嗯嗯,是噠