對數據可視化產品的一點小思考
因為業務調整的關系,2017年下半年,我開始負責一款數據可視化的產品。所以在此聊聊我對數據可視化產品的思考。
?一、問一句為什么?
首先我們需要明確一點——用戶為什么需要數據可視化產品?換句話來說,用戶為啥會有「將數據轉化成圖表」的需求?根據我目前得到的用戶樣本來看,有兩大原因:
- 探索性可視化(分析數據的時候需要用到數據可視化,來快速發現數據的特征、趨勢與異常)
- 解釋性可視化(將分析好的數據以可視化的方式傳遞給別人)
1、探索性可視化
探索性可視化需求一般集中在數據分析場景中的數據探索場景。在分析數據的時候需要對數據進行探索,最后才能得出結論。
但是為啥我們需要使用可視化的方式去探索數據呢?使用統計學的方式不就能得出結論了嗎?其實并不是,最典型的案例就是安斯庫姆四重奏。四組數據的平均數、方差以及相關系數都一樣,你可能會覺得這些數據的分布應該也會很像。
但,當你使用數據可視化的方式去看這些數據時,你會發現他們的分布都不一樣:
從流程來看,探索性可視化是這樣的:
2、解釋性可視化
解釋性可視化需求一般集中在完成了數據探索,并且形成一定數據洞察后的 story-telling 場景。大家在網上看到的一些「一張圖搞懂 XXX 」、「一張圖了解 XXX」就屬于解釋性可視化。所以解釋性可視化的流程是這樣的:
二、做不做?做哪些?
1、現狀
貌似兩種可視化的方向不同,但是基本上主體需求——制作圖表,是一致的,所以基本上市面上的數據分析產品都是這么搞的:
只是在前后兩種可視化的功能特性上會有所不同。比如前一個可視化,可能集中在圖表的微觀功能上,像輔助線、預警、各種圖表類型等。另一個可視化,則是集中在整體的圖表可視化上,比如將多個圖表組合起來,制作成一份報告或者故事版,所以會提供類似標題編輯器、排版編輯器等功能。目前市面上的 BI 產品,像網易有數、BDP、Tableau、PowerBI 都是采取這種模式。
就我目前對各路競品的了解,目前國內的廠商一般是這么搞的:
用戶導入數據到產品,然后進行一些可視化的探索,或者直接將數據進行可視化的表達。不同產品的差異點可能在交互模式上,以及數據清洗,數據多渠道采集上。
2、我的一些小想法
但是,基于我對目前的用戶樣本量的理解,我發現這種偏業務型的產品框架,并不太適合國內市場。因為這類產品面向的用戶基本上是專業用戶(數據分析師),而忽略了一個事實——大部分中國企業并沒有設立專門的數據分析崗位。有能力配備數據分析師的企業一般都是中大型企業,他們付費能力可能比較強,但是也意味著用戶量會較少。(所以現在很多這類產品都會收取巨額的實施與培訓費用,或者為沒有數據分析師的企業,提供一些模板/定制開發功能,但是這也導致了企業發展到一定地步后,發現模板不適用,而需要再次付費實施的情況。)
就我目前對用戶的理解,用戶樣本集中在以下兩大塊:
專業用戶對應的是數據分析師,而半專業用戶則對應的是類似財務、銷售、HR 等,在業務上專業但數據分析上不專業的用戶。在企業里面,其實半專業用戶遠大于專業用戶。而這類用戶的日常工作又一般集中在解釋性可視化上面,比如年終總結、年度規劃、每月匯報中都需要利用到數據可視化。所以這類用戶的流程是這樣的:
用戶導入數據,無需太復雜的操作,即可直接生成圖表。(為什么少了數據化探索呢?其實是因為在半專業用戶中,又以中小型企業的用戶為主,他們的業務相對單一,且交易、財務數據都不會太大,只需要簡單的 excel 就能完成。當然了還有一些是靠 erp 數據分析的,這里就不展開細談了。)然后根據圖表,補充自己的洞見,就可以制成報告給到老板。
這里有兩個關鍵點,一個是「快速制作圖表」,一個是「行動」。基于目前的用戶樣本分析,并結合我現在學習的機器學習知識(是的,我又挖了個學習大坑),發現完全可以將機器學習技術融入到數據可視化呈現上,理由有以下幾點:
- 我發現其實在企業里產生的數據非常機構化
- 數據一般還帶標簽(比如 excel 表中的表頭,ERP 里面的字段名)
- 我們可以通過用戶行為,學習用戶對圖表的偏好(比如偏向于使用折線圖而不是柱狀圖)
另一個「行動」,則是類似一些展示報表后的「互動」環節,一般用戶會將自己制作的圖表以及洞察制作成 PPT ,然后發送給老板,有的時候還可能會以會議的方式匯報給老板。但是這種方式有幾個問題:
- 數據發送不及時
- 互動性弱(沒有給老板一個激勵下屬的通道)
- 制作成本高
而目前市面上的 BI 產品都會提供一個轉發功能,允許用戶分享到微信或者其他 IM 應用。但是這一塊的互動性還是有待加強的,比如能讓用戶在視頻、語音會議的時候能夠調出圖表。
所以,我認為,目前數據可視化產品的切入點,不在于多強大的編輯能力,或者系統接入能力,而在于「快速制作圖表」和「行動」上。(因為目前市面上的 BDP、Tableau、PowerBI 的編輯能力以及接入能力就很強了,在這上面跟他們斗并不現實)只要前期使用決策樹的方式,開發「用戶上傳 excel 自動生成圖表」的功能,輔助「行動」階段的分享、點贊、評論,以及其他互動元素,最后提供一定的 API 能力即可。然后未來就可以研究各類數據模型,讓機器輔助用戶做洞察,像自動計算同環比、預警、預測等。同時提高數據接入能力(注意不是系統接入能力),引入更多外部數據到數據分析系統里面,比如天氣數據、同行業銷售數據等等。
三、再問一句為什么?
但是這還沒有完,前面的分析只是集中在「數據分析」或者「數據可視化」的場景,其實還可以繼續深挖,再問一句為什么?為啥企業要分析數據?為什么企業要將數據可視化?我想最終的答案一定是回歸到企業管理的「第一性原理」——開源節流。企業需要數據去分析如何才能節省更多錢,如何才能賺更多錢
我想未來的 BI 的產品不能將自己定位為「工具」,而是應該定位為「服務」。這里的「服務」不是說從原來的買斷式收費,轉變為按年收服務費,這只是商業模式的轉變。我理解的轉變是要從產品理念上做文章,BI 產品不能只是一個工具,而應該是一個服務平臺,連接企業內外部數據之外,并且更重要的是,需要連接企業內外部的業務。比如連接供應鏈的數據,連接財務數據,連接審批數據等等。
比如,對于一家生產魚丸的企業,當系統發現制作魚丸的原材料庫存不足,但是又快到銷售的旺季,是不是能提前預警,并且快速將此信息發到供應商那,直接訂貨。再比如,當一家企業的現金流并不是非常健康時,系統能否能推薦企業一些「財務顧問」服務,甚至「現金貸款」服務?
不過這里的難點就在于如何解決「既做裁判又做運動員」的問題,但是我想這總歸是有方法的。
本文由 @Jimmy Wang 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 unsplash,基于 CC0 協議
很精練都的描述 因為公司業務分析需求 ,這兩天在了解關于bi方面的信息 看完 明白更多 就是自己從頭學好吃力