本文將企業大數據體系的構建分為六個層級,但并非是線性過程,每個層級之間或有基礎關系,但并不是說一定要逐層構建。例如創業型公司,在缺乏數據研發實力的時候,多數會借助第三方平臺進行數據上報與分析。
下面一張圖,是本文的精華概括,后面一一展開與大家探討。
一、數據基礎平臺
基礎的數據平臺建設工作,包含數據平臺建設,數據規范,數據倉庫、產品數據規范,產品ID,用戶ID,統一SDK等。
很多公司的數據無法有效利用,就是缺乏統一規范,產品數據上報任由開發按照自己的理解和習慣上報,沒有標準化的SDK和上報協議,并且數據散落在各個部門產品的服務器,無法構建結構化的數據倉庫。
做數據平臺的架構,很多人會理解為高大上的技術活,其實整個數據平臺價值的體現,需要公司各個部門的配合,例如關鍵數據指標體系的建立,需要從各個部門業務指標進行提煉,并得到業務部門認可。常見的關鍵指標有:DAU、PCU、WAU、MAU、按天留存率(1-30日留存)、累計留存率(7日、14日、30日累計留存率),新增用戶,有效新增用戶,活躍轉化率,付費轉化率,收入指標,ARPU人均收入,渠道效果數據等。
下圖是騰訊和阿里的數據平臺架構。
阿里大數據業務架構:
阿里云梯分布式計算平臺整體架構:
二、數據報表與可視化
在第一層級中,進行數據指標體系規范,統一定義,統一維度區分,就可以很方便的進行標準化可配置數據報表設計,直觀的可視化輸出設計,包括行為、收入、性能、質量等多種數據類別。
在PPT中以友盟、迅雷、百度、騰訊等公司的數據報表體系進行詳細講解。
騰訊數據門戶
阿里數據地圖
三、產品與運營分析
在建立數據平臺和可視化基礎上,對已有的用戶行為、收入數據等進行各種分析,輸出日報、周報、月報、各種專題分析報告。常見的數據分析工作如下:
1. A/B TEST進行產品分析優化;
2. 運用漏斗模型進行用戶觸達分析,如TIPS、廣告等曝光到活躍的轉化;
3. 收入效果監控與分析,包含付費轉化率、渠道效果數據等;
4. 業務長期健康度分析,例如從用戶流動模型、產品生命周期分析產品成長性和健康度;
5. 營銷推廣活動的實時反饋;
用戶畫像也是常見的數據分析方式,包括用戶如性別、年齡、行為、收入、興趣愛好、消費行為、上網行為、渠道偏好、行為喜好、生活軌跡與位置等,反映用戶各種特征,以達到全面的了解用戶,針對性的為用戶提供個性化服務的目的,通常每半年做一次用戶畫像的專題分析。
下圖是常見的數據分析思路:
常用分析工具:EXCLE,SPSS,SAS,Enterprise Miner,Clementine,STATISTICA。個人用的比較多的是:EXCEL和SPSS。
下圖是SPSS常用的數據分析與挖掘方法:
四、精細化運營平臺
基于數據基礎上搭建的精細化運營平臺,主要的平臺邏輯多數是進行用戶細分,商品和服務細分,通過多種推薦算法的組合優化進行商品和服務的個性化推薦。另外還有針對不同產品生命周期,用戶生命周期構建的產品數據運營體系。
五、數據產品
廣義的數據產品非常多,例如搜索類,天氣預報類等等。這里主要講狹義的數據產品,以BAT三家公司的數據產品為例進行分享。
騰訊:廣點通、信鴿
阿里:數據魔方、淘寶情報、淘寶指數、在云端
百度:百度預測、百度統計、百度指數、百度司南、百度精算
截取幾張PPT如下:
?六、戰略分析與決策
戰略分析與決策層,更多的是跟很多傳統的戰略分析、經營分析層面的方法論相似,最大的差異是數據來自于大數據。
有很多企業錯誤的把“業務運營監控層”和“用戶/客戶體驗優化層”做的事情放在經營分析或者戰略分析層來做。傅志華認為“業務運營監控層”和“用戶/客戶體驗優化層”更多的是通過機器、算法和數據產品來實現的,“戰略分析”、“經營分析”更多的是人來實現。很多企業把機器能做的事情交給了人來做,這樣導致發現問題的效率較低。
建議是,能用機器做的事情盡量用機器來做好“業務運營監控層”和“用戶/客戶體驗優化層”,在此基礎上讓人來做人類更擅長的經驗分析和戰略判斷。
在變化極快的互聯網領域,在業務的戰略方向選擇上,數據很難預測業務的大發展方向,如果有人說微信這個大方向是通過數據挖掘和分析研究出來,估計產品經理們會笑了。從本質上來說,數據在精細化營銷和運營中能起到比較好的作用,但在產品策劃、廣告創意等創意性的事情上,起到的作用較小。但一旦產品創意出來,就可以通過灰度測試,數據驗證效果了。
來源:虎嗅網 作者:BLUES