數(shù)據(jù)分析(1):三觀的建立
本篇文章主要分享了產(chǎn)品經(jīng)理數(shù)據(jù)分析技能的基礎(chǔ)認知,所謂成大事,三觀要正。故起名數(shù)據(jù)分析:三觀的建立
一、數(shù)據(jù)分析的概念
數(shù)據(jù)分析大致可以分為三個層次(這邊沿用蘇格蘭折耳喵的部分觀點):
1)描述性數(shù)據(jù)分析
如果沒有系統(tǒng)學(xué)習(xí)過數(shù)據(jù)分析的一般處于這個階段,常用的方式:對比分析、平均分析、交叉分析等。
2)診斷性數(shù)據(jù)分析
從這個階段開始,才剛剛進入真正的數(shù)據(jù)分析階段。這個階段可以運用一些數(shù)據(jù)分析的方法論來對數(shù)據(jù)進行解釋。如AARRR模型,PEST模型、5W2H、邏輯樹、用戶行為理論等。
3)預(yù)測性數(shù)據(jù)分析
運用機器學(xué)習(xí)等方法建立模型,預(yù)測數(shù)據(jù)。
不同的人有不同的分類方法,但是萬變不離其宗。
數(shù)據(jù)分析的一般步驟是:
獲取數(shù)據(jù)、處理數(shù)據(jù)(抽樣、清洗等)、數(shù)據(jù)結(jié)果(數(shù)據(jù)處理后得到的一些統(tǒng)計量,我們平常用到留存率、活躍度等等都是)、分析原因(分析數(shù)據(jù)變化的原因,如可能是活動帶來了活躍度的提升)、預(yù)測(提供決策參考)。
二、數(shù)據(jù)的來源
要進行數(shù)據(jù)分析,首先得要有數(shù)據(jù)。數(shù)據(jù)可以分為內(nèi)部數(shù)據(jù)以及外部數(shù)據(jù)。又可以分為一手數(shù)據(jù)和二手數(shù)據(jù)。內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)容易理解,內(nèi)部數(shù)據(jù)即自己掌握的數(shù)據(jù),如埋點數(shù)據(jù)等。外部數(shù)據(jù)包括結(jié)構(gòu)化的如三方應(yīng)用市場的下載數(shù)據(jù)到非結(jié)構(gòu)化的評論數(shù)據(jù)。一手數(shù)據(jù)主要指的是可以直接獲得的數(shù)據(jù),如埋點產(chǎn)生的數(shù)據(jù)就屬于一手數(shù)據(jù)。二手數(shù)據(jù)指的是經(jīng)過加工的數(shù)據(jù),如數(shù)據(jù)分析師給出的數(shù)據(jù),以及各種媒體給出的數(shù)據(jù)。
那么數(shù)據(jù)的來源有哪些呢?
1)數(shù)據(jù)庫
一般可以從公司內(nèi)部的數(shù)據(jù)庫中獲取想要的數(shù)據(jù)。如果沒有可以提出數(shù)據(jù)收集的需求。
2)公開出版物
國家統(tǒng)計網(wǎng)站、《中國統(tǒng)計年鑒》等。
3)數(shù)據(jù)平臺
cnzz統(tǒng)計、友盟等統(tǒng)計工具,基于自身產(chǎn)品是否有接入。
4)自建數(shù)據(jù)平臺:
大廠一般都有自己的數(shù)據(jù)平臺。另外也有一些開源的數(shù)據(jù)平臺可以免費使用,如airbnb的superset。
5)爬蟲抓?。?/strong>
這是最常見的一種方式,需要一定的編程基礎(chǔ)。不過現(xiàn)在也出現(xiàn)了一些采集器,如GooSeeker很大程度降低了門檻。
6)市場調(diào)研:
自己動手豐衣足食,大學(xué)時候做論文沒少做過問卷調(diào)查,這里方法不再贅述。
三、數(shù)據(jù)分析的三觀
1)分析目的要明確:
數(shù)據(jù)分析一定要圍繞著目的進行,而不是單純的擺數(shù)據(jù)。
2)掌握一定的數(shù)據(jù)分析手法,但是不要沉迷于手法:
數(shù)據(jù)分析的手法有很多,基礎(chǔ)的一定要掌握,如對比分析、分組分析、交叉分析、結(jié)構(gòu)分析、漏斗圖、因素分析、矩陣關(guān)聯(lián)。而高階的數(shù)據(jù)分析手法如邏輯回歸、主成分分析、因子分析等,一般作為產(chǎn)品經(jīng)理(非數(shù)據(jù)方向),用到的會比較少。所以可以做了解,有興趣的可以深入鉆研。但是要明白一點并不是手法越高級分析越準確,合適的方式才是最準確的。不要過分沉迷于高級手法,以分析目的為導(dǎo)向。
3)數(shù)據(jù)分析要結(jié)合業(yè)務(wù):
產(chǎn)品經(jīng)理相對于數(shù)據(jù)分析師的優(yōu)勢就是更懂業(yè)務(wù)。懂業(yè)務(wù)有什么好處呢?可以很輕易的理解數(shù)據(jù)分析師可能理解不了的一些數(shù)據(jù)的關(guān)聯(lián)性。如著名的“啤酒”與“尿布”的案例。結(jié)合業(yè)務(wù)進行數(shù)據(jù)分析,才能更好理解數(shù)據(jù)背后的真相。
四、數(shù)據(jù)分析的工具
數(shù)據(jù)分析的工具沒有孰好孰壞,適合自己的就是最好的。介紹一下我們常用的數(shù)據(jù)分析工具:
1)Excel:
我們最熟悉的Excel是一款出色的數(shù)據(jù)分析工具,雖然大多數(shù)人只是把它當(dāng)成表格?;旧弦呀?jīng)夠用了!但是畢竟不是為統(tǒng)計而生的軟件,如果常使用高級分析手法的人會覺得不順手,因為一些計算沒有被封裝好,還得自己寫。不如直接用專用的統(tǒng)計工具。
2)SPSS:
毫無疑問,說道統(tǒng)計工具無人不知SPSS,統(tǒng)計必備,提供了很多分析方法。
3)Python:
Python明顯和上面不是一個類別的玩意兒,為什么我把它列出來是因為預(yù)測型的數(shù)據(jù)分析離不開機器學(xué)習(xí),說道機器學(xué)習(xí)就不得不提python,至于為什么是python不是本篇重點,有興趣可以自行查找相關(guān)材料。python主要推薦anaconda,它解決了各種數(shù)據(jù)科學(xué)的依賴包,對于不熟悉python的人簡直就是福音。
4)R:
R就是為統(tǒng)計而生的語言。專業(yè)性較強,適合統(tǒng)計學(xué)背景的大神使用。
5)其他:
JMP、SAS、XLstat等等。有興趣可以自行查找資料。
本文由 @?躚塵 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自PEXELS,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!