以互聯網行業為背景下的數據分析通識(中)
導語:上一期我們從互聯網行業特性、互聯網行業常見的數據指標、數據分析概述等幾個方面了解一下基于互聯網行業背景下的數據分析一些基本的概念(以互聯網行業為背景下的數據分析通識(上))。本期繼續將從數據分析入門、數據分析基本流程兩個方面來進行梳理!
四、數據分析入門
我們不要局限于入門專職數據分析的崗位,而是從廣義“數據分析”的角度,來理解一下如何入門數據分析。不存在質疑自己合不合適做數據分析、糾結零基礎入門難、文科生是不是很難入門等疑問,主要讓大家了解“數據分析”如何入門。
但如果你想入行數據分析,就需要好好思考一些問題:我希望進入哪些數據分析的崗位呢?這職位有前景嗎?自己的性格適不適合做數據分析?符合自己未來的職業定位么?入行后需要什么樣的知識結構?等問題了。
因此,從什么樣的人適合從事數據分析、有哪些入門的書可以推薦、有哪些入門數據分析工具推薦、其他建議幾個方面,來梳理“數據分析”如何入門。
1. 什么樣的人適合從事數據分析?
1)首先:從性格、興趣、愛好等方面來看
要有一定的好奇心和不斷探索未知的性格,并有興趣去知道數據背后的邏輯,當面對分析需求、寫sql代碼、整理海量數據等繁瑣枯燥的工作,能克服枯燥的感覺并嚴謹的完成這些工作,同時更要求有與人溝通以及合作的協調的能力,因為做數據分析需要與業務部門、研發部門等頻繁溝通和合作、明確需求以及推動執行的。這些工作,是你喜歡的、擅長的嗎?
2)其次:從學習、思考的能力方面來看
如何根據數據,來推演、分析、提出解決方案,需要你常常腦洞大開,并且數據分析是需要不斷持續保持學習狀態的。因為數據分析的結論,有時候會和我們的直覺背道而馳,這就需要不斷的通過思考以及學習,完善自己的知識體系。
3)再者:從工具使用的熟練程度來看
我們分析數據, 就需要有數據源,然后處理數據。也就是說數據查詢和處理的能力是做數據分析基本的內功。在數據處理上,就涉及到了大大小小各種各樣的工具,所以就需要掌握這些工具的使用,如Excel、SQL、Tableau、Pyhon等工具。
4)最后:從心態上想想自己是否具有開放性、可容錯性以及堅持不懈的毅力
數據分析的圈子里面,都非常開放。數據也好,還是數據指標也好,其本身并不是完美的,也會出錯,所以我們必須擁有開放的心態以及堅持不懈的精神,所以,才能使我們不斷的從數據中探索,尋求答案。
小結:總之,對于一些缺點和不足,可以考慮改進,使之不再成為短板,比如學習數據分析的基本原理、技術、工具,但是興趣、性格、心態的方面呢?或者會成為你放棄不擅長的職業的原因。
2. 有哪些入門的書可以推薦?
對于數據分析入門,我們先要有數據分析的基本數學概念,初級數據思維,初級數據工具技能。因此,推薦的入門書籍如下:
- 基本數學概念推薦書籍:《深入淺出數據分析》《深入淺出統計學》等——了解基本的統計知識,鍛煉扎實統計基礎。
- 初級數據思維:《精益數據分析》 《數據思維:從數據分析到商業價值》等——了解分析方法、案例、鍛煉數據思維。
- 初級數據工具技能:《誰說菜鳥不會數據分析:入門篇》《誰說菜鳥不會數據分析(工具篇)》等——了解基本知識,掌握基本的工具。
小結:總之,數據分析需要具備多方面的理論基礎,比如
- 基本的數據分析知識:統計、概率論、數據挖掘基礎理論等;
- 基本的商業意識:營銷理論、戰略規劃等;
- 數據處理知識:數據庫、數據結構等。
但是對于小白而言,這實在是信息量太大了,所以在入門的階段,以上推薦書籍,基本上能清晰地讓我們剛入門的朋友們知道數據分析能解決什么問題、需要什么方法論、需要掌握什么基本技術及原理等這些就足夠。懂得常規知識并能找到基礎的工作是入門階段的目標。
3. 有哪些入門數據分析工具推薦?
在工具方面,推薦從Excel+SQL這2個來作為入門的數據分析工具。剩下的一些工具根據自身能力去學習,都可以自學 ,但等有SQL基礎后再學Python等復雜的工具會相對容易些。
1)Excel:最基礎的底層能力, 當然也是必備的
在實際工作中Excel的使用頻率非常高,因為Excel函數、透視表可解決大部分問題,并能夠把存儲、分析、數據可視化很好的結合在一起。而且Excel的熟練程度,也會極大提升數據分析過程中的效率,讓分析更加的強大。還有一個很重要的原因就是Excel的受眾廣。
特別是可以把分析結果展示給業務部門,或者與業務部門對接的時候,會節省大量的時間成本。但Excel功能太多,對于剛入門數據分析的也不可能掌握所有的功能,可以則需而取。主要掌握常見的功能和函數基本上就可以覆蓋大部分的應用場景了,比如:
- 基礎功能: 列排序、篩選、去重、求和、求平均;
- 高級功能: 透視表行列值匯總、占比匯總、過濾、排序 (主要是可視化圖表);
- 數值函數:ABSCEILFLOOR···
- 邏輯函數: IFIFERROR ···
- 字符函數: LEFTRIGHTCONCATENATEVALUE ···
- 時間函數: YEARMONTHDAYDATE ···
- 高級函數: VLOOKUP···
(后面我們有專門Excel講解,這里就 不一一展開了)
2)SQL:一門專門為數據查詢所設計的編程語言,也是所有數據分析師們都必須掌握的基礎要求
因為當小規模的數據處理、分析、展示Excel都可以搞定,但對于大規模的數據處理而言,Sql是必備的取數手段,在數據獲取和數據清洗環節都會用到SQL,要看哪些數據需要處理,然后導出數據。
對于剛入門數據分析來講,可以先從幾個核心語句入手學習SQL:
- 檢索數據:SELECT FROM
- 篩選數據:WHERE / HAVING
- 數據分組:GROUP BY
- 匯總函數:聚合函數
- 數據排序:ORDER BY
- 數據選取:LIMIT
掌握以上語句和一些基礎函數后,在實際應用中可以滿足我們80%左右的查詢需求。而關于增刪改語句,我們可以進行了解,在應用中我們基本不會接觸到修改數據庫的權限。推薦《SQL必知必會》這本書可以熟悉基礎用法。如果為了應聘,可以去??途W找一些真題練手,學習SQL主要還是以練題為主(后面我們有專門SQL講解,這里就不展開了)。
小結:總之,“工欲善其事,必先利其器” ,一件稱手的工具能讓我們事半功倍。對于數據分析人員來說,數據分析基本流程中的數據獲取、數據清洗、數據可視化分析的部分,最常用的組合是 SQL + Excel + PPT/可視化(入門級的Excel 就可以做可視化,還有一些Power BI、Tableau等可視化軟件這里就不展開了)。
4. 其他建議
對于入門數據分析主要建議還是主要把精力放在數據分析的思維以及方法論的熟悉與訓練上。
比如:
- 平時可以多去看一些商業數據模型、數據分析案例;
- 關注一下數據類的公眾號(比如我的公眾號木木自由(專注數據領域干貨、經驗、實戰、課程分享),哈哈,但公眾號的文章類目可能比較雜,建議看完要自己歸類整理吸收,必須形成自己的數據體系);
- 加入一些數據分析的專業社群也是一個不錯的入門法子;
- 網上很多數據分析的資料(人人都是產品經理等那些優質網站),最后逐步的一點一點的形成自己的分析思路。
小結:總之,數據分析入門并不難,入門之后的知識積累才是重點,如何在實際工作、項目中真正發揮數據分析的作用,產生價值。并且優秀的數據分析人員一定是主動發現問題、解決問題并扛得住壓力的。只要明確了方向,那么剩下的就是堅持了!
五、數據分析基本流程
數據分析基本流程一般是這樣的:
1. 數據理解
數據理解,即明確數據分析的目的以及問題。
因為,我們做任何事情都要有明確目的,數據分析更是如此,需要把問題以及目標定義清楚。在做分析之前,我們可以要明確幾個問題:
- 理解分析的需求目標:我們為什么要做數據分析?分析什么?想要達到什么樣的效果;
- 理解受眾用戶和業務:想通過分析達到一個什么樣目的?是提升相關業務指標還是發現問題?只有明確目的才能制定合理的數據分析思路;
- 明確需求數據來源:即數據如何產生的,分析怎樣的場景,比如app用戶從下載到成為會員的用戶路徑,從而制作漏斗模型,優化付費成為會員環境,提高付費量,這就是場景。要根據場景去定義問題,梳理數據分析思路,選擇數據分析的方法;
- 明確分析業務問題優先級:通過對問題進行重要性及緊急性排序,針對行的分析較為重要的問題。
2. 數據收集
數據是一切分析的基礎,一般情況下,每個公司都有自己的一些服務器和數據庫或者運營后臺。而數據收集的程度和準確性往往就決定了數據分析結果的可靠性和有效性。
3. 數據清洗
收集好以后,我們需要對數據去做一些清洗。因為很多數據有問題,不準確的數據分析出的結果毫無價值意義。比如 數據殘缺(空數據)、數據錯誤、數據重復、數據異常等問題,我們都需要對這些數據進行清洗。
4. 數據分析
在數據進行簡單的清洗后,我們就需要去做一些數據分析了。
即通過一系列的數據分析方法從數據得到可以回答需求的答案,根據分析需求以及目的,圍繞是多少、是什么、為什么、會怎樣、又如何來展開,通過進行描述性分析、診斷、用戶分類/分層、預測等分析方法,對數據進行分析。
1)是多少、是什么:描述性分析,評估業務現狀
描述性分析主要是將基礎數據進行匯總,并轉化為便于理解的形式,清晰地展示目前的業務是怎么樣的,例如各種周月報表、圖表等。通過描述性分析可以快速評估業務特征,以及找到分析的方向。通過觀察數據的分布情況、 業務指標的波動情況,從中找到出現異常的數據,并分析出異?,F象的原因。
2)為什么:相關性分析,找到關鍵因素,進行指標拆解
基于描述分析進行問題的深入挖掘,尋找業務變化的原因,通過相關性分析,找到關鍵因素,進行指標拆解,分析問題是如何發生的,我們就可以從哪些方面去解決問題。
例如:發現本月整體的GMV(成交總額)減少,我們該如何發現原因?
首先,可以通過計算各個級別門店GMV變化與整體GMV變化的相關系數,確定那個類別的門店GMV對整體GMV影響最大(這里不展開具體分析,簡單了解一下場景)。
其次,拆解GMV業務指標:GMV =顧客總數*成交轉化率 * 平均客單價= 門店數量 * 店均人數 * 人效,當GMV發生變化時,我們可以通過分析門店數據、平均客單價、成交轉化率、門店人效等子指標的變化來確定原因。
再者,指標維度下鉆,GMV = A店GMV + B店GMV +C店GMV ,通過逐步細化指標維度,實現原因判斷。常用的維度下鉆有日期、地理等維度。
最后,挖掘并總結各種事物的相關性,進而,對于制定精準營銷策略具有指導意義。
3)會怎樣:預測
預測未來可能發生的事情,側重于未來的走勢以及是否可以提前規避風險。實際工作中,可根據歷史數據和分析技術(如機器學習)對未來結果進行預測。
通過技術手段可以以很高的精度形成對未來的見解。但需要高深的技術知識,對于入門的朋友來說,可以通過同比,環比,對比分析,趨勢、回歸分析等,結合以往經驗和知識,進行預測分析和判斷。
4)又如何:分群、分層
基于描述、指標拆解、預測等以上一系列操作分析 ,對業務提出可落地可執行的措施。并進行用戶特征、用戶行為對用戶進行分群分層,實現精細化運營,進一步提升運營效率和轉化率。
比如,以要實現GMV的穩定增長為例,通過數據分析描述現狀、發現原因、指標拆解、預測未來變化等操作,并結合業務狀況,和業務運營共同制定用戶分層精細化運營、增加活動力度,提升轉化率等運營策略。
總之,數據分析方法有很多,如對比分析、多維分析、轉化分析、留存分析等,這里就不一一展開了,可根據自己的業務場景,選擇合適的分析方法!
5. 數據展現
其實也就是數據可視化,把數據結果通過不同的表和圖形,可視化展現出來。
可視化是數據分析結果呈現的重要步驟,可視化是以圖表方式呈現數據分析結果,這樣的結果會更清晰、直觀,容易被理解,對于入門級別的常見的數據可視化工具可以是excel。
6. 數據報告
經過上述一些列的步驟,得出了哪些結論?可以采取哪些優化措施?這些都需要以數據報告的形式進行呈現?;窘Y構如下:
- 背景——描寫報告的業務背景,只有受眾了解了才能知道報告的價值所在;
- 數據來源——注明數據來源,才能提高可信度;
- 數據展示——數據文字合理的排版,才會有好的可視化效果;
- 拋出結論——有結論的分析才有意義;
- 提出建議——根據分析結論提出相應的建議。
7. 結果驗證
數據分析結果的應用是數據產生價值的直接體現,而這個過程需要具有數據溝通能力,業務推動能力和項目工作能力。
如果得到了結果卻不知道做什么,那么這個數據分析可能就是失敗的。此時我們就需要檢查數據分析方法是不是有問題;其次,數據是否進行過加工處理?再其次,數據收集的是否可靠?這就需要具體問題,具體分析了。
小結:
以上就是一次標準又簡潔的數據分析全流程。然而,在實際的業務分析中,一般在第七步得到了驗證結果后還要回到第一步,回顧分析的目的,去與業務或者運營人員溝通,反饋結論,比如哪里有異常、原因、下一步動作等事宜,這也就使數據分析形成了“閉環”。
然后相關業務人員再次提出疑問去確立新的分析目標,通過如此反復的迭代優化及分析,可提高營銷活動有效性,提高投資回報率等數據指標……“閉環”其實就是“揚長避短”,讓數據引導動作到更有價值的地方,實現資源配置最大化,也就是所謂的數據驅動業務。
#專欄作家#
木兮擎天@,微信公眾號:木木自由,人人都是產品經理專欄作家。多年互聯網數據運營經驗,涉獵運營領域較廣,關注于運營、數據分析的實戰案例與經驗以及方法論的總結,探索運營與數據的神奇奧秘!
本文原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
- 目前還沒評論,等你發揮!