以互聯網行業為背景下的數據分析通識(下)
編輯導讀:數據分析聽起來非常高大上,也是很多學生未來想從事的職業方向。在上篇文章中,作者介紹了數據分析如何入門、數據分析的基本流程,本文探索數據分析的進階方法、數據分析的發展前景和優勢,與你分享。
我們上節內容,給大家介紹了數據分析如何入門、數據分析的基本流程,相信大家對入門數據分析的一些要求和入門方法都有了相應的了解。(詳情請看:互聯網行業數據分析通識(中))那么,我們在這里繼續探討,數據分析入門之后的一些事情,包括數據分析的進階方法、數據分析的發展前景和優勢。目的是給大家提供一個做數據分析工作未來的規劃的方向,同時對目前職業狀態也會有一個更全面的定位了。
七、數據分析進階
1.?數據分析進階的階段
在入門階段開始時,我們對數據分析基本流程有了一個概念的認識。那么,在進階的階段,要做的事情很簡單,那就是:完善數據分析流程的基本面理解、更加深入地學習數據分析工具。
我們來看一下數據分析進階的階段:
第一階段:基本信息處理
大部分情況下,公司的數據體系相對已經比較成熟了,所有到你手上的數據都是相對比較干凈和統一了,這時候數據分析的主要工作就是各種數據的提取以及數據處理。
這里面涉及到,整理并了解各種數據指標,搭建數據監控數據表格,包含日常數據監控表、渠道匯總表、銷售明細報表、新增用戶表等等,而使用的工具一般為Excel。而SQL在此階段可作為輔助工具,從數據庫提取和統計數據,然后導入Excel繼續做表格,在這個階段要突破的技能就是 :Excel的技巧和使用。
下面簡單介紹一下,在進階階段,對于Excel的技巧應該要掌握到什么樣的水平。
- Excel的基本功能
- Excel常用函數的使用
- Excel數據透視表的使用
- Excel的基本圖表的使用
基本功能就不必介紹了,之前有一篇推文提及到,如果在推文里面的練習題你可以做到滿分,說明你已經基本合格了。
(推文:Excel基礎知識,Excel功能篇,Excel函數篇)
在常用函數上,你需要掌握如下的函數:
- 聚合類函數,例如sumif,sumifs,countif,countifs,min,max等
- 文本類函數,例如text等
- 時間類函數,例如year,month,day,today,time等
- 查找類函數,例如vlookup,lookup,index&match,find等
- 判斷類函數,例如if,iferror等
其他平時少用的函數,則大可不必花大量時間去研究,除非你立志要成為Excel表格大師。用的比較少的函數,在需要用的時候上網搜索相關資源即可,所以平時只需要掌握常用的這幾類函數就足夠了。
數據透視表的內容比較簡單,跟BI工具的操作如出一轍:拖拉拽。將你想要透視的字段合理的進行規整,并適當的設置透視表的格式,當然如果你想考慮設計一個指標駕駛艙,并使用控件對駕駛艙數據進行更新,那么你還需要學習如何將透視表和控件參數進行聯動的內容。
基本圖表的使用非常重要,除了要學會Excel里面常用圖表的創建方法,還需要學習如何用圖表來準確的表達你想傳達的信息。在圖表設計上,表達內容比圖表制作更重要,同時還要考慮基本的配色,來配合你傳達內容的主題。如果在這一塊想深入了解的話,這里面就是可視化的內容了。
Excel已經是非常成熟的軟件,幾乎所有使用技巧你都可以各種書籍以及相關的網站里找到并操練起來。如果數據量不大,且數據以數值為主,處理簡單的計算邏輯,Excel基本就夠用了。
而當你需要更強大的一些功能,比如對多張數據表靈活切換、分組、聚合、索引、排序,并且結合各種函數的使用,或采用到復雜些的數據分析模型、統計方法,則可進一步學習SQL以及學習Python的Pandas庫進行更高階的表格處理。
第二階段:學會SQL獲取數據
此階段,我們要知道如何去獲取數據,其中最常見的就是從關系型數據庫中取數,可以暫時不會R語言和Python,但是必須掌握SQL數據庫語言。大數據時代,數據正在呈指數級增長,面臨的數據量會大大增加,從GB,到TB,甚至到PB,非常可觀。因此,有著固定行數限制的的Excel顯然無法滿足需求這種大容量數據的分析。因此,學習數據庫語言就顯得非常有必要了。
SQL數據庫語言至少要掌握哪些內容呢:
- “增”:新增庫、表(create),新增數據(insert into),新增約束等;
- “刪”:刪表(drop、delete)等
- “改”:改表(alter)等
- “查”:查表(select),過濾表(where、having、group by)等
基本的增刪改查會了之后,還得學會高級一點的功能,例如:
- 表運算(例如使用union進行表相加等)
- 表連接(例如使用inner join進行表連接等)
- 窗口函數
這時候就需要學習數據庫。理解數據庫和數據存儲結構,會一點增刪改查的數據庫操作,因此,SQL是數據分析的核心技能之一,在這個階段就是從Excel到SQL的數據處理效率進一步進階。
我們經常說“學以致用”,“以用促學”,最好的學習方式就是練習,現在很多平臺都有提供練習SQL語言的地方,例如??途W、LeeCode網等等。經常刷刷題,保持做代碼的感覺,是有必要的。
第三階段:數據可視化展現
數據分析所有的流程里面,數據可視化是發現數據和展示結果的重要一環。試想僅將數據分析結果以數字報告或數字表格的方式呈現在老板的辦公桌上,十年如一日,老板會有啥感想?
具備圖表可視化能力,更加直觀地展現分析結果,幫助管理層抓住數據本質,最好方式就是做出觀點清晰數據的PPT和報表給老板看??梢暬芰κ沁@個階段的數據分析人員必不可少的技能。
在數據可視化展現時,一般的工作場景中常見的就是Excel數據透視表功能,而且目前有WPS里有很多好的的可視化圖案可供大家選擇,還有目前現成的商業智能分析軟件,如power BI或Tableau等,這兩個工具都不要編程功底,實現起來簡單,功能強大,BI商業軟件可以滿足你大部分的可視化需求,不過功能也會存在一些受限的場景。
然而,Python語言在數據可視化方面也有很多功能,比如Pyecharts等,使用編程語言的好處是更靈活、可以更好地適應特殊的需求。
推薦書籍:《用圖表說話》-麥肯錫
第四階段:數據貼合業務進行分析
從按月匯總的數據明細,各種業務信息、驅動因素、環境變量、變化路徑,經過層層的匯總篩選處理,可能已經遺失了大量信息和數據,導致數據分析有所局限,很難對業務決策起到支持作用。
此階段,貼合業務數據綜合的分析,通過對業務的了解 ,基于業務的邏輯對數據進行分析,找到數據指標變動原因,通過發現業務問題點。這個階段需要進行高階的數據處理、加工和分析,通過Sql或者Python讀取數據庫的龐大數據,也是數據分析人員的必經之路。你會真正從數據的角度開始理解業務,洞察一切細節深究業務,也是在這個階段真正的數據分析進階。
第五階段:數據驅動業務
在數據的領域里,整理了無數的數據報表,梳理了很多遍的業務邏輯,最后數據分析人員開始進入這個階段:如何高效能的優化數據指標監控體系,讓數據報表之間的井然有序,讓數據分析更簡單和靈活,讓決策迅速而優化?能結合行業背景,利用數據挖掘工具,建置數據挖掘模型,發掘規律、商業價值、降本提效?
支持優化業務決策、發掘規律、商業價值、降本提效?這不就是數據的分析的價值所在么?因此 ,此階段數據分析人員就需要建立復雜的多維的決策建模,使其更有體系,真正的實現數據驅動業務。就是將二維的平面數據報表,進階到一個個立方體的多維宇宙,多方位的實現數據驅動業務增長,高效能的解決實際業務場景中遇到的大部分復雜工作。比如上千家門店的銷售數據報表合并等。
小結:
總之,在數據分析進階的過程中,有兩個方面的能力:一是思維能力,包含財務思維、管理思維、業務思維、商業思維等;二是技術能力,主要是軟件使用能力和數據展示能力等。可以說,分析工具是數據分析必備的硬件模塊,它就像一雙手。而分析思維,是數據分析必備的軟件模塊,它就像一個大腦。這兩個方面的能力一直穿插在數據分析進階的過程中,在不同的階段不斷的更新迭代、不斷的提升。
2.?思維與數據分析
所謂的數據思維,其目標是讓數據傳達出真正的信息,且呈現出畫面感,而不是一堆堆冰冷的數據指標。就像簡歷或者工作總結中,要體現活動營銷轉化率提升5%,創建企業率提升5%,會員業績提升8%一樣。數據分析思維是通過各種方法收集數據,了解需求,然后改進決策,不斷迭代,降本提效。
在工作和生活中,我們應該通過不同的場景,來不斷培養數據思維習慣。
如在工作中:
- 在廣告投放時,嘗試去估算廣告的受眾群數量大小,渠道數量、成本和效果回收情況,想辦法去拆解出各種影響因素、預期效果、投入成本等信息。
- 在優化產品時,去梳理其商業模式、面對的用戶群體、群體的使用場景,以及可能設置的付費點并去驗證,同時想到可改進的價值點,并觀察后續運營動作是否驗證了改進點。
- 在整理回訪數據時,能通過線索來源,通話總次數,通話有效次數&時長,線索意向級別,銷售司齡等數據維度來判斷這組客戶的意向度,縮短成單周期。
- ·······
在生活中:
- 觀察并思考為什么滴滴打車你的價格高?可能你周圍叫車用戶多而司機少,也可能”其他原因”。
- 觀察并思考為什么微信訂閱號文章改版后,有了點贊,還要增加在看?微信想加深用戶粘性,讓你看到更多朋友的世界,也讓微信文章得到更多曝光。
- 觀察并思考為什么每個超市都鼓勵辦會員卡?因為要留住你,增加你選擇去他們消費的機會,減少去競爭對手消費的機會。
- ·······
小結:
以上是我們可以在工作和生活中需要培養數據思維習慣的思考場景,當然,不同場景產生差異化的行為,而數據分析思維讓我們從數據上觀察到這些差異,然而在實際工作中的前提是,我們要熟悉自己的業務流程以及業務指標等,我們在培養數據思維的同時數據敏感度會不斷提升。
3.?工具與數據分析
數據分析的工具市面上也是有很多的,也在不斷進化發展的,這時我們就需要根據公司業務情況進行選擇。比如做市場研究、競對分析經常會使用Python進行外部數據的抓取,統計分析領域常用到SPSS,以及調用地圖開放平臺進行地圖可視化繪制。
對于數據分析進階之路上,在不同階段應用的工具也有所不同,Excel+SQL這2個工具在上述篇章作為入門的數據分析工具提過,這里就不展開介紹了,這里在進階方面推薦一下Python+可視化工具。
1)Python
大多數人可能是從0開始,從未接觸過編程,因而入門確實是有一定難度的。而更為關鍵的原因是,從數據分析進階的過程中,從技能上來看,Python使用場景豐富,助益頗多,又語言簡潔,適合新手學習。Python是一種面向對象、解釋型計算機程序設計語言。Python語法簡潔而清晰,具有豐富和強大的類庫。它常被昵稱為膠水語言,能夠把用其他語言制作的各種模塊輕松地聯結在一起。
來看看Python能幫數據分析人員做到哪些:
- 掌握Python語法,可以設計一些算法,解決數據分析模型中的一些復雜計算;
- 熟悉Python可視化,可以處理后的數據用更多炫酷圖表的方式展示,視覺上更美觀,又直擊重點;
- Python連接數據庫操作,連接多維模型,可以從零散的數據,到有一定數據規范和模型的數據海洋,優化數據結構,靈活的模擬業務決策;
- ········
(作用太多了 ,就不一一列舉了)
2)可視化工具
數據可視化工具,即將數據分析結果轉化為圖表,其終極目標是洞悉蘊含在數據中的現象和規律,目前市面上的數據可視化工具很多,但基本邏輯都是相通的??蓮腜ower BI+Tableau兩種工具開始。
- Tableau將數據計算和美觀的圖表完美地融合在一起,可以在幾分鐘內生成美觀的圖表、坐標圖、儀表盤與報告。是用來快速分析、可視化的強大工具,偏向商業分析。其特點:輕松整合,易上手,類似于Excel數據透視表/圖的功能,可進行交互,能輕松制作美觀的儀表盤、坐標圖。
- Power BI屬于微軟做的一個專門做數據分析的商業智能軟件,先用PowerQuery處理和清洗數據,再用PowerPivot建模,最后用Power BI的圖表庫作圖。其特點:與Excel無縫對接,創建個性化的數據看板,對于常用Excel的來說學習上手也相對容易。
小結:
除以上提到的Excel+SQL+可視化+Python等數據分析工具外,還有很多其他的工具,如SPSS、R語言等,大家在學習時,可以根據自己的實際需要來學習,不必要花費大量時間,做到樣樣精通。這些工具主要是能夠幫助我們在短時間內完成復雜的數據分析計算過程,輸出準確的數據分析結果,提高工作效率的??傊?,在數據分析工作中,分析工具和分析方法是密不可分的,科學的方法結合高效的分析工具使用,才能提高分析效率和質量。
4.?數據進階的知識點和書籍推薦(僅供參考)
- 網絡爬蟲、SPSS、SAS、R語言等的學習:《SPSS統計分析基礎教程》、《問卷數據分析-破解SPSS的六類分析思路》、《R語言實戰》等書籍。
- 數據挖掘算法得到學習:這部分相對來說還是比較難的,但是在工作中會去深化理解和學習,可以粗略的看看,等工作中遇到的時候再去針對性學習。學習資源有:經典的 《統計學習方法》,主講分類算法,偏理論推導《機器學習實戰》《機器學習》等書籍。
- 數學知識的學習:概率論基礎、獨立事件、條件概率、全概率公式以及貝葉斯定律,有《概率導論》《線性代數》《概率論與數理統計》等書籍。
- ·······
八、數據分析存在的挑戰以及發展前景
1. 數據分析挑戰在哪里?
1)入門容易,進階難
“數據分析”越來越成為各個職業的必備的基本技能,各個職業上的從業人員都會開始學習數據分析,如運營、產品、技術、人力、財務都需要一些數據分析的思維和技能,因此,不只是從事數據分析領域的人員需要掌握的,別的職能也需要懂些基本的,尤其在互聯網行業,要了解常用的基本分析框架和思維,簡單的做個報表,讀懂 A/B test,能做簡單的決定等等。
但是呢,在數據分析這個領域,進階非常難,在方法論以及思維方面,因為實際操作中有很多坑,而這些坑,通過在書本里是很難找到的,即使有也是非常零散。在技能方面呢,大部分人又從未接觸過編程,因此,進階的過程會有一定難度的。
2)不能有效推動業務,價值產出弱
互聯網行業是一個構建在規模經濟之上的、競爭相當激烈的行業,產品更新迭代速度快。只有快速迭代產品,更好、更快地滿足用戶需求,吸引足夠多的用戶關注與使用,獲得快速增長,才能拿到融資、才能獲得較好的現金流,否則很難生存下去。目前2C行業已經到了增長的天花板,競爭只會愈演愈烈。企業會更加在意數據分析的價值產出,希望以數據驅動的形式快速迭代產品,產生更多的用戶增長和現金流。
但是呢,業務發展太快,導致人手不足,數據分析人員沒法深入了解業務,沒有貼合業務的數據分析產出的結果,并不能真正的推動業務增長,也不能很好的判斷哪些需求的優先級,可能導致避重就輕。進而,缺乏數據分析落地的實例,進而循環往復。當然,這里面影響因素是多種多樣,而且互相影響,就不一一展開了。
3)存在感不強,技能要求會越來越高
在很多時候不少公司又缺乏充足的落地的實例,于是行業整體看來,數據分析人員即不如技術類工種難度高、需求大,又不如產品類工種貼近業務,因此,其主要的工作是支撐業務部門,為業務部門提供各種數據用于業務決策。但業務方往往不清楚業務的真實需求,數據分析人員更加不太關注業務,淪為一個取數機器或者表哥等。最終,對工作的熱情一定不會高,也會失去一定存在感。
但是呢,隨著科學技術的進步、5G技術的成熟,整個互聯網行業上將會產生越來越多的數據,這些數據呈現出越來越非結構化的趨勢,數據種類也越來越多樣化,這些數據包括文本、圖片、視頻、音頻、網頁、社交關系等多種數據類型,其處理方式也會更加復雜。因此,不光要懂SQL、Python等,未來的數據分析人員可能還要精通(至少要了解原理、會用工具)很多其他的數據處理技術。這無形給數據分析人員提出了更高的要求,工作也會更加有挑戰。
2. 數據分析發展前景
在大數據和5G技術逐漸成為趨勢的時代背景下,“數據”是越來越常見,如社交網絡、消費信息、旅游記錄……企業層面的銷售數據、運營數據、產品數據、活動數據……
如何快速精準的對這些數據進行處理?
如何從海量數據中挖掘別人看不見的價值?
如何利用這些數據來做精準營銷投放、優化產品、用戶調研、支撐決策?
因此,運營、產品、市場、營銷等工作崗位中數據分析是必不可少的一項技能!數據分析可以將數據的價值最大化!而從各大招聘網站也可以看出來,在薪資方面也是相當可觀的!并且現在各個互聯網的崗位都需要數據分析技能!
由此可見,在未來互聯網職場中,“數據分析”技能無疑成為的標配!就數據分析前景而言,其發展路徑無非是兩條:要么在公司內部做數據分析,偏前端,重在業務分析,用數據分析賦能業務發展。要么數據挖掘方向,偏后端,技術能力要求更高一些,但對業務的理解是基礎。而做數據分析更應該考慮如何用數據創造價值,如果你沒有用數據創造價值的能力,那么就只能等著被數據淹沒,淪為一個取數的或者做報表的機器而已,也就早早的到達職業的天花板。
這往往體現在數據價值的層面上,越往數據應用層靠攏,對數據產生價值的要求就越高,從事數據分析領域的人要常常自省是否有更好的商業意識、數據思維、業務理解能力、數據敏感度等,畢竟在公司層面,沒人關心你是否比某個指標提高了一個百分點,公司關心的是你提高了這一個百分點之后,對公司產生的價值是什么。
那么,你就需要成為具備商業意識、數據思維、業務理解能力、數據敏感度等的高價值的數據人員,所以多多學習吧,別太約束自己,故步自封,多在行業領域內交流。
#專欄作家#
木兮擎天@,微信公眾號:木木自由,人人都是產品經理專欄作家。多年互聯網數據運營經驗,涉獵運營領域較廣,關注于運營、數據分析的實戰案例與經驗以及方法論的總結,探索運營與數據的神奇奧秘!
本文原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Pexels,基于CC0協議
- 目前還沒評論,等你發揮!