運營入門:從0到1搭建數據分析知識體系

14 評論 60030 瀏覽 588 收藏 28 分鐘

數據分析在運營工作中無處不在,無論是活動復盤、專題報告、項目優化,還是求職面試,數據分析都有一席之地。

對于數據分析,我發現很多運營都有這樣一些困惑:

  • 不知道從哪里獲取數據;
  • 不知道用什么樣的工具;
  • 不清楚分析的方法論和框架;
  • 大部分的數據分析流于形式;

……

其實,數據分析并沒有大家想象的那么難!接觸了很多數據從業者,總結了這篇文章,希望對有志于學習數據分析的運營同學有所幫助。

一、概念:數據和數據分析

其實大家一直都在接觸數據和數據分析,但是對于兩者具體的定義又很難說清楚。我曾經做過一個調查,問一些運營同學,下面5個選項哪些屬于“數據”概念的范圍。

1

圖1:哪些屬于“數據”概念范圍

大部分人都知道把“4.報表”選上,但是很難有人會認為上面5個選項都是。其實這反映了一個很普遍的現象:很多人都會先入為主,認為數據就是各種表格、各種數字,例如excel報表、各種數據庫。其實這是一個錯誤或者說有偏差的認識,它會使得我們對數據的認識變得很狹隘。

(一)什么是數據?

數據(data)是描述事物的符號記錄,是構成信息或者知識的原始材料。這種哲學層次的定義,讓數據的范圍極大豐富,也符合目前“大數據”發展的需要。試想一下,現在很多搜索引擎做的 “圖片識別”、“音頻識別” 難道不是數據分析的一部分嗎?

作為一名互聯網企業的運營從業者,我們接觸到的數據可能沒有那么復雜,但是也有很多類別。

2

圖2:互聯網企業運營從業者可能接觸到的數據

從數據的來源來看,可以分為企業外部數據和內部數據。外部數據主要包括社會人口、宏觀經濟、新聞輿情和市場調研數據;內部數據包括用戶行為數據、服務端日志數據、CRM與交易數據。不同數據的獲取途徑、分析方法、分析目的都不經相同,不同行業、不同企業在實際分析中也都各有偏好。

那么我們常見的“信息”和“數據”有何不同?

數據是信息的載體和表現形式;信息是數據的內涵,信息加載于數據之上。以書本和知識為例,書本屬于數據概念范疇,知識屬于信息概念范疇;書本是知識的一種載體和表現形式,知識是書本的內涵和升華。

(二)什么是數據分析?

數據分析是指從數據中提取有用的信息,并指導實踐。

這里有兩個點需要注意:首先,我們需要提取的是有用的信息,而不是自嗨;其次,這些信息需要用來指導實踐,而不是流于形式。

二、思路:方法論和方法

很多新人入門數據分析的時候,要么胡子眉毛一把抓,要么無從下手。這都是缺少分析思路的表現,需要宏觀的方法論和微觀的方法來指導。

那么方法論和方法有什么區別?

方法論是從宏觀角度出發,從管理和業務的角度提出的分析框架,指導我們接下來具體分析的方向。方法是微觀的概念,是指我們在具體分析過程中使用的方法。

(一)方法論

數據分析的方法論很多,這里我給大家介紹一些常見的框架。

  • PEST分析法:從政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology)四個方面分析內外環境,適用于宏觀分析。
  • SWOT分析法:從優勢(Strength)、劣勢(Weakness)、機遇(Opportunity)、威脅(Threat)四個方面分析內外環境,適用于宏觀分析。
  • 5W2H分析法:從Why、When、Where、What、Who、How、How much 7個常見的維度分析問題。
  • 4P理論:經典營銷理論,認為產品(Product)、價格(Price)、渠道(Place)和促銷(Promote)是影響市場的重要因素。
  • AARRR:增長黑客的海盜法則,精益創業的重要框架,從獲?。ˋcquisition)、激活(Activation)、留存(Retention)、變現(Revenue)和推薦(Referral)5個環節增長。

數據分析的方法論很多,這里不能一一列舉;沒有最好的方法論,只有最合適的。下面我詳細介紹一下 AARRR 方法論,對于精益化運營、業務增長的問題,這個方法論非常契合。

3

圖3:AARRR方法論

對于互聯網產品而言,用戶具有明顯的生命周期特征,下面我以一個O2O行業的APP為例闡述一下。

首先通過各種線上、線下的渠道獲取新用戶,下載安裝APP。安裝完APP后,通過運營手段激活用戶;比如說首單免費、代金券、紅包等方式。通過一系列的運營使部分用戶留存下來,并且給企業帶營收。在這個過程中,如果用戶覺得這個產品不錯,可能推薦給身邊的人;或者通過紅包等激勵手段鼓勵分享到朋友圈等等。

需要注意的是,這5個環節并不是完全按照上面順序來的;運營可以根據業務需要靈活應用。 AARRR的五個環節都可以通過數據指標來衡量與分析,從而實現精益化運營的目的;每個環節的提升都可以有效增長業務。我們下面的分析也是圍繞這個方法論展開的。

(二)方法

根據運營工作的實際需要,在參考了 GrowingIO 陳明的文章《一名優秀的數據分析師是怎樣煉成的》基礎上,我整理了7種分析方法。借助常見的網站/APP數據分析產品,我們非??焖俚耐瓿蛇@7種分析。

1.趨勢分析

趨勢分析是最簡單、最基礎,也是最常見的數據監測與數據分析方法。通常我們在數據分析產品中建立一張數據指標的線圖或者柱狀圖,然后持續觀察,重點關注異常值。

在這個過程中,我們要選定第一關鍵指標(OMTM,One Metric That Matter),而不要被虛榮指標(vanity metrics )所迷惑。

以社交類APP為例,如果我們將下載量作為第一關鍵指標,可能就會走偏;因為用戶下載APP并不代表他使用了你的產品。在這種情況下,建議將DAU(Daily Active Users,日活躍用戶)作為第一關鍵指標,而且是啟動并且執行了某個操作的用戶才能算上去;這樣的指標才有實際意義,運營人員要核心關注這類指標。

2.多維分解

多維分解是指從業務需求出發,將指標從多個維度進行拆分;這里的維度包括但不限于瀏覽器、訪問來源、操作系統、廣告內容等等。

為什么需要進行多維拆解?有時候一個非?;\統或者最終的指標你是看不出什么問題來的,但是進行拆分之后,很多細節問題就會浮現出來。

舉個例子,某網站的跳出率是0.47、平均訪問深度是4.39、平均訪問時長是0.55分鐘。如果你要提升用戶的參與度,顯然這樣的數據會讓你無從下手;但是你對這些指標進行拆解之后就會發現很多思路。

下面展示的是一個產品在不同操作系統下的用戶參與度指標數據。

4

圖4:不同操作系統用戶的參與程度

仔細觀察的話,你會發現移動端平臺(Android、Windows Phone、IOS)的用戶參與度極差,表現在跳出率極高、訪問深度和平均訪問時長很低。這樣的話你就會發現問題,是不是我們的產品在移動端上沒有做優化導致用戶體驗不好?在這樣一個移動互聯網時代,這是非常重要的一個問題。

3.用戶分群

用戶分群主要有兩種分法:維度和行為組合。第一種根據用戶的維度進行分群,比如從地區維度分,有北京、上海、廣州、杭州等地的用戶;從用戶登錄平臺進行分群,有PC端、平板端和手機移動端用戶。第二種根據用戶行為組合進行分群,比如說每周在社區簽到3次的用戶與每周在社區簽到少于3次的用戶的區別,這個具體的我會在后面的留存分析中介紹。

4.用戶細查

正如前面所說的,用戶行為數據也是數據的一種,觀察用戶在你產品內的行為路徑是一種非常直觀的分析方法。在用戶分群的基礎上,一般抽取3-5個用戶進行細查,即可覆蓋分群用戶大部分行為規律。

我們以一個產品的注冊流程為例:

5

圖5:用戶行為軌跡

用戶經歷了如下的操作流程:【訪問官網】-【點擊注冊】-【輸入號碼】-【獲取驗證碼】。本來是非常流暢的一個環節,但是卻發現一個用戶連續點擊了3次【獲取驗證碼】然后放棄提交。這就奇怪了,用戶為什么會多次點擊驗證碼呢?

這個時候我建議您去親自體驗一下您的產品,走一遍注冊流程。你會發現,點擊【獲取驗證碼】后,經常遲遲收不到驗證碼;然后你又會不斷點擊【獲取驗證碼】,所以就出現了上面的情況。絕大多數產品都或多或少存在一些反人類的設計或者BUG,通過用戶細查可以很好地發現產品中存在的問題并且及時解決。

5.漏斗分析

漏斗是用于衡量轉化效率的工具,因為從開始到結束的模型類似一個漏斗,因而得名。

漏斗分析要注意的兩個要點:第一,不但要看總體的轉化率,還要關注轉化過程每一步的轉化率;第二,漏斗分析也需要進行多維度拆解,拆解之后可能會發現不同維度下的轉化率也有很大差異。

某企業的注冊流程采用郵箱方式,注冊轉化率一直很低,才27%;通過漏斗分析發現,主要流失在【提交驗證碼】的環節。

6

圖6:注冊轉化率

經過了解發現,郵箱驗證非常容易出現注冊郵箱收不到郵件的情況,原因包括郵件代理商被屏蔽、郵件含有敏感字被歸入垃圾郵箱、郵件送達時間過長等等。既然這么多不可控因素影響注冊轉化率,那就換一種驗證方式。換成短信驗證后,總體轉化率提升到了43%,這是非常大的一個增長。

6.留存分析

留存,顧名思義就是新用戶留下來持續使用產品的含義。衡量留存的常見指標有:次日留存率、7日留存率、30日留存率等等。我們可以從兩個方面去分析留存,一個是新用戶的留存率,另一個是產品功能的留存。

7

圖7:兩種用戶群體的留存差異

第一個案例:以社區網站為例,“每周簽到3次”的用戶留存率明顯高于“每周簽到少于3次”的用戶。簽到這一功能在無形中提升了社區的用戶的粘性和留存率,這也是很多社群或者社區主推這個功能的原因。

8

圖8:留存魔法數字

第二個案例:首次注冊微博,微博會向你推薦關注10個大V;首次注冊LinkedIn,LinkedIn會向你推薦5個同事;申請信用卡時,發卡方會說信用卡消費滿4筆即可抽取【無人機】大獎;很多社交產品規定,每周簽到5次,用戶可以獲得雙重積分或者虛擬貨幣。

在這里面“關注10個大V”、“關注5個同事”、“消費4筆”、“簽到5次”就是我想說的Magic Number,這些數字都是通過長期的數據分析或者機器學習的方式發現的。實踐證明,符合這些特征的用戶留存度是最高的;運營人員需要不斷去push,激勵用戶達到這個標準,從而提升留存率。

7.A/B測試與A/A測試

A/B測試是為了達到一個目標,采取了兩套方案,一組用戶采用A方案,一組用戶采用B方案。通過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞。 在A/B測試方面,谷歌是不遺余力地嘗試;對于搜索結果的顯示,谷歌會制定多種不同的方案(包括文案標題,字體大小,顏色等等),不斷來優化搜索結果中廣告的點擊率。

這里需要注意的一點,A/B測試之前最好有A/A測試或者類似準備。什么是A/A測試?A/A測試是評估兩個實驗組是否是處于相同的水平,這樣A/B測試才有意義。其實這和學校里面的控制變量法、實驗組與對照組、雙盲試驗本質一樣的。

三、流程:宏觀、中觀和微觀

有了具體的分析方法還不夠,運營要做好數據分析還需要一個清晰的流程。在這里我從宏觀、中觀和微觀三個層次給大家介紹一下。

(一)宏觀

1.中國古代樸素的分析哲學

其實數據分析自古有之,中國古代很多名人從事的其實就是數據分析的工作;他們的名稱可能不是數據分析師,更多的是“丞相”、“軍師”、“謀士”,如張良、管仲、蕭何、孫斌、鬼谷子、諸葛亮。

他們通過 “歷史統計”-“經驗總結”-“預測未來” 為自己的組織創造了極大的價值,這是中國古代樸素的分析哲學的重要內容。

2.精益創業的MVP理念

風靡硅谷的精益創業,它推崇MVP(最簡化可行產品)的理念,通過小步快跑的方式來不斷優化產品、增長用戶。

9

圖9:構建-衡量-優化

在運營工作中,我們要大膽嘗試,將想法轉化成產品和運營方法。然后分析其中的數據,衡量產品或者運營的效果。如果好的話保持并大力推廣,如果不好的話總結問題及時改進。在“構建-“衡量”-“學習”的不斷循環中逐漸優化,這個流程是非常適合運營工作的。

(二)中觀

《誰說菜鳥不會數據分析》書中介紹了更為具體的分析流程:1.明確分析目的和思路 →2.數據收集 →3.數據處理 →4.數據分析 →5.數據展現 →6.報告撰寫。

這個流程只是從“數據”的角度闡述了前后的流程,并未結合業務實際;而且它將數據分析的落腳點定位于“報告撰寫”是具有誤導性的,因為數據分析的最終目的是為了指導實踐,而不是寫一份報告。 但是這個流程仍具有參考價值,尤其是 “明確分析目的和思路” 對于新手入門具有一定的指導意義。

(三)微觀

下面介紹的是一個非常詳細的分析流程,借助于一定的分析工具,我們可以按照這個思路對您的網站/APP進行細致入微的分析。

10

圖10:微觀數據分析流程

這是GrowingIO商務分析師檀潤洋在《提高用戶留存,產品、市場和運營都有哪些方法》中介紹的流程,我認為適用于大部分的運營數據分析。

它的前提是用數據分析工具做好數據采集和監控工作,把精力集中在業務分析上。這個流程的核心是“MVP”的理念,“發現問題”-“設計實驗”-“分析結果”,通過數據來不斷優化產品和運營。

四、應用:體系和分析

(一)案例1:搭建數據分析體系

小張今年剛畢業,在某公司從事新媒體工作,負責微信的日常運營。小張并不清楚微信運營的核心目的,嘗試了很多方法,原創、翻譯、改寫了很多文章發布在微信上,但是閱讀量時高時低,總體一般。

經理讓小張想辦法改進一下微信運營,提高微信的粉絲數和閱讀數;但是張三毫無頭緒,無從下手。這是很多運營真實的寫照,瑣碎的工作容易讓人忘記思考,這很可能就發生在你我的身邊。

我們從數據分析的角度對這個案例進行了診斷,總結了小張存在的這些問題:

  • 不清楚自己需要關注哪些核心指標;
  • 不清楚目標用戶的特征(用戶屬性、用戶畫像等);
  • 對自己過往工作缺乏系統分析(數據采集、監測和分析)。

從業務增長的角度出發,我給小張量身定做了一套數據分析體系,配合其內容工作的開展。

第一點,內容定位。

運營需要明確知道自己的目標或者KPI,然后選擇一個核心關鍵指標(OMTM)進行監測。如果是創業公司,初期可能需要拉新,那么核心指標是注冊用戶數或者新訪問用戶數。如果是資訊媒體,注重影響力和覆蓋面,那么核心指標應該是微信閱讀數或者網頁PV。

第二點,用戶畫像。

無論是哪一種運營崗位,都需要明確知道自己的(目標)用戶是那些人?這些人都有哪些特征,他們的關注點和痛點是什么?如果你的用戶是產品經理,那么可以嘗試爬蟲抓取產品經理網站上有關的問題,然后做文本分析:這是定量層面的分析。同時,通過調查訪問和問卷調研,獲取更加深入的用戶特征信息:這是從定性層面的分析。

第三點,持續監測。

借助數據分析工具,對核心關鍵指標(OMTM)進行持續監測。對于指標異常情況,我們需要及時分析和改進。

第四點,數據分析。

統計和分析過往內容的數據,找出哪些內容、哪些標題、哪些形式、哪些渠道的效果更好,然后朝這方面不斷優化。

(二)案例2:分析業務核心指標

電子郵件營銷是現在很多企業仍在采用的營銷和運營方式,某互聯網金融企業通過EDM給新用戶(有郵件地址但是未注冊用戶)發送激活郵件。一直以來注冊轉化率維持在20%-30%之間,8月18日注冊轉化率暴跌,之后一直維持在10%左右。

11

圖11:EDM渠道注冊轉化率暴跌

這是一個非常嚴重的衰退,需要立即排查原因。EDM渠道注冊轉化率涉及到太多的因素,需要一個一個排查,數據分析師幫運營羅列了可能的原因:

  • 技術原因:ETL(數據抽取、轉化、載入)出現問題,導致后端數據沒有及時呈現在BI報表中;
  • 宏觀原因:季節性因素(節假日等),其余郵件沖擊(其余部門也給用戶發郵件稀釋了用戶的注意力);
  • 微觀原因:郵件的標題、文案、排版設計,CTA設計,注冊流程設計。

一個簡單的業務指標,會影響到它的因素可能是多種多樣的,所以我們需要對可能涉及到的因素進行精細化衡量才能不斷優化。最后發現,產品經理在注冊環節添加了『綁定信用卡』,導致注冊轉化率大幅度下降。

五、學習:業務、工具和資源

(一)業務層面

數據分析并沒有想象中的高不可及,掌握好相應的概念、思路、流程,運營都可以做好數據分析。

這里要著重強調一點,數據分析的目的是指導業務實踐;脫離實踐的數據分析、為分析而分析的數據分析都是在耍流氓。

不同于職業的數據分析師和數據科學家,運營人員做好數據分析的前提是嫻熟的業務理解。從業務的角度來說,數據不是數字,它是用戶的心聲。運營人員要從數據中發現問題,不斷優化,提升用戶體驗、為用戶創造更多的價值。

(二)工具層面

磨刀不誤砍柴工,做好數據分析工具必不可少。我匯總了下面幾種工具,運營可以結合自己的實際需要采用。

  • Excel 是最常見、最基礎的數據分析工具,Excel 里面的圖表、函數、透視表能滿足大家基本的需求。Access 是微軟 office 系列套裝的一部分,是一種小型的關系數據庫;當excel數據量很大、表格之間各種關聯、查詢、更新頻繁的時候,Access就是一種非常不錯的選擇。
  • Python是一種高級的編程語言,近年來發展很快,它可以用來做數據分析、編程或爬蟲;R語言是一種數據分析工具,在統計學中廣泛使用。目前,Python被廣泛用來編寫爬蟲程序,獲取網上的信息,這是對運營人員非常有幫助的。
  • Google Analytics、百度統計、友盟是常見的網站流量分析工具,Mixpanel、Heap、GrowingIO屬于用戶行為數據分析工具,較前者功能更加豐富、分析更細致。

(三)資源層面

運營入門數據分析,并不需要學習多么復雜的數學知識理論,更多的是將業務操作和數據分析結合起來。我這里推薦兩個網站和兩本書,希望有幫助。

  1. 數據分析網(http://www.afenxi.com/ ):覆蓋統計理論、數據分析方法、業務分析等內容。
  2. GrowingIO博客(https://blog.growingio.com/ ):GrowingIO數據分析、增長實踐等內容。
  3. 《誰說菜鳥不會數據分析》:數據分析入門知識匯總。
  4. 《精益數據分析》:從精益創業的角度,詮釋業務增長的分析方法和前言案例。

 

作者:官世強,關注內容營銷和數據分析。個人公眾號:內容運營那些事。

本文由 @官世強?原創發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 落得實處

    來自北京 回復
  2. 寫的很全面,感謝~

    來自上海 回復
  3. 寫的很好,給我了很多數據分析的思路

    來自北京 回復
  4. 很有用!

    來自浙江 回復
  5. 寫的太好了,才發現自己做了個假pm

    來自北京 回復
  6. 太厲害了,收益匪淺

    來自廣東 回復
  7. 覺得有用,謝謝分享!

    來自北京 回復
  8. 寫得很全面,還有附例說明,學習起來更深入透徹;感謝老師的分享。

    來自北京 回復
    1. 哈哈,老師不敢當啊
      我還是個孩子啊 ??

      來自北京 回復
  9. 寫的都是干貨,很好http://www.911jz.com/

    來自河北 回復
    1. 連作者名字都沒有 ??

      來自北京 回復
    2. 呀 我回去就加 ??

      來自河北 回復
    3. 加了 還特地鏈接到您的文章

      來自河北 回復
    4. ??

      來自北京 回復