數據產品經理必備技能之分析方法

8 評論 70050 瀏覽 742 收藏 14 分鐘

本文作者將與你分享三種數據分析方法:常規分析、統計模型分析以及自建模型分析。掌握這三種分析思路,就能解決大部分分析需求,并根據分析需求固化為數據產品。

很多人覺得,做數據產品經理就沒有必要掌握數據分析相關技能了,終于可以遠離了枯燥的數據分析工作。如果真這么覺得,那么就大錯特錯了,一個好的數據產品經理,不僅要有產品sense,還要有好的分析思路,因為一個數據產品需求大部分都是由分析需求固化而來的。很多時候,數據產品和分析是分不開的,一個好的數據產品經理,要掌握常用的數據分析框架和方法,才能使做出來的數據產品讓數據分析師和業務人員使用更順手,更貼近業務。

在進行數據分析之前,一般都會先想一下分析框架和分析方法,數據分析方法一般有常規分析、統計模型分析以及自建模型分析。掌握這三種分析思路,就能解決大部分分析需求,并根據分析需求固化為數據產品。下面重點講一下這三個分析方法。

1、常規分析

其實很多公司80%的分析需求都是可以通過常規分析解決,很多分析師一般把業務相關數據從hive或者mysql中導入到excel,然后在excel中通過簡單的表格、線圖等方式來簡單直觀的分析數據。常規分析經常會用到同環比分析法和ABC分析法,即分析對比趨勢和分析占比情況。

同環比分析應用到數據產品中常見的有業務周、月、日報等,例如,拿很多互聯網公司都關注的核心指標DAU(日活躍用戶數),周報里一般都會對比DAU的周環比變化,如果上漲或者下跌的比較大的話,就要進一步查找分析業務原因。

同比:某個周期的時段與上一個周期的相同時段比較,如今年的6月比去年的月,本周的周一比上周的周一等等。同比增長率=(本期數-同期數)/同期數×100%。

環比:某個時段與其上一個時長相等的時段做比較,比如本周環比上周等等。環比增長率=(本期數-上期數)/上期數×100%。

至于ABC分析法,一般是以某一指標為對象,進行數量分析,以該指標各維度數據與總體數據的比重為依據,按照比例大小順序排列,并按照一定的比重或累計比重標準,將各組成部分分為ABC三類。舉一個通俗易懂的例子,經過長期的觀察發現:美國80%的人只掌握了20%的財產,而另外20%的人卻掌握了全國80%的財產,而且很多事情都符合該規律。于是可以應用此規律在業務上,通過合理分配時間和力量到A類-總數中的少數部分,將會得到更好的結果。當然忽視B類和C類也是危險的,但是它確實得到與A類相對少得多的注意。

舉一個比較簡單的例子,在分析支付訂單量的數據中,對各個城市的支付訂單量做ABC分析法進一步分析,如圖1所示,發現武漢、杭州、上海等地的支付訂單量占比很大,這樣就可以在運營活動中進一步關注占比比較高的城市,重點支持下這部分城市的活動推廣。

圖1 各城市支付訂單量占比情況

2、統計模型分析

當掌握了很大的數據量,希望在數據中挖掘出更多信息的時候,一般都可以應用成熟的模型進行比較深入的分析,例如,經常會面對如下的業務場景:

  1. 預測產品在未來一年內的日活用戶數會按什么趨勢發展,預估DAU;
  2. 上線了某個營銷活動,預估活動效果怎么樣,用戶參與度情況;
  3. 對現有用戶進行細分,到底哪一類用戶才是目標用戶群;
  4. 一些用戶購買了很多商品后,哪些商品同時被購買的幾率高。

針對于第一個案例,要用到回歸分析,可以理解成幾個自變量通過加減乘除或者比較復雜的運算得出因變量,例如預估DAU,因變量是DAU,和他有關的自變量有新增用戶、老用戶、老用戶留存、回流用戶等,然后根據歷史數據,通過回歸分析擬合成一個函數,這樣就可以根據未來可能的自變量,進一步得出因變量?,F在常用的回歸分析主要有線性和非線性回歸、時間序列等。

舉個簡單的例子,通過之前的業務支付訂單量要預測未來的訂單量情況作參考,在排除其他因素干擾的情況下,可以通過簡單的線性回歸根據支付訂單量的歷史值,進一步擬合出未來90的支付訂單量曲線情況,如下圖2所示。

圖2 ?線性回歸預測支付訂單量

針對第二個案列,根據以往活動的數據,分析活動的各個影響因素在滿足什么情況時才會產生我們想要的效果,并可以根據有活動時和沒有上線活動時的各項數據輸入到系統中,這個函數就會根據判斷活動效果會與哪些因素有關,目前常用的分類分析方法有:決策樹、貝葉斯、KNN、神經網絡等。

關于第三個案例,可以用聚類分析,細分市場、細分用戶群里都屬于聚類問題,這樣更方便了解用戶的具體特征,從而針對性的做一些營銷等,常見的聚類分析一般有K均值聚類、分布估計聚類等。

關于聚類分析,最常用的就是對用戶進行分類,首先,要選取聚類變量,要盡量使用對產品使用行為有影響的變量,但是還是要注意這些變量要在不同研究對象上有明顯差異,這些變量之間又不存在高度相關,例如,年齡、性別、學歷等。然后,把變量對應的數據輸入到模型中,選擇一個合適的分類數目,一般會選拐點附近的幾個類別作為分類數目,如下圖3。接下來,要觀察各類別用戶在各變量上的表現,找出不同類別用戶區別去其他用戶的重要特征,選取最明顯的幾個特征,最后進行聚類處理。

圖3 R2曲線

關于第四個案例,要用到關聯分析,在電商中的應用場景比較大,最經典的案例當屬啤酒與尿不濕的搭配銷售,常用的關聯分析有購物籃分析、屬性關聯分析等。

做關聯分析一般要理解頻繁項集和關聯規則兩個概念,頻繁項集是經常出現在一塊兒的物品的集合,關聯規則暗示兩種物品之間可能存在很強的關系。

下面用一個例子來說明這兩種概念:例如圖4,給出了某個雜貨店的交易清單。

圖4 訂單交易情況

頻繁項集是指那些經常出現在一起的商品集合,圖中的集合{葡萄酒,尿布,豆奶}就是頻繁項集的一個例子。從這個數據集中也可以找到諸如尿布->葡萄酒的關聯規則,即如果有人買了尿布,那么他很可能也會買葡萄酒。

另外,為了評估關聯分析的效果和可信性,定義了可信度或置信度這兩個概念。規則{尿布}?{啤酒}的可信度被定義為”支持度({尿布,啤酒})/支持度({尿布})”,由于{尿布,啤酒}的支持度為3/5,尿布的支持度為4/5,所以”尿布?啤酒”的可信度為3/4。這意味著對于包含”尿布”的所有記錄,我們的規則對其中75%的記錄都適用。

3、自建模型分析

當以上兩種分析方法都不能滿足業務的分析需求時,這時候就需要自建模型進行分析,例如每個公司的業務模式都不太一樣,當要分析用戶在生命周期產生的價值(LTV)時,就需要根據自己的業務模式進行自建模型分析,對于一般依靠廣告營收的公司,LTV會與用戶活躍天數和Arpu(每用戶平均收入)值有關,而Arpu值方面,每個公司都有自己的廣告營收模式,所以Arpu值細分下去都是不太一樣的。自建模型是為了滿足業務需求,將各個指標靈活自由組合,從而保證分析的有效性和針對性。

具體來看,定義LTV=平均活躍天數*Arpu值=平均活躍天數*(指標1* 參數1 + 指標2* 參數2 + 指標3 * 參數3+……),其實,處了平均活躍天數需要預測外,后面的幾個指標的值都比較明確,直接輸入固定值就可以。

平均活躍天數預測方式:

圖5 留存率曲線

圖6 DAU曲線

如上圖5和6的所示根據實際留存率和實際ArpuDau進行截斷天數內平均活躍天數預測:

(1)INPUT /每日實際留存數,OUTPUT/beta(α,β)曲線,預測哪一天就根據beta曲線返回對應值【預測非線性擬合,起始點和終點權重較大】

對beta曲線目前分為三個partition:

  • 樂觀預估:因ArpuDau持續上漲導致波動過大,輸出值過大。
  • 穩健預估:為保證輸出值穩定平滑,進行log導數限制。
  • 當前平均預估:在穩健預估無法輸出有效值時采用此預估方法,根據當前留存和Arpu值作為重點,對未來進行預估。

(2)ArpuDau根據實際情況按公式進行每日計算,一段時間后Arpu值趨于穩定。

(3)LTV公式= ∑(留存beta1*Arpu1+留存beta2*Arpu2+….+留存betak*Arpuk),可簡單理解為∑留存beta*∑ArpuDau

k值由模型調用者決定,660天LTV預估同樣可由模型調用者進行修改調整。

其實,以上的分析方法和思路,數據產品經理只需要掌握基本的20%就能解決80%的問題,剩下的20%的問題,可以交給更專業的數據分析師們去解決,當然,多學一些分析方法,對以后的數據工作還是很有幫助的。畢竟,數據產品和數據分析是分不開的,都是基于數據需求解決一定問題出發的,選擇什么方法去解決問題,還是需要具體深入到業務中去。

相關閱讀

數據產品經理必備技能之BI建設

 

本文由 @徐鵬 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pexels,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 同比跟環比說的跟找不同似的

    來自河北 回復
  2. 大家期待已久的《數據產品經理實戰訓練營》終于上線啦!

    本課程非常適合新手數據產品經理,或者想要轉崗的產品經理、數據分析師、研發、產品運營等人群。

    課程會從基礎概念,到核心技能,再通過典型數據分析平臺的實戰,幫助大家構建完整的知識體系,掌握數據產品經理的基本功。

    學完后你會掌握怎么建指標體系、指標字典,如何設計數據埋點、保證數據質量,規劃大數據分析平臺等實際工作技能~

    現在就添加空空老師(微信id:anne012520),咨詢課程詳情并領取福利優惠吧!

    來自廣東 回復
  3. 樓主文章中的圖表用的是什么工具啊

    來自天津 回復
  4. 入門選手,能加個微信不

    回復
  5. 作用不大

    來自廣東 回復
  6. hi,看到你的分享很棒,騰訊在尋找優秀的數據產品經理,求聯系,微信號:andymincao,謝謝

    回復
  7. 微信是多少啊?方便加個微信唄:2659644553

    來自廣東 回復
  8. 是嘛是嘛,會給一些福利試用BDP更多功能嘛? ??

    來自北京 回復