九大數據分析方法之:周期性分析法
編輯導讀:做數據分析,有常用的九種方法,這是每一個數據分析師都必須掌握的基礎知識。本文主要分析周期性分析法,它是新人們避免犯小白錯誤的最好方法,一起來看看吧。
大家好,我是愛學習的小xiong熊妹。
有小伙伴問:能不能系統介紹下數據分析方法。今天它來啦!數據分析常用的方法有九種,今天先介紹第一種,操作上最簡單的:周期性分析法。它是新人們避免犯小白錯誤的最好方法。
做數據的新人最容易犯啥錯?當然是一張嘴就被大家笑話:連這個常識都沒有!
所謂的常識,很大一部分是周期性變化:到了這個時間,就會出這種事。周期性分析,主要是從日常雜亂的數據中,發現會周期性出現的規律,從而避免上述問題。常見的周期包括兩種:自然周期/生命周期。
所謂自然周期,是指業務指標隨著時間自然發生波動,比如上邊吐槽的“2月份業績自然少”,這是因為2月份過年,大家都放假了,業績肯定少呀。
類似地:
- 吃喝玩樂類的消費,一般周六、周日比較多,這時候才有空出來玩。
- 企業間交易,一般工作日高,周末很低。大家都放假了誰還辦公呀。
- 雪糕冰棍冰淇淋類商品,一般夏季是旺季,冬季是淡季
- 帽子手套暖手寶類商品,一般冬季是旺季,夏季是淡季
這些是比較直觀的例子。需要注意的是,所謂的自然周期,對不同業務而言是不一樣的,切不可混為一談哦。
但是很多時候,自然周期表現并不直觀,隱藏在日常起起伏伏的數據里。這時候就需要我們手動發現周期規律。比如比如一個公眾號的閱讀人數走勢,可能如下圖
一眼看過去,是不是彎彎曲曲,毫無規律可言?
這就需要手動做區分。為了更好的區分,一般取6個月的,每日的數據。因為六個月的時間,一般能涵蓋2個季度,能觀察出季節性變化。
同時,每日數據,能觀察出每周是否有規律和每月是否有規律。不過上邊例子只給個2個月的數據,那就湊合著用。
從上例蜿蜒起伏的波折里可以直接看出:沒有明顯的月規律。一般有月規律的數據會如下圖所示(如下圖)因此可以進一步觀察,是否有周規律。
想看周規律,需要把數據做一下處理(如下圖),把6個完整周的數據,從周一到周日對齊。之后做折線圖,更容易觀察出周規律。
處理過以后,可以看出:卻有周規律變化,表現為:周一至周六逐步降低,周日反彈。如果把每周一到周日的數據做平均數,就能畫出周規律曲線(如下圖)
這里有很多明顯不符合走勢的點。這很正常,因為公眾號發文也是有分類的,如果是賣東西的文章閱讀就很低,派福利、抽獎類的閱讀就高一點,搞標題黨的《震驚!》《大廠!》《字jie!》的閱讀就很高。所以除了日期,也和文章類型有關。
周期性分析,主要目的是做出一個參考曲線,為進一步判斷提供依據。進而避免:“為啥周六閱讀那么低呀!”這種低級小白問題。之后再結合內容標簽,做進一步的分析。
比如上例中,第三周周一、周二是明顯異常點。如果沒有做標簽,就會直接報警:“本周連續2天異常!請注意!”但是做了標簽,如果發現周一發了賣貨文(原本就該低)周二則是標題黨(原本就該高)則不需要大驚小怪了。
還有一種周期是生命周期走勢。比如一個活動上線,剛上線的時候肯定參與人很多,之后感興趣的都參與過了,不感興趣的都不參與了,因此人越來越少。這樣就會出現如下圖的走勢。
注意:要發現生命周期走勢,統計數據,是從一個業務開始的時候進行統計的,之后往后數:第1天/第2天/第3天……或者第1個月/第2個月/第3個月
生命周期走勢有很多經典的運用。比如一款新商品上市,其銷量和上市時間,經常有如下關系,因此被稱為“商品生命周期”。類似的,還有“APP生命周期”“用戶生命周期”的說法,都是一個時間軸+指標走勢組合出來的。后續有機會再跟小伙伴們一一分享。
以上就是今天的分享。周期性分析看起來很簡單,因為它主要是用來做參考線的,為后續各種分析方法鋪路。很多復雜的分析,比如數據監控模型、數據預警模型、數據驅動決策,也是以周期性曲線為參照,所以小伙伴們先掌握基礎方法,再循序漸進哦。今天的分享就到這里,謝謝大家。
作者:碼工小熊,微信公眾號:碼工小熊
本文由 @碼工小熊 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
- 目前還沒評論,等你發揮!