【數據分析思維】數據分析中預測分析應該怎么做?
編輯導語:在各行業各領域,只要有核心的業務指標,都要預測核心業績未來的走勢,銷售,市場營銷,運營,財務等。一方面可以對未來的發展趨勢有個大致的掌握,另一方面也可以提前規劃,設定各下屬部門的KPI,以便盡可能地完成或者超過KPI。所以,數據分析師作為公司業務的策略官,掌握正確的預測方法,無疑是非常重要的,今天就帶大家一起來看看,我們究竟怎么做預測?
01?為什么預測很重要?
每逢年末年初,除了對上一年的整體業績做復盤和總結外,老板最關心的一件事莫過于:“下一年的銷售額預測是多少?”這個問題看似很簡單,但卻讓下屬主管們撓禿了頭,因為這個預測不是拍拍腦袋就敲定,說高了,順勢就給自己挖了個坑,說低了,老板就會diss你沒有了解業務現狀。
可是預測到底該怎么做呢?看到那么復雜的數據,肯定要用很高端的工具才可以吧?Python還是SPSS呢?我都不會啊?。。?!
其實我們可以用Excel,是的,沒有聽錯,就用我們平時覺得很low的Excel就能完成那么高大上的操作,無需任何統計和編程知識,簡單妥妥拽拽,預測就完成了,下面我們就以一個實際案例開始我們的Excel的預測之旅吧!
在本文中,我們將對一家老牌的甜品店進行非常有趣的案例研究。我們有以往年月的銷售量數據,將預測2020年剩余月份的銷售量。
正如在前面所提到的,預測是數據分析師最基本的技術之一,可以幫助公司預測未來的業績趨勢和機會。大型公司和初創公司都會依賴預測來做出關鍵的決定。例如:
- 使用預測來預測產品、服務的用戶量,并在合適的時間點進行運營
- 使用預測來預測銷售并相應地計劃預算,制定KPI等
- 使用預測來預測人力成本,并因此建議未來的招聘計劃
- 其他
這些是數據分析師在實際工作中會經常遇到的預測案例。如果你打算成為一名數據分析師,一定要學會預測分析。
02??什么是預測?
什么是預測?
用最簡單的術語來說,它是在分析過去和現在的數據,進而預測未來的過程。我們主要根據時間序列數據進行定量預測。因此,在開始之前,我們先了解一些關鍵的時間序列術語。
時間序列通常是隨時間推移而收集的數據,并且取決于時間變量。例如,這里有一個每年飛行的乘客數量的時間序列數據:
時間序列數據中包含了一些重要的組成部分,我們需要將這些組成部分拆解:
- 趨勢性:趨勢是事物發展或變化的總體方向。在上面的例子中,我們看到時間序列呈增長趨勢,這意味著在飛機上飛行的乘客數量整體趨勢上是在增加。如下圖中第二張圖所示。
- 季節性:在上述時間序列中可以看到的另一個清晰的模式,就是該模式以固定的時間周期重復,我們稱為季節性。在特定時間周期內重復出現或重復的時間序列中任何可預測的變化或模式都可以說是季節性。下圖中第三張圖所示。
- 隨機性:去除趨勢性和季節性后,剩下的就是一些隨機的、無任何規律的白噪聲。下圖中第四張圖所示。
03?用Excel內置函數進行預測
內置函數介紹
我們將從Excel中可用的最簡單的函數開始:
Forecast.linear()
它通過使用現有或過去的值來預測或計算值。我們將通過自變量x值來預測y,是基于線性回歸函數進行預測。
如果數據中存在線性趨勢(即y線性依賴于x值),則此函數的效果最佳,但有一點需要注意,如果數據中存在明顯的季節性,那么該函數就不再適用了。
那么對于有季節性的數據,我們該怎么預測呢?不用擔心,Excel為我們提供了另一個強大的高級預測功能:
Forecast.ets()
此函數通過三重指數平滑方法進行此預測。這里不會深入介紹指數平滑方法,但該函數的使用需要注意一些點:
- Forecast.ets函數或三重指數平滑方法考慮了季節性
- 此方法是加權方法,越久遠的值,權重越小,也就意味著,重要性越小
- 最重要的是,時間軸必須均勻分布,否則會產生錯誤。例如,它們可以是每月數據,每日數據,年度數據等。
Forecasting.ets.seasonality()
它返回基于歷史數據檢測到的季節性周期的長度,如有的數據是5個月重復一次,那么它的周期就是5。
Forecasting.ets.confint()
它返回指定目標日期的預測值的置信區間。默認的置信區間為95%。這意味著95%的預測值將在該值的范圍內。
單純的理解這些函數可能有些費力,所以我們從一個實際案例看看怎么一步步跑起來。
使用內置函數預測
下面就是本文中最令人期待的部分了。我們有一個甜點店的數據集,它包含從2018年1月到2020年8月的每月銷售數據。我們將預測在2020年剩余月份的銷售情況,以便店主可以相應地準備庫存和工作人員。
這是示例數據:
我們將預測4個月的銷售額:9月,10月,11月,12月
需要注意的是,使用的Excel版本必須是2016以后的版本。
基于Forecast.ets函數進行預測
同時,也可以使用Forecasting.ets.seasonality和Forecasting.ets.confint檢查季節性和置信區間。
04?用Excel預測模型進行預測
在Excel 2016及更高版本中進行預測可以更加直觀和方便。我們可以直接使用預測模型執行這些步驟。
步驟1 –選擇預測表
轉到數據,然后選擇預測表:
步驟2 –選擇必要的選項
然后,您可以選擇必要的選項,例如:結束日期,置信區間,并執行更多自定義。預測表為我們提供了表格值,例如預測,下置信度值和上置信度值以及數據的圖形視圖:
拖拖拽拽,連函數都不用輸入,你已經在Excel中建立了第一個預測模型!很簡單,是不是?
我們來看一下我們的預測結果:
通過查看我們的數據,我們注意到通常在十一月和附近月份會出現高峰,這可能是由于節日的原因。
受新冠疫情的影響,到4月和5月,這家商店的收益為零!太難了!在接下來的7月和8月,銷售量有所回升。
我們的預測表明,這種趨勢將在9月份繼續增長?,F在,商店可以查看未來幾個月的預測數據以準備庫存。他們還可以查看置信度,并了解波動的情況。
05 總結
預測很復雜,因為預測涉及到很多業務。預測又很重要,因為它關乎后續業績的發展和政策的制定,同時,預測也很簡單,簡單到用Excel拖拉拽就能輕易實現。本文介紹了用Excel進行預測分析的具體方法,希望這種簡單易操作的方法能夠幫助到大家。
以上就是數據分析思維—預測分析部分的內容,部分數據分析思維請翻看歷史文章,更多數據分析思維的文章持續更新中,敬請期待,如果覺得不錯,也歡迎分享、點贊哈~
本文由 @數據分析星球 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Pexels,基于CC0協議
- 目前還沒評論,等你發揮!