別愁了,預(yù)測模型這樣做!
編輯導(dǎo)語:做運(yùn)營的同學(xué)是不是也會頭疼預(yù)測這件事?作者分享了自己的一些做預(yù)測的小技巧,期待能與你學(xué)習(xí)交流。
大家好,我是愛學(xué)習(xí)的小熊妹。
沒錯,我又加班了~大家都知道,小熊妹最怕下班的時候被別人長長的一聲“小熊妹~~”喊住。
所以,這天我在收拾包包補(bǔ)個妝的時候,領(lǐng)導(dǎo)又在背后喊我了。
這次接到的任務(wù)很簡單,兩個字:預(yù)測。???建預(yù)測模型,是件很復(fù)雜的事。
領(lǐng)導(dǎo)輕飄飄一句:“做個預(yù)測看看”。
不光搞得運(yùn)營的小伙伴們暈頭轉(zhuǎn)向,也大量擠占我的煲劇時間。必須不能忍。
因此,今天整理了快速預(yù)測的方法,只用excel就能搞掂哦。大部分日常工作的預(yù)測,都是基于連續(xù)幾個數(shù)據(jù),比如:
- 有今年1-5月銷量,問6月銷量咋樣?
- 有最近10周的新增用戶,問第11周有多少?
- 有過去30天的業(yè)績,問今天業(yè)績?nèi)绾危?/li>
這種預(yù)測有個專業(yè)名詞:時間序列預(yù)測。
小伙伴們看到這種不要慌,即使只有幾個數(shù),也是能建模的。首先要做的,是區(qū)分?jǐn)?shù)據(jù)走勢。常見的數(shù)據(jù)走勢有三種:
- 趨勢型:連續(xù)發(fā)展的態(tài)勢。
- 躺平型:變動較少,一條直線。
- 周期型:有規(guī)律的周期性波動。
直接看圖,能一眼認(rèn)出來是哪一種(如下圖)?
看個簡單的例子,某互聯(lián)網(wǎng)產(chǎn)品,2020年8月份上線,每月月底用戶量如下表。
領(lǐng)導(dǎo)希望預(yù)測2021年6月的用戶量,該如何做呢?
一、觀察形態(tài)
做出該數(shù)據(jù)的折線圖,可見這是典型的趨勢型(增長趨勢),那么就用趨勢性預(yù)測方法吧。
二、處理數(shù)據(jù)
做新的折線圖,做出該圖趨勢線。
三、選擇形狀
選擇合適的趨勢線形狀,顯示公式與R平方。
這一步是很多小伙伴們最怕的一步,因?yàn)椴欢@些模型和參數(shù)呀,做錯了咋辦。
不用怕!這種幾個數(shù)的短期預(yù)測,本來就不咋準(zhǔn)。
特別是,很多業(yè)務(wù)數(shù)據(jù),比如用戶量、銷售額,都是跟業(yè)務(wù)努力程度掛鉤的,本身就不是數(shù)據(jù)能量化預(yù)測的,所以盡管放心大膽的做。
這里只要掌握幾個基本原則就行了:
- 選取的趨勢線,和實(shí)際走勢接近(不要實(shí)際往上走,趨勢線卻往下走)。
- R平方數(shù)值盡量接近1(習(xí)慣上不小于0.6)。如上圖所示,如果是選擇多項(xiàng)還可以通過調(diào)整項(xiàng)數(shù),提高趨勢線的R平方,讓趨勢線更接近實(shí)際走勢形狀(如下圖)。
四、預(yù)測結(jié)果
把預(yù)測模型寫進(jìn)單元格,預(yù)測結(jié)果。公式出來以后,做一些小調(diào)整,直接復(fù)制出來就好了。這里選擇了多項(xiàng),參數(shù)為2的情況(如下圖)。
這里簡單解釋一下公式公式里Y就是要預(yù)測的用戶量數(shù)據(jù)(因變量),X是自變量,也就是時間,X平方就是時間*時間,對應(yīng)關(guān)系如下:
其實(shí),趨勢線擬合的原理,就是假設(shè)數(shù)據(jù)隨著時間變化而變化。因此因變量是數(shù)據(jù)指標(biāo),而自變量就是時間,以及時間的各種形態(tài),比如時間的平方、對數(shù)、指數(shù)等等。
五、預(yù)測未來情況
這里有10個數(shù)據(jù),要預(yù)測下個月的,就是第11個數(shù)據(jù),時間是11,時間平方是121,代入公式,就能算出預(yù)測值(如下圖)。
這樣就完成啦!多簡單。
勤快的小伙伴,在實(shí)驗(yàn)這個方法的時候,會發(fā)現(xiàn):很有可能好幾種趨勢線預(yù)測出來的結(jié)果,R平方都是接近1的,這時候該怎么選呢?
如果一定要糾結(jié)這個問題(我強(qiáng)烈建議你不要糾結(jié)這個,我們又不專業(yè),讓專業(yè)做算法的小哥哥糾結(jié)去)。
可以計算平均平方差(MSE),哪個方法的MSE數(shù)值小,就用哪個(如下圖)。
明顯,2次擬合的MSE值更小,就用這個啦。
到這里,就全部做完啦。多簡單。
這種趨勢擬合(又叫趨勢外推),是解決趨勢型預(yù)測的非??旖莸姆椒ā?/p>
其優(yōu)點(diǎn),包括:
- 需要的數(shù)據(jù)少,幾個數(shù)也能預(yù)測。
- 能模擬曲線走勢,不會出現(xiàn)方向性錯誤。
- 是個模型,充分滿足領(lǐng)導(dǎo)對建模的憧憬但缺點(diǎn)也是很明顯的。
領(lǐng)導(dǎo)一句話就能把它打敗:“那你所說,這預(yù)測的134萬用戶,到底是哪些渠道做出來的?”
很遺憾,完全說不了。因?yàn)槟P椭皇悄M了曲線的走勢,并不能解釋走勢是怎么來的。
用數(shù)據(jù)分析的專業(yè)術(shù)語,叫:業(yè)務(wù)可解釋程度差。這種可解釋性差,有時候會引發(fā)很嚴(yán)重的問題。
比如小伙伴們看回上一張圖,雖然2次擬合的MSE值更小,但是這個預(yù)測結(jié)果明顯有問題:本來是連續(xù)10個月上漲,這個月居然變成下跌了!
很有可能引發(fā)領(lǐng)導(dǎo)連珠炮似的問題:
- 為什么會下跌?
- 是新增少還是流失多?
- 運(yùn)營不給力還是產(chǎn)品體驗(yàn)差?
- 需要短期拉動還是長期拐點(diǎn)到了?
更加遺憾的是,模型本身更解釋不了這些。
所以聰(jiao)明(hua)的小伙伴,會果斷放棄二次擬合的結(jié)果,用線性擬合的結(jié)果。
因?yàn)檫@樣更符合領(lǐng)導(dǎo)預(yù)期(少被人噴)。
那如果領(lǐng)導(dǎo)一定要解釋到底新增的是從哪些渠道來的。該怎么辦呢?這時候可以利用杜邦分析法,對用戶量指標(biāo)做拆解(如下圖)。
拆解完以后,我們一個個去找對應(yīng)渠道負(fù)責(zé)的同學(xué)問:
- 親,這個A渠道,你們6月份還做不做?
- 親,如果做A渠道的話,你們準(zhǔn)備投多少?
- 親,A渠道過去轉(zhuǎn)化率為x%,你們準(zhǔn)備做優(yōu)化不?
問了一堆問題以后,把收集到的信息,做一張匯總表,把下個月為什么是這么多人,解釋得明明白白(如下圖)。
這就是大名鼎鼎的業(yè)務(wù)預(yù)測模型,這種預(yù)測模型的可解釋程度就高多了,可以明明白白地講清楚:
- 增長來自哪里
- 為什么增長這么多
- 如果不達(dá)標(biāo),還能做什么
但是這樣的缺點(diǎn)也是很明顯的:
- 它沒有讓人看不懂的算法,顯得不厲害
- 需要運(yùn)營的大量輸入,而運(yùn)營不見得想說話
- 即使運(yùn)營想說,也有可能在拍腦袋,很有可能拍得不準(zhǔn)所以呢,世上沒有兩全法,只能看情況做預(yù)測咯。
以上就是今天小熊妹整理的知識點(diǎn)。還差兩個:躺平型與季節(jié)型,火鍋已經(jīng)點(diǎn)好了,下次再寫。
作者:碼工小熊,微信公眾號:碼工小熊
本文由 @碼工小熊 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
兩個隨機(jī)變量的曲線最終回歸到近似直線的范圍,而這個預(yù)測公式就是這條直線的方程式,可以使用最小二乘法分析求解直線的方程式。
棒棒噠,類似好文兒可以多推,兄,優(yōu)秀