不會算法只用EXCEL如何構(gòu)建RFM會員價值模型

7 評論 7761 瀏覽 59 收藏 19 分鐘

編輯導語:RFM模型是與用戶價值相關的常見模型之一。那么,RFM模型具體應該如何應用?如果非專業(yè)數(shù)據(jù)師,又該如何利用常見工具Excel來計算RFM值、得出有效數(shù)據(jù)呢?本文作者就介紹了用Excel來構(gòu)建RFM模型的方法,讓我們來看一下。

一、引言

如果你聽過客戶關系管理(CRM),那么你大概率上也曾聽到過RFM模型。在精細化運營的今天,在解決如何更好的挖掘用戶價值之前,首先要解決的問題是如何衡量用戶價值?

和用戶價值有關的模型非常多,除了RFM模型之外,還有客戶生命周期價值模型(CLV模型)、客戶生命周期模型(AARRR模型)等。不同的模型切入的角度以及具體的應用不同,我們今天主要講的是RFM模型。

本文主要分為兩個部分:一是理論部分,簡單告訴大家RFM模型是什么?能夠給生意帶來什么幫助?二是計算部分,如何只用EXCEL就可以計算RFM值并得出用戶分層數(shù)據(jù)。

二、理論部分

1. RFM模型有什么用?

舉例來說:某品牌經(jīng)過10年的運營,擁有了500萬的注冊會員,這個數(shù)字是明確且可統(tǒng)計的。在這500萬的注冊會員中有400萬的注冊會員產(chǎn)生過購買行為。那么這400萬產(chǎn)生過購買行為的會員中,有多少會員是品牌的忠誠用戶?有多少會員已經(jīng)流失?又有多少會員即將流失?

針對這些不同類型的用戶,如何才能實現(xiàn)快速獲取并快速定制運營方案?甚至可以直接設置自動化精準定向營銷呢?

RFM模型可以給你解答這一系列的問題,只有掌握了品牌會員的不同分類以及價值,才能夠有針對性地設計運營活動,從而提高最終的成交轉(zhuǎn)化。

2. 什么是RFM模型?

根據(jù)美國數(shù)據(jù)庫營銷研究所Arthur Hughes教授的研究表明,在客戶的數(shù)據(jù)庫中有三個要素,這三個要素構(gòu)成了分析用戶價值的重要指標:

  1. R (Recency) : 最近一次交易時間間隔;
  2. F(Frequency) : 消費頻率;
  3. M(Monetary): 消費金額。

RFM模型即是這三個單詞的首字母組合。

R (Recency) : 最近一次交易時間間隔,指的是消費者最后一次成交距統(tǒng)計時間的間隔。

例如消費者最后一次的交易時間是2021年3月6日,統(tǒng)計時間是2021年4月6號,那么間隔時間R=30天,即消費者最后一次成交發(fā)生的時間距統(tǒng)計時間的間隔是30天。

F(Frequency) : 消費頻率,指的是在統(tǒng)計時間段內(nèi),消費者的消費次數(shù)。

例如統(tǒng)計時間是2021年的1月到3月,消費者在這期間一共消費了5次,那么正常情況下F=5。

有人可能會問:如果這5次消費行為中,有兩次消費行為(兩筆訂單)發(fā)生在很短的時間內(nèi),例如10分鐘以內(nèi),那么F=5還是F=4更合理呢?

筆者認為這需要根據(jù)公司的具體業(yè)務形態(tài)擬定。我們在定義F值的時候之所以會有這樣的顧慮是因為通常情況下,我們把消費者在很短時間內(nèi)多次下單的行為看做是一次消費行為,消費者拆單可能是為了湊滿減滿贈等。

回到問題的本源:我們統(tǒng)計F這個指標主要是為了衡量消費者的活躍性,哪種方式更能夠代表行業(yè)特征或公司業(yè)務形態(tài)就采用哪種方式。當然業(yè)務特殊(例如生鮮外賣)或是為了統(tǒng)計方便,也可以直接把F=消費次數(shù),不考慮消費時間間隔極短的情況。

M(Monetary): 消費金額,指的是在統(tǒng)計時間段內(nèi),消費者的累計消費金額。

在其他條件相同的情況下,R/F/M值具備如下特征:

  • R值越小,用戶價值越高,1年前在本店消費過的用戶,價值肯定沒有1天前在本店消費過的客戶價值高。
  • F值越大,用戶越活躍且忠誠,也就是說經(jīng)常購買的用戶肯定比偶爾購買的用戶價值要高。
  • M值越大,用戶價值越高。M值體現(xiàn)的是用戶的購買力,購買力越高的用戶價值自然也越大。

我們基于RFM三個值,可以構(gòu)建出一個三維的坐標體系,把用戶分成8個層級,如下圖所示:

用表格的形式展現(xiàn)更便于理解:

整理成這樣的形式就比較好理解了,我們把所有的用戶,從RFM三個維度切分成了8種不同的類型。

3. RFM模型的應用場景

簡單舉幾個例子來說明不同類型的用戶,運營策略的不同。

1)針對【重要價值客戶】

即RFM值均高的用戶,我們通常稱之為“至尊用戶”,也是整個品牌用戶群體中金字塔頂端的那一撥人,購買頻率高,金額貢獻高,而且頻繁光顧店鋪。

針對這波用戶,運營的主要策略是:保持穩(wěn)定增長,“至尊用戶”的數(shù)量不要出現(xiàn)流失,并且能夠不斷從下層用戶中往上輸送新的“至尊用戶”。很多公司都會針對這波用戶出具一些特殊的權(quán)益,例如專屬服務或“專屬生日禮盒”等。

2)針對【重要挽留用戶】

即很久沒有進行復購,但之前的購物金額以及購物頻率都很高的用戶,如果放任不管,這波用戶很可能隨著時間的流逝而流失。

運營的主要策略是復購,可通過發(fā)放專屬權(quán)益、針對性折扣、贈品等一系列的定向優(yōu)惠形式使得這波用戶重新光臨店鋪,對比拉新的成本,重新讓這波用戶再次回購的成本要低的多了。

3)針對【一般價值客戶】

即RF值高但是M值小的用戶,比較活躍但是成交金額比較低的用戶。一般這類用戶我們會稱之為活躍用戶,而且價格敏感型居多。

運營的主要策略是針對這波用戶提高他們的客單價,可以通過定向搭配購、加錢換購等形式不斷提高該波用戶的客單價,商品購物籃推薦也是非常有用的。

這些運營策略僅供拋磚引玉,不同公司業(yè)務模式不同,因此在定義【用戶等級】以及主要的運營策略過程中,需要根據(jù)業(yè)務的實際情況進行擬定,不可直接照搬。

三、如何構(gòu)建RFM模型?

“道理我懂了,關鍵是怎么落地呢?”作為一名運營,尤其是公司有專業(yè)的數(shù)據(jù)分析團隊以及CRM團隊的運營來說,一般情況下,知道用戶分層定義的邏輯就可以了。

日常工作中,運營做的更多的是,知道本公司的用戶是如何分類的,每一種類型的定義是什么?針對不同的人群應該出具何種運營策略,這些運營策略實施的效果如何?并且如何不斷優(yōu)化運營策略……更多的重心是放在數(shù)據(jù)的應用上,對于模型的構(gòu)建以及算法的應用,知道的不多。

而且通常情況下,一家公司的會員模型構(gòu)建完成后,在相當長的一段時間內(nèi)不會有任何的調(diào)整(除非業(yè)務模式發(fā)生變化)。

那么問題來了。

公司規(guī)模比較小或者項目初期,公司沒有CRM部門、沒有數(shù)據(jù)分析部門,很多工作需要運營去張羅的時候,如何能夠利用RFM模型對現(xiàn)有人群做分層管理呢?

不懂算法、不會Python、不會SQL、統(tǒng)計學也不太好的情況下,只是利用Excel,如何能夠把手頭上已有的用戶人群來進行分層打標簽呢?

這里和大家分享兩種只用EXCEL就可以計算的方法。

1. 數(shù)據(jù)源準備

在開始之前我們需要準備好分析用的源始數(shù)據(jù) 。

我們能夠方便獲得的是店鋪在一定時間內(nèi)的交易數(shù)據(jù),包含:用戶名、訂單編號、訂單金額、訂單時間等字段的數(shù)據(jù)。我們利用交易數(shù)據(jù)可以提取到我們需要的RFM數(shù)據(jù),利用簡單的IF函數(shù)和數(shù)據(jù)透視表就可以實現(xiàn)了。

因為Excel表格太大拖不動的緣故,我選擇了網(wǎng)站2018年-2020年,2年的交易數(shù)據(jù),對他們進行處理后得到如下數(shù)據(jù):

對會員ID做了模糊化處理,一共得到19萬條的用戶數(shù)據(jù),分別知道每一個會員的RFM對應的值是多少。

2. 數(shù)據(jù)計算方法

在我們知道每一名用戶對應的R/F/M值以后,我們需要知道RFM三個數(shù)值分別是多少才算是高 or 低?

1)方法一:四分位數(shù)法

① 四分位數(shù)理論

四分位數(shù)是統(tǒng)計學分位數(shù)中的一種,把所有數(shù)值從低到高(或者從高到底)排列并分成四等份,處于三個分割點位置的數(shù)值就是四分位數(shù)。

一般表示為:

  • Q1:樣本排列中處于25%位置的數(shù)字;
  • Q2:又稱為中位數(shù),指的是樣本排列中處于50%位置,即中間位置的數(shù)據(jù);
  • Q3:樣本排列中處于75%位置的數(shù)字。

假設樣本數(shù)據(jù)項數(shù)一共是N:

  • 則Q1的位置數(shù)值=(N+1)/4;
  • Q2的位置數(shù)值=(N+1)/2;
  • Q3的位置數(shù)值=3(N+1)/4。

如果(N+1)恰好是4的倍數(shù),則確定四分位數(shù)比較簡單,如果不是4的倍數(shù),相關位置的四分位數(shù)就應該是相鄰兩個數(shù)值的標志值的平均數(shù)。

權(quán)數(shù)的大小取決于兩個數(shù)值距離的遠近,距離越近權(quán)數(shù)越大,距離越遠,權(quán)數(shù)越小,權(quán)數(shù)之和等于1。

例如一組樣本數(shù)據(jù)如下所示:

N=10,則Q1的位置=11/4=2.75(12和196兩個數(shù)值);Q2的位置=5.5;Q3的位置=8.25。

則有:

  • Q1=0.25*第2項+0.75*第3項=0.25*12+0.75*196=150;
  • Q2=0.5*第5項+0.5*第6項=0.5*204+0.5*211=207.5;
  • Q3=0.75*第8項+0.25*第9項=0.75*234+0.25*261=240.75。

在對應到RFM值的時候,我們可以定義為50%位置以下的數(shù)據(jù)值為【低】,即小于207.5的數(shù)值為低,50%位置以上的數(shù)據(jù)值為【高】,即大于207.5的數(shù)值為高。

也可以定義為75%位置以下的數(shù)據(jù)值為【低】,即小于240.75的數(shù)值為低,75%位置以上的數(shù)據(jù)值為【高】,即大于240.75的數(shù)值為高。

筆者的一般做法是:這兩種劃分位置都算一下,最后看結(jié)果,根據(jù)二八原則來確定選擇哪一種高低分類更合理。

② 四分位數(shù)的應用

筆者直接按照“75%位置以下的數(shù)據(jù)值算低,75%以上的數(shù)據(jù)值算高”的方式來分別計算RFM三個數(shù)值的高低。

先算【R】值,因為R值越小越好,所以R值我們這邊先按【倒序】排列,如此可得:

  • N=1096,Q3的位置=3(N+1)/4=822.75;
  • Q3=0.75*第822項+0.25*第823項=0.75*274+0.25*273=273.75。

所以,R值≥273.75的值定性為低,R值<273.75的值定性為高,即距離統(tǒng)計時間越短的用戶,價值越高。

計算【F】值:

  • N=158,Q3的位置=3(N+1)/4=119.25;
  • Q3=0.75*第119項+0.25*第120項=0.75*129+0.25*131=129.5。

所以,F(xiàn)值≥129.5的值定性為高,F(xiàn)值<129.5的值定性為低。

計算【M】值:

N=26387,Q3的位置=3(N+1)/4=19791,恰好是4的倍數(shù),故Q3=第19791項=2018。所以M值≥2018的值定性為高,M值<2018的值定性為低。

三個數(shù)值都計算好之后,整理如下:

如此,我們通過簡單的IF函數(shù)就可以計算出每一名用戶R值的屬性了,如下圖所示:

按照相同的方式為F值和M值作出高低定義,結(jié)果如下:

然后我們根據(jù)如下表格,對所有的用戶進行分層:

就可以得到各個用戶的標簽了,如下圖所示:

2)方法二:評分法

評分法就是先將RFM的價值按照從低到高劃分為1-5分,然后對每一個RFM的值進行打分,這樣每一個RFM值都在1-5分之間,然后分再分別算出RFM三個數(shù)值各自的平均值,高于平均值的定性為“高”,反之定性為“低”。

我們用同樣的一組數(shù)據(jù)來實操給大家看一下。

我們先給RFM三個數(shù)值進行打分,結(jié)合業(yè)務的具體特點,筆者做出如下定義:

有人會問了,我怎么知道小于90天的就是5分呢?

這里推薦三種方式:

  1. 經(jīng)驗法,根據(jù)自己對業(yè)務所積累的經(jīng)驗來進行劃分,當然也可以參考行業(yè)的常規(guī)定義;
  2. 將數(shù)據(jù)進行5等分,分成5個區(qū)間塊,每一個區(qū)間范圍分別從高到低進行打分;
  3. 有點復雜,舉例來說:要算F值的劃分,可以利用數(shù)據(jù)透視知道不同的購買次數(shù)對應的會員人數(shù)是多少?然后對購買次數(shù)進行分組,看會員數(shù)的占比情況,不斷調(diào)整分組步長來進行劃分。也就是說統(tǒng)計歷史數(shù)據(jù),看F值對應的會員人數(shù)占比分別是多少(F=2的在歷史數(shù)據(jù)中的會員人數(shù)占比)?掌握F的數(shù)據(jù)分布情況后再進行打分。

根據(jù)上表,我們對RFM三個數(shù)值分別進行打分,同樣用的是IF公式,我們將會得到如下表格:

然后分別算出R值的平均值是1.78,F(xiàn)值的平均值是1.41,M值的平均值是1.96。

如果某一用戶的R值大于整列的平均值,則定性為“高”,如果低于平均值,則定性為“低”,如下圖所示:

之后的步驟就同方式一所介紹的一樣了,根據(jù)RFM值高低的不同,將所有的用戶分成8個類型即可。

這里介紹的兩種方法是只要通過EXCEL的形式就可以計算出來的,針對規(guī)模較小,或者是沒有數(shù)據(jù)分析部的公司。

而一般情況下,構(gòu)建RFM模型常用的是K-means聚類算法來進行人群RFM值的定義與劃分,但是K-means對于運營人員來說有些吃力了,多是數(shù)據(jù)分析工程師具備的技能了。

還是那句老話,運營通常情況下,會用就可以了,當然如果能知道這個模型的計算邏輯就更好了。

分享結(jié)束,歡迎交流~~~

 

本文由 @Trinity 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 你好,四分位計算那里不太懂,Q3=0.75*第822項+0.25*第823項,為啥是0.75和0.25呢?

    來自中國 回復
  2. “看F值對應的會員人數(shù)占比分別是多少(F=2的在歷史數(shù)據(jù)中的會員人數(shù)占比)?掌握F的數(shù)據(jù)分布情況后再進行打分。” 這里能否再講講,知道了F的數(shù)據(jù)分布,在打分時應該按照什么方法打分呢? 非常感謝(*^▽^*)!

    來自北京 回復
  3. 供應商關系管理 又有什么 用戶價值模型可以參考。有研究嘛

    來自廣東 回復
    1. 自己的工作沒有涉及到供應商管理,所以完全沒有研究呢,抱歉~~

      來自上海 回復
  4. 感謝lz,請教個問題:四分位數(shù)法里的rfm各自的樣本量n為啥不一樣呢?

    回復
    1. 我是去重來統(tǒng)計的,例如一組R值可能是:1,1,1,1,2,3,3,6,30,60這樣,然后我對于重復的數(shù)值是做了去重處理的,看的是每一個RFM去重之后的值的分布情況;因為如果不去重的話,劃分出來的區(qū)間數(shù)據(jù)會大量向重復數(shù)值傾斜,尤其是M值。不知道這樣文字表述是否能明白?

      來自上海 回復
    2. 理解了!感謝lz分享,受益匪淺!

      來自北京 回復