RFM模型的搭建細節以及適用場景有哪些?

7 評論 18470 瀏覽 58 收藏 12 分鐘

編輯導讀:RFM分析,一種將用戶分層、進而針對不同用戶群體進行精細化運營的方法。在應用RFM分析模型中,實際操作中會存在很多問題。本文作者圍繞RFM模型的搭建細節以及適用場景展開分析,希望對你有幫助。

“RFM分析,是用戶精細化運營中比較常見的分析方法了。”

今天和大家分享一下數據分析中比較常用的一個分析框架:RFM分析。該模型用的很多,說明有模型自身的優勢;但同時也存在很多的問題。今天和大家一起探討。

一、什么是RFM分析

RFM分析,其實是一種將用戶分層、進而針對不同用戶群體進行精細化運營的方法。

RFM的三個字母,分別代表了一個維度:

  • R(Recency):最近一次消費時間。反映了用戶最近消費的熱度,用以衡量用戶是否流失。理論上,最近一次消費時間越長,流失概率越高
  • F(Frequency):用戶的消費頻率。反映了用戶對于產品、品牌的忠誠程度。理論上,一定時間內的購買頻率越高,用戶忠誠度越高
  • M(Monetary):消費金額。反映了用戶的購買力。

通常來講,是針對每個維度設定一個閾值,將用戶群體劃分為二(高于閾值、低于閾值),三個維度齊下,則可以將用戶整體劃分為2^3=8個用戶細分群。如下圖:

有了用戶的細分,可以針對細分用戶進行精細化的營銷。比如針對【重要價值客戶】應該做好用戶的權益維系,針對【重要保持客戶】做好客戶的流失挽回。

關于模型的大體含義和應用價值,就簡述一二,詳細的請繼續。

二、如何進行RFM建模

RFM模型的建立,總結起來一般可以分為以下幾步。

1. 關于原始數據

從定義中我們可以看出來,R、F、M其實都是和消費相關的。因此,關于RFM模型的搭建,使用的原始數據很明確:訂單表交易表。

而且,使用的維度其實并不需要很復雜,只要有以下的維度就足夠了:

即我們只要有用戶唯一標識、消費時間、消費金額,這三個字段的明細,就可以來搭建RFM的分析模型了。

當然,對于原始數據有一些數據清洗的工作,這里就不贅述了。比如選取的是成交的訂單,而不是下單未支付的;比如選取的是排除大機構的訂單……等等。

2. 三個維度的加工計算

基于上面的原始訂單數據,下一步就是RFM三個維度的加工。這里面,有很多細節的問題。

首先,關于最近一次消費時間的計算。這個指標的定義比較明確,直接取最近一次消費的時間和當前時間做差就好。

關于消費頻率的計算,必須有時間范圍的設定。那具體是設置最近一年的消費頻率(即購買了幾次),還是最近1個月的消費頻率呢?這是有很大差別的。通常來講,這個范圍的設定和分析用戶的行業有很大關聯。比如快消品,統計用戶的幾個月的時間就夠了,但耐消品,顯然不是。統計一年的,可能用戶都沒有復購。

關于消費金額。這里和消費頻率一樣,也是要有時間范圍設定的,道理也是一樣的。確定好了時間范圍,直接做sum就行,沒有太多的疑惑。

因此參數的設定,沒有固定的標準,要多結合自己所處的行業規律。加工完是這樣的表:

3. 閾值的劃分

加工好了基礎的三個維度的統計指標,接下來就是進行劃分閾值的確定。即確定基于多大的數值,將每個維度的用戶進行分段劃分。

通常來講,每個維度只需要確定一個閾值即可,這樣可以將總體用戶劃分為8個分段。但現在還有一種套路是每個維度劃分為5段,將總體劃分為5^3共計125個分層,美其名曰【細分】。但我個人是不認可的。我覺得RFM分析的重要意義就是用戶細分的可解釋及可落地性,劃分成125個用戶群體,你該如何精細化運營呢?最終還是要進行合并。

OK,我們還是按照正常8分層來講。我們看到上面的統計聚合表了,往往分布是下圖的樣子(以R為例):

如何劃分為兩群用戶呢?這時有很多種不同的方法了。

第一種方法,采取均值的方法。我個人是不太建議用均值作為閾值的。因為現實情況經常有一些異常值,會影響均值的計算。而數據清洗的時候很難都排掉異常。

第二種方法,是采取中位數(或者其他分位數,比如20%分位)的方法。這種方法直接將排序后的用戶按照數量進行劃分,中位數可以將人群一分為均等兩份,其他分位數也可以有合理的業務解釋:20%的用戶貢獻了80%的作用,等等。

這種方法個人覺得比較簡單易行,比較推薦。

關于偏態分布(以右偏為例)下,眾數、中位數、均值有以下關系:

除了用統計量直接作為閾值外,第三種方法,也是市面上看到比較多的方法,就是打分法。

所謂的打分法,就是先將原始的R、F、M數值劃分為1~5的分數,然后求分數均值,作為劃分閾值。例如下圖:

這種方法吧,挺忙活,又是打分又是求均值的。但我個人不太建議。一方面,原本只需要計算一個閾值就好了,現在需要先劃分成5段,那這5段該怎么劃分才合理呢?其次,這種打分的意義在哪,還增加了計算復雜度。

如果是解決異常值或者分布不均的問題,用分位數的方法就好了,我并沒有太想明白市面上大行其道的打分法的意義在哪。我想到了一種可能,就是打分為了使三個維度可以在同一量綱上,進行衡量,以此可以計算一個用戶的綜合RFM得分,進行綜合得分的排名。如下圖:

如果是這樣,那我覺得,是不是用打分法就主要依賴于模型目標了。若為了劃分為8個離散的用戶層,就沒必要打分;若為了求用戶的綜合RFM得分,需要打分。除此之外,我確實想不到打分的意義了。希望大神指點。

4. 用戶分層計算

經歷了上面不同閾值劃分方法的紛爭,下面就比較順暢了,那就是用戶分層的計算。

這一步比較容易理解,直接根據定好的三個閾值,判斷每個用戶屬于哪個區間,然后打標即可。不贅述了。

5. 模型優化

所謂的模型優化,主要還是在于閾值的調整。

要隨著最終劃分的人群以及相關的運營效果、活動規律,調整閾值的設定,最終達到一個最合理的劃分。

三、RFM模型的優缺點

本文開頭也提到了,RFM模型的應用廣泛,是有很大優點的,但缺點也是不少,現在來和大家一起探討一下。

1. 模型的優點

最大的優點,應該是數據的可獲得性。

目前在互聯網中,基本對于數據的收集做的還是比較完備了,采集了用戶的各種行為數據等,可以更好的進行用戶打標簽、分層的操作。但是在傳統行業中,沒有太多的行為數據,其實能用的數據比較有限。

但是,無論公司的數據做的有多不完備,也一定是有成交數據的(除非這個公司沒收入……)。只要有成交數據,就能進行RFM的分析,這是最大的優勢。而且,基于成交數據做的RFM模型,還是比較有效的。

其次,模型的分層可解釋性強。

其他很多算法模型、機器學習模型,往往通過聚類進行用戶的分層,對于業務來講,不是很好解釋。但RFM模型分成的8個用戶類別,是非常好理解的。

2. 模型的缺點

RFM模型其實是滯后性的分析模型,只有當用戶發生了購買行為后,才能進行RFM的分析。而且模型的前提假設就是用戶的前后行為是無差別的。

另外,使用該模型需要注意的是,不同行業的應用,是有差別的。

最典型的是就是快消品和耐消品的差別。對于耐消品而言,RFM分析并不是一個很行之有效的模型。例如冰箱的購買,用戶購買一臺冰箱后可能十幾年都沒有購買了,這是沒辦法用RFM分析的。如果強搬硬套,是沒有任何意義的。

以上是今天和大家分享的內容,歡迎大家繼續關注~

 

本文由 @冬至 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 第一張圖里的一般挽留客戶的變化特點是錯的吧,應該是R低F低M低?

    來自上海 回復
  2. 打分法是不是可以用數據的標準化來解決,標準化后,數據也就是可以相加的同一維度了

    來自江蘇 回復
  3. RFM模型一般劃分2-3層級,其中R會是依據行業回購經驗、F依據中位數、M依據二八法則。

    來自上海 回復
  4. 您好,請問“耐消品”行業應該用什么模型對用戶進行分層呢?求教,盼復!

    來自北京 回復
    1. 耐消品可以在RFM基礎上進行「變種」,RFV模型(最近一次交互/登錄、交互/登錄頻次、價值預測),所以考慮到耐消品的消費者決策鏈路復雜(長)、觸點多,一般都是找大數據公司搞一套“RFV預測模型”,有機器學習的更好了。

      來自上海 回復
  5. 你好,如果按照用戶rfm值分箱劃分成125種用戶群體,那其實是不是也可以將這125種用戶群歸類為常規的8類用戶類型?在分箱后給用戶打分,打完分這一塊如何應用我理解的還不是很清晰。期待您的回答

    來自廣東 回復
    1. 打分之后,不會直接按5*5*5分成125類,一般會算個平均分,然后用分值和平均分對比,分出高和低,最終還是會回到2*2*2,一共8種分類方法;

      感覺和找到閾值,分成兩類沒本質區別(樓主也剔除類似疑問)

      來自廣東 回復