用數據分析細分用戶:RFM分析

32 評論 218495 瀏覽 432 收藏 12 分鐘

通過RFM方法,我們根據用戶的屬性數據分析,對用戶進行了歸類。在推送、轉化等很多過程中,可以更加精準化,不至于出現用戶反感的情景,更重要的是,對產品轉化等商業價值也有很大的幫助。

應用背景:

在產品迭代過程中,通常需要根據用戶的屬性進行歸類,也就是通過分析數據,對用戶進行歸類,以便于在推送及轉化過程中獲得更大的收益。

分析方法:

RFM分析(Recency,Frequency,Monetary)

分析工具:

SPSS(數據分析的重量級應用,與SAS二選一)

一.RFM基礎知識

所謂探索性分析,主要是運用一些分析方法從大量的數據中發現未知且具有價值信息的過程。

常用的探索性分析方法包括:RFM分析、聚類分析、因子分析、對應分析等。

RFM的含義:

  • R(Recency):客戶最近一次交易時間的間隔。R值越大,表示客戶交易發生的日期越久,反之則表示客戶交易發生的日期越近。
  • F(Frequency):客戶在最近一段時間內交易的次數。F值越大,表示客戶交易越頻繁,反之則表示客戶交易不夠活躍。
  • M(Monetary):客戶在最近一段時間內交易的金額。M值越大,表示客戶價值越高,反之則表示客戶價值越低。

RFM分析就是根據客戶活躍程度和交易金額的貢獻,進行客戶價值細分的一種方法。

  • RS:基于最近一次交易日期計算的得分,距離當前日期越近,得分越高。例如5分制。
  • FS:基于交易頻率計算的得分,交易頻率越高,得分越高。如5分制。
  • MS:基于交易金額計算的得分,交易金額越高,得分越高。如5分制。

RFM總分值:RFM=RS*100+FS*10+MS*1

RFM分析的主要作用:

  1. 識別優質客戶。可以指定個性化的溝通和營銷服務,為更多的營銷決策提供有力支持。
  2. 能夠衡量客戶價值和客戶利潤創收能力。

RFM的假設前提:

假設交易的可能性:

  1. 最近交易過的客戶 > 最近沒有交易過的
  2. 交易頻率高的客戶 > 交易頻率低的
  3. 交易金額大的客戶 > 交易金額小的

二.分析實踐

RFM接受的數據格式有兩種:

  1. 交易數據:每次交易占用一行,關鍵變量是客戶ID、交易時間、交易金額。
  2. 客戶數據:每次交易占用一行,關鍵變量是客戶ID、交易總金額、最近交易日期、交易總次數。

我們通常采用交易數據的格式進行分析。因為交易數據可以整理成客戶數據,而客戶數據無法還原成交易數據。即用交易數據的字段可以得到客戶數據的字段,反之不行。

具體是“交易數據”還是“客戶數據”根據數據源文件的格式而定。

變量:選擇各個變量。

分箱化:評分的總分是多少。

保存:生成哪些新的變量,可以自定義名稱。

輸出:可以全部勾選,為了能全面的解讀RFM分析結果。

確定后,生成了四個新的變量:

  • 嶄新-得分:最后一次交易的時間間隔得分;
  • 頻率-得分:交易總次數得分;
  • 消費金額-得分:交易總金額得分;
  • RFM得分:RFM得分

三.結果解讀(最重要的環節)

該圖主要用來查看每個RFM匯總得分的客戶數量分布是否均勻。

我們期望均勻的分布,若不均分,則應該重新考慮RFM的適用性或嘗試另一種分箱方法(減少分箱數目或隨機分配綁定值)。

“RFM熱圖”是交易金額均值在RS和FS繪制的矩陣圖上的圖形化表示,用顏色深淺表示交易金額均值的大小,顏色越深,表示相應矩陣塊內的客戶交易金額均值越高。

如本例隨著RS和FS的分值增大,顏色越來越深,說明客戶最近一次交易時間越近、交易次數越多,其平均交易金額越高。

該圖是最后一次交易時間、交易總次數、交易總金額之間的散點圖。

通過散點圖可以清晰直觀的看到三個分析指標兩兩之間的關系,便于指標相關性評估。

本例中,交易總次數和交易總金額存在較為明顯的線性關系,而最后一次交易時間和另外兩個分析指標之間的相關性較弱。

四.RFM分析應用

為客戶分組,即將三個指標分別分為“高”和“低”兩種,高于均值的為“高”,低于均值的為“低”。

因此有三件事要做:

  1. 計算出各個指標得分的平均值;
  2. 將各個變量高于平均分的定義為“高”,低于平均分的定義為“低”;
  3. 根據三個變量“高”“低”的組合來定義客戶類型;如“高”“高”“高”為高價值客戶。

第一步,先計算各個指標的平均值。

一定要勾選平均值,否則輸出結果中沒有“平均值”。

現在我們得到了各個變量的平均分:3.33,2.99,3.01。

第二步,將各個變量高于平均分值的定義為“高”,否則為“低”。

按照1-2-3-4-5的步驟設置高于平均值的為“2”,也可以設置為“高”

同理去設置FS和MS。

設置后結果如下:

可以在變量設置里設置標簽,1代表“低”,2代表“高”,也可以在“重新編碼到不同變量”里面設置時就直接定義為“高低”,而不是“1和2”。

第三步:通過各個變量的高低組合,確定客戶類型。

第三區域:可以是公式,也可以是具體的數字,其實這里就是輸出結果。

第四區域:表示滿足的條件。

同理在“變量設置”里對標簽就行設置就行。

最終分析結果如下:

通過RFM方法,我們根據用戶的屬性數據分析,對用戶進行了歸類。在推送、轉化等很多過程中,可以更加精準化,不至于出現用戶反感的情景,更重要的是,對產品轉化等商業價值也有很大的幫助。

 

作者:膝蓋哥,是一枚“跪著提需求”的產品經理。常說“不用不用,真的不用了,我跪著就好!”

本文由 @膝蓋哥 原創發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 花椒

    回復
  2. 請問一下數字是怎么變成文字的,怎么設置,按照設置我的就不顯示呢 為什么呢

    來自北京 回復
  3. 請問資訊類工具類的用戶價值怎么辦?RFM模型還能套用么

    來自北京 回復
    1. 我也是做資訊類的,準備用這個做一個價值模型,我覺得什么都可以用吧,只要調整好一定的權重就可以了

      來自廣東 回復
    2. 自己用SPSS做了下,了解清楚了:這里說的RFM只能用于分析對應用戶在全部用戶中的水平,在對應RFM等級中賦予權重,就可以得到最終分數水平了。

      來自廣東 回復
    3. 資訊類的可以選取最近一次登錄作為R,登錄次數作為F,在線時長作為M

      回復
  4. RFM=RS*100+FS*10+MS*1 作者請問 后面100 10 1都是什么意思???

    來自浙江 回復
    1. 乘完后可以變成3位數字

      來自廣東 回復
  5. 一周年過去了,所以有人說一下這是用的什么工具嗎????

    來自河南 回復
    1. SPSS

      來自北京 回復
    2. SPSS

      來自山東 回復
    3. 你看文章的時候打瞌睡了嗎

      來自上海 回復
  6. 客戶類型的計算公式是什么?計算變量環節沒懂,大神幫幫我

    來自湖北 回復
  7. 你這個數據是從哪里拿到的呢?

    來自北京 回復
    1. 誰說菜鳥不會數據分析(SPSS工具篇)

      來自江蘇 回復
  8. 如果面對的是低頻消費的群體,需要考慮身份地位因素的話rmf模型還適用嗎?

    來自廣東 回復
  9. RS等3個得分分別為1和2,組合有8種,但值只有4個:1、2、4、8,并沒有8個數值,8種分類啊?

    來自浙江 回復
    1. 不是按照總得分分類的,具體看分項得分

      來自四川 回復
  10. 這個是什么軟件哇

    來自江蘇 回復
    1. 這是什么軟件啊?

      回復
    2. spss

      來自安徽 回復
    3. spss

      來自安徽 回復
  11. 正在下載軟件,找數據練習下。上周處理用戶數據時中提出來建一個用戶自動分層評級的系統,由于自己水平有限,畫出來的流程感覺提出來的不是特別合理,重新學習下

    來自河南 回復
  12. 我的客戶類型只能有一個值呢,要么1,要么2,就只能有一種組合顯示,這里是怎么操作的呢?

    來自重慶 回復
    1. 這么巧~我也是一個正在做rfm模型的river~ ??

      來自廣東 回復
    2. 手動按照上面那個表格分類

      來自四川 回復
  13. 軟件免費嗎

    來自上海 回復
  14. 這種分享太好了。干貨中的干貨

    來自重慶 回復
  15. 厲害了。

    來自河南 回復
  16. 希望能多一些分析方法的實操介紹,謝謝啦

    來自廣東 回復
    1. 一定一定

      回復
  17. 謝謝分享干活,大牛呀

    來自廣東 回復