數據運營實操 | 如何運用數據分析對某個試運營項目進行“無死角”的復盤?
最近常常有小伙伴問我,大概是如下幾個問題:?我手里沒有多少數據可以供分析,怎么辦?我手上有一些數據,但是不知道該如何分析,怎么辦?我有一些數據,也知道該做哪些分析,但是不會高大上的工具,怎么辦?
對于小喵來說,上面的問題都是偽命題,很多時候,我們做數據時手里掌握的數據總比我需要的多,深入了解業務后,方法總比問題多;方法有了,工具的使用總比想象的簡單多~
好了,先看一個栗子吧,看完你就了然小喵為什么這么說咯。
一、背景
話說,某年某月,某外地零食O2O品牌,想要開拓上海市場,本著“穩扎穩打,步步為營”的“精益創業”方針,該品牌準備先在上海幾個有代表性的區域進行試運營。
選了3個區域—楊浦區、長寧區和徐匯區,在這3個區人流較大、辦公樓密集的區域重點設立了三個實體營業網點,分別位于五角場地鐵站、淞虹路地鐵站和漕河涇地鐵站附近,并以這3個地鐵站作為輻射推廣點,上下班高峰期在地鐵口附近進行DM推廣,上班期間則在附近辦公樓進行掃樓推廣(別問我推廣人員是怎么混進去的)。試運營始于七月下旬,到八月下旬正好運行一個月后,是為第一階段。此時,需要對這段時間的運營數據進行分析,修整并總結經驗,著重在以下幾個方面進行探討和研究:
- 整體的運營情況,包括總訂單情況,訂單的時段分布情況;
- 用戶的消費行為分析,主要是下單時間分布和購買力情況分析;
- 總體和各個區域的用戶價值分析,用以指導和優化接下來的運營工作。
- 對比一下這3個地方地推的效果及用戶下單情況。
由于前期技術人員太少且負責的項目過多,后臺系統過于簡陋,后臺收集到的原始數據只有下面這些:
原始數據表格
上表是這段時間內,用戶下單的信息。注意,同一個User Id可能不止一次下單,可能在不同日期、不同時間段形成多次不同金額的消費,了解這一點對于接下來的用戶價值分析至關重要。
好了,各位看官,上面那張表將是小喵接下來炒菜用的“食材”(來源于真實案例,數據會做一定處理,僅作展示數據分析方法之用),沒有其他佐料哦(大部分時間使用excel來處理數據)~這些數據看起來平淡無奇,但如果開動腦筋深挖的話,就大有玄機哦。
好了,我們的數據分析之旅即將開始咯!
二、訂單時間分布情況
在進行深入分析前,先將原始數據進行初步處理—主要是時間維度的處理。分別調用hour和weekday函數將小時“時點”和“周幾”的信息發掘出來,至于“時段”的得來,之前很多小伙伴有問過這是怎樣“設計”出來,百度上也搜不出來吶,那當然,這可是我自創的哦~現在小喵貼出一張詳情圖:
經處理得到若干時間維度數據的表格
“時段”的操作方法
如此這般,即可得到以下關于下單時間分布的信息:
試運營期間訂單量時段分布情況
那么,在這張下單時間段分布的圖中,又能看出什么苗頭呢?其實,很明顯的,下單時間只有一個“波峰“—集中在9時~13時,這段時間的小白領除了吃午飯時間是正當的下單行為,其余時間是在”開小差“~
再分析一下試運營期間總體的訂單銷售情況,將“日期”信息和“星期”信息同時顯示在橫坐標軸上,更容易發現時間上的下單規律,做成折線圖,可以看到如下的結果。
試運營期間整體訂單分布情況
從上表中,總體上可以看出,工作日的訂單多于休息日的訂單,在7-27~7-31和8-3~8-6期間出現訂單銷售高峰,這2段時間的訂單量驟然增長。究其原因,與這3個實體網點做促銷活動有很大關系,刺激了目標客戶的購買行為。
再單獨將“星期”數據“拎”出來,得到下圖:
試運營期間一周訂單分布情況
從上圖可以看出,一周的下單高峰集中在周三、周四這2天,周一和周二的訂單量也和這兩天相差無幾,但是到了周五,特別是周末(周六和周日),訂單量就陡然下降。
總的來說,周中的下單量很大,周末的訂單量很小,這與白領區的人群消費行為是一致的,無異常情況發生。
得知以上幾點信息后,在開展下一階段的運營工作時,就可以在接下來的運營工作中準備如下事宜:
趕在用戶下單高峰時期前,在營業網點安排好人員,做好部署工作,以便及時、快速的將貨品送交到用戶手中;
在用戶下單高峰期到來前一段時間,做好APP和網站的系統維護,以免因下單量大出現技術問題,影響用戶體驗;
進行下一輪的推廣工作時,可以選在周三和周四開展,這2天的用戶下單意愿更強烈。
以上關于客戶(時間上)行為的分析比較淺顯,接下來的客戶價值的分析才是“重頭戲”呢!
三、客戶價值分析
這里的客戶價值分析,小喵將用到RFM模型,其中涉及到3個重要的維度,即最近一次消費(Recency)、消費頻率(Frequency)和消費金額(Monetary)。
RFM三維度含義
關于這個模型的解釋,小喵只搬出某度百科上的關鍵性語句,想更進一步去了解這個模型的同學自己去網上搜哈~
某度百科上關于RFM模型的原理解釋
其中,各個維度的“深層次”含義是:
最近一次消費能顯示客戶能受到的可能性有多大,最近一次消費的日期距離今天越近,消費者對產品/品牌的印象就越深刻,被廣告推送召喚回來的可能性就越大;
客戶的消費頻次越高,代表客戶對品牌或產品的忠誠度越高,當然這種客戶也更有維系的價值,即使平時消費金額不多,但誰知道以后會不會有大手筆呢;
消費金額(這里指的是“累計消費金額”)表示消費者的購買力大小,消費金額越大,這種顧客就越優質,當然我們要把他們當寶貝呵護起來~
這種客戶價值分析模型雖然很好,但是存在如下幾個問題:
- 每個維度都可以分為5個級別,那么最終的結果是5*5*5=125個分類,客戶群分得太細了!每個客戶群組都要有一套針對性的方法,但這得要錢要人來做,這樣的操作太繁瑣、太反人類!
- 該模型中的F和M兩個維度存在多重共線的問題,某一段時間內的消費頻次和累計消費金額具有很強的相關性;
- 一般情況下,R值的權重是3個指標中最大的,但這種判定忽略了客戶的消費習慣和消費總量等因素,從而使最終結果的準確性受到某種程度的質疑。
針對以上問題,小喵決定對現有的RFM模型進行一些改良,并祭出“大殺器”—聚類分析,用以簡化我們的深度分析工作。
不過,在進行聚類分析之前,需要先預處理下之前的原始數據,除了保留“User ID”、“重點區塊”這兩個基本信息,還要保留及深度“析出”跟R、F、M這3個維度相關的若干指標:
從“實付金額”這個指標中,通過相關函數進行運算,可以得到“最小消費金額”、“最大消費金額”、“平均消費金額”和“累計消費金額”這4個指標;
而從“下單日期”這個指標,通過相關函數進行運算,可以得到“最初下單日期”、“最后下單日期”、“最初下單日期到今天的間隔天數”、“最近一次下單到今天間隔天數”及“累計購買頻次”這5個指標。
重要的分析指標及相關指標的“從屬關系”
其中,以上衍生指標的計算公式/方法分別為:
- “最大/最小消費金額”通過公式“=MAX/MIN(IF(原始數據!$A$1:$A$7028=Sheet1!A2,原始數據!$H$1:$H$7028))”得到;
- “最初/最后下單日期”通過公式“=MAX/MIN(IF(原始數據!$A$1:$A$7028=Sheet1!A2,原始數據!$N$1:$N$7028))”得到;
- “累計購買頻次”則由透視表得出,同一個User Id下,將任意指標進行“計數”顯示,即可得出頻次。
- “最后下單到今天間隔天數”由公式“DATEDIF(E2,TODAY(),”d”)”得到;最初下單到今天間隔天數由公式“=DATEDIF(D2,TODAY(),”d”)”得到,其中E列是最后下單日期所代表的列,D列代表最初(第一次)下單的日期的列。
值得注意的是,上述公式是在新的sheet里構建的,引用的是原始表單里的數據。且后面的間隔天數需要等最初/最后下單日期確定后才能計算出。
最小購買金額計算方法
購買頻次的計算方法
將上述指標進行計算后,得到下面的客戶信息價值表,可以作為下一步分析的原始數據。
經處理后的客戶價值信息表單
然后將該excel表單錄入SPSS系統,詳細的聚類分析方法,可以參照小喵的上一篇文章:數據運營實操 | 如何用聚類分析進行企業公眾號的內容優化。經運算后,可以得到如下新表:
聚類分析后得到的SPSS輸出數據
可以看出,上表中多了一列關于“分類”的數據,這就是SPSS軟件根據表中用戶購買信息(購買金額和購買日期等)在若干維度上的同質性和異質性劃分出的4類(由于運營喵使用的是K-means聚類法,需要人為設定分為幾類,所以在確定4類之前,需要反復測試2類、3類、5類的數據,直到能在各個分類間體現出明顯的差異性,且具有良好的集中度為止)
再用透視表處理一下,將每類數據的“值字段”顯示為“平均值項”,得到“用戶價值分類特征表“。
用戶價值分類特征表
在對上表進行分析之前,小喵需要指出的是:上述指標的重要性不是同一水平的,其中各指標的權重有大有小,重要性不一,而權重系數需要根據以往經驗和業務情況進行分配,這里僅給出小喵的判斷:
累計購買頻次的權重最大,因為多次購買行為即使平均/累計消費金額不多,但反復多次的購買行為代表用戶對品牌/產品的認可,能反映出用戶的忠誠度;
其次最近一次下單日期,隔得不太久的話,使用客戶召回策略的成功率會很高;
然后是平均消費金額,單次高消費或單次低消費都不能準確地反映出客戶在本產品上的購買力水平,取歷史平均水平才能看出他在本產品上的消費能力,但要結合最低和最高消費金額來看,看是否二者間的差距過大,穩定性如何;
最次是累計消費金額,反映客戶在某段時間內累計的消費情況,也能體現客戶對產品/品牌的持續價值。
根據上述判斷,第2類和第3類屬于較為優質的顧客,他們在購買頻次、最近一次購買時間、累計消費金額和平均消費金額上的數值水平均衡且較好,是重點需要維護的對象,以后可以對這2類用戶推送價值較高的優惠活動/信息,促進其后續的購買行為。
第1類客戶屬于“土豪級”,雖購買頻次較低,但購買金額很大,跟其他幾類客戶比起來,購買力相當彪悍,有錢可任性,但留住很困難。。。
此外,第4類的用戶數較多,是有潛力待挖掘的客戶群。這類群體的特征是平均消費金額和累計消費金額低,購買次數較少,且很久未再買產品了,召喚回的概率很小,可以對這部分客戶進行回訪,找出產品和服務方面存在的問題,做好優化,苦練內功,以便下次進行推廣的時候一次就“摁住”客戶。
綜上,第2類、第3類客戶是我們接下來重點抱大腿的目標,這是“節流”;根據第4類客戶的回訪得到改進產品和服務的建議,在接下來的運營工作中招攬新客戶,這是“開源”。
看到這里,你以為結束了?
NO,you too naive~小喵要把數據榨干,盡可能得到對運營工作有用的信息!
以下是經透視表處理后的各區3類用戶的占比情況:
各區塊3種類型客戶的分布情況
上表是各區3類客戶分布的情況,從中可以看出淞虹路的總體下單客戶量最大,其次是漕河涇,再次是五角場。
此外,由上述數據還可以得出下列概況:
使用excel中的多重判斷函數公式,將客戶的單次平均消費金額劃分為7個檔次,函數公式太反人類,小喵就不列了,大家知道原理就好。建議檔次別分太多,excel中的if嵌套貌似最多7層。。。
消費金額區間客戶數量占比表
由此得到各個消費金額區間的客戶占比情況,可以了解到試運營期間客戶的整體消費結構怎樣。表格看起來不直觀,直接轉化成下面的2個圖,上圖定量比較,下圖定性分析占比情況。
平均消費金額區間客戶數量分布
各消費金額區間客戶數量占比情況
在分析上面兩個圖前,需要指出的是,該O2O零食品牌絕大部分的單件產品的價格在3~15元之間。那么由上述圖表可以得知,絕大部分客戶下單時,購買不止一件商品,說明連帶率(連帶率是服裝行業銷售的一個指標,描述的是顧客在一次購買過程中,同時一次性買走幾件商品,它反映了商品的搭配有效性。暴露出身了,小喵是學服裝出身的)不錯呢,比如客戶買香腸的時候同時買了雞翅、可樂和薯條,說明這樣的產品的組合搭配尚可。當然,這還有很大幅度的提升空間呢~
購買頻次客戶數量分布圖
最后是購買頻次的客戶數量分布圖,能反映出用戶的忠誠度情況。其中,僅購買過一次的用戶占了大頭,看到這樣的數據,運營人員要思考,為啥這么多的客戶只買了一次呢,難道自家的東西不好吃么?所以,以后要好好研究市場,研究客戶,研究競爭對手,練好自己的內功。
四、結語
好了,運營喵這次的分享結束了,當然上面還可以使用數據地圖,將客戶的地點分布做成熱力地圖,體(geng)現(hao)專(de)業(zhuang)性(bi),以便了解整個客戶的區域分布情況,進行有效的二次重點推廣,具體操作方法請參考小喵之前的另一篇文章:運營實操|15分鐘學會數據地圖分析。
從這個例子中,小喵想說的是:當我們擁有一份原始數據時,在結合當前業務的情況下,運用自己的數據分析經驗和儲備的理論知識,盡量把這些數據“榨干”,汲取有價值、有營養的信息。如此這般,最終的數據/分析報告不僅可以作為我們匯報給領導或相關部門的資料,供他們參考,更重要的是,它能指導和優化我們后續的運營工作,為我們積累寶貴的運營經驗。
作者:蘇格蘭折耳喵,微信公眾號:運營喵是怎樣煉成的,個人微信:g18818233178),數據分析愛好者,擅長數據分析和可視化表達,喜歡研究各種跟數據相關的東東。
本文由 @蘇格蘭折耳喵 原創發布于人人都是產品經理。未經許可,禁止轉載。
想做數據但是不知道怎么做,看完這一篇文章才真正的發現每個數據每個維度都是值得思考的,提供了一點方向Thanks?(?ω?)?
確實很牛b
感謝!
滿滿的干貨,現在才發現
1.利用行為特征聚類
2.利用人口特征畫像
3.通過畫像尋找用戶,通過類別預測行為
厲害 ??
優秀的經驗分享,對于初涉數據分析領域的人來說,提供了分析方法,啟發了分析思路
??
絕對的干貨!以前總是學聚類分析,但是不知道怎么運用,現在看來知識有用武之地了~
嗯,多從業務角度出發,調動以前所學知識,學以致用,你會發現之前所學沒有一個是浪費的~