分析如烹飪:讓我們一起做數據大廚吧!
?編輯導語:數據分析是有組織有目的地收集數據、分析數據,使之成為信息的過程,整個過程比較復雜且繁瑣。本文作者巧妙地把數據分析的步驟類比為烹飪的每一步,以烹飪的形式來為大家講解一份數據分析報告。感興趣的朋友來看看吧。
還記得,指引我數據分析入門的那本書,它將數據分析的步驟類比為烹飪的每一步,形象而生動,讓我印象深刻。
選擇數據分析,是基于自己所在的行業以及自己與職業發展的契合度,一路走來,踩過很多坑,但也收獲很多成功的喜悅,感謝遇見的每一位天使!
下面就請讓我以烹飪的形式來帶你做一份數據分析報告吧!
一、分析背景&數據來源(備料)
阿里作為國內電商巨頭之一,其在快速發展的同時也面臨著諸多殘酷的競爭。
電商平臺作為一個復雜的生態系統,上有不斷入駐的品牌商家,下有體量龐大的消費群體,身為銜接者,平臺肩挑重任并砥礪前行。
母嬰大類是平臺的重點類目,具有消費者和使用者分離和購買決策周期長等特點,本次分析以阿里母嬰大類的數據為主,通過SWOT分析確定本次分析背景,具體見下:
基于如上SWOT分析,我們需要進一步用數據來論證平臺母嬰發展的現狀及其機遇,洞察機遇后該如何抓住風口。
數據來源:阿里巴巴天池
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
包含2張報表:產品信息表和消費者信息表
報表的具體字段如下圖所示:
- 了解每一列的含義
- 數據分類,分為3大類:用戶、行為和產品
用戶數據:用戶id、出生日期、性別;
行為數據:用戶id、購買數量、購買時間;
產品數據:物品編號、一級分類、二級分類、商品屬性。
二、分析目的
通過分析2012年7月至2015年2月的母嬰產品用戶數據,能夠洞察母嬰大類發展現狀,找到現狀背后的原因,為平臺2015年的進一步發展提出有效建議。
三、分析思路
首先,分析手頭2張報表:
- 根據報表的字段含義和記錄行數可以看出”產品信息表”是主表,”用戶信息表”是副表;
- 從整體與部分來看,”用戶信息表”中的用戶ID是”產品信息表”中用戶ID的部分,側面說明用戶信息表是一個小的樣本集。
因此,本文的分析側重點在于”產品信息表”,”用戶信息表”可以起佐證作用。
其次,觀察”產品信息表”的統計周期起于2012年7月至2015年2月,以自然年作為篩選條件,12年和15年因數據信息不全,所以重點分析年份鎖定13年和14年。
再次,進一步查看”產品信息表”的各個字段,可發現核心字段是【購買數量】,由此可衍生出系列指標:年成交量和年成交量增速。
綜上,在分析的時間段和核心指標確立后,可以針對【購買數量】提出如下問題:
- 2013年和2014年的年成交量是多少?
- 對比2013年,2014年的年成交量增速是多少?
通過初步數據驗證,得出如下圖:
最后,明確問題:
通過觀察產品信息表的2012年7月至2015年2月的母嬰大類銷售數據,可發現與2013年相比,2014年年成交量增速達到49%,那么14年增長的原因有哪些?
如果15年要持續增長,需從在哪些方面進一步提升?
?由此,形成分析思路腦圖,見如下:
四、分析內容(切配+烹飪+打荷)
根據年成交量=成交用戶數*人均成交量這個公式,對公式的組成元素進行一步步拆解。
提出假設1:人均成交量的提升帶動14年整體的成交量。
收集證據:下圖是13年和14年的人均成交量隨時間變化的折線圖。
得出結論:從圖表可以看出,13和14年的人均成交量相減差值為0.05,幾乎可以忽略不計,所以人均成交量提升帶動年成交量的假設不成立。
提出假設2:成交用戶數的提升帶動14年整體的成交量。
收集證據:下圖是13年和14年的成交用戶數的柱形圖。
得出結論:從圖表可以看出,14年的成交用戶數的增速和14年的年成交量的增速趨勢相近,由此可以得出14年年成交量的提升來源于成交用戶數的增加,該假設成立。
緊接結論,進一步分析【成交用戶數】的組成部分,即成交單筆用戶數和成交復購用戶數。
因數據統計周期并不完整,為嚴謹起見,故本文沒有將單筆用戶數簡單定義為新客。通過數據整理,得出下圖:
綜上,14年年成交總量的上升源于成交用戶數中單筆成交用戶數的貢獻。
由此引出,單筆用戶數增長的原因有哪些?
?提出假設1:平臺提供的活動促銷力度吸引大批具有折扣心智的用戶,并促使其轉化
收集證據:活動檔期可以通過月成交用戶數的波動趨勢來挖掘,從而進一步鎖定突出點的5月和11月,對比分析2年在相同月份上類似活動的成交用戶數的差異是否明顯。
得出結論:活動對用戶的吸引力確實很強,比如上圖14年雙十一當天的用戶數接近13年的2倍,也可以從側面說明,具有活動心智的人群更容易在活動中被平臺轉化。
如有2013年和2014年的具體活動檔期的話,可以進一步論證假設成立。
提出假設2:平臺提供的產品種類更豐富,不斷上新能夠吸引大批用戶,并促使其轉化。
收集證據:下面2圖基于產品信息表中的產品ID這一字段進行分類統計對比,以確定平臺對產品種類的擴充或迭代更新是否能吸引到有此需求的用戶人群。
14年成交種類數量=13年與14年共有產品種類+14新增成交種類
得出結論:產品種類的豐富能體現平臺運營能力的強弱,滿足更多用戶的需求是用戶數池子蓄水的必要條件。通過數據驗證,假設成立,因分析數據時間段集中于13和14年,所以結論還需后續更多數據集進行驗證。
緊接產品豐富度的結論,下圖是對產品豐富度的進一步拆分,見如下圖:
即將如何提升產品的豐富度拆解為如下2個問題:
- 如何將產品系列做精?
- 如何將產品帶做寬?
無論是二級大類數量的不斷擴充還是同一類別下子產品數量的增多,兩者都有利于擴充平臺產品的豐富度,那么如果平臺在現有資源下只能優先選擇一個方向的話,那么哪一個方向效果更佳呢?采用相關性分析,見下:
1. 產品水平方向擴充(一級類目下二級類目數量增加)
2. 產品垂直體系擴充(同一類別下產品數量增多)
綜上,相關系數對比顯示,擴充產品垂直體系對于吸引更多用戶數,促進其轉化更為有效。
另外,由上述散點圖觀察可以發現存在部分異常值,如下圖:
分析可發現,異常值與成交總量中存在批發訂單相關,即存在小部分購買數量超過10件以上的單筆訂單,具體占比見如下:
根據如上分析,可以明確”人”是一個關鍵要素,那么針對如何獲取更多的“人”,作為平臺方,2015年的持續增長動力來源于哪些方面?
接下來,我開始重點分析開篇說的副表:用戶信息表,通過拆解如何獲取更精準的人這個問題,可以產生如下子問題:
消費主力軍是誰?
消費能力怎么樣?
不同性別和年齡段對一級類目的傾向如何?
五、結論
對產品信息表分析,可得出如下結論:
14年年成交量增幅達到49%,其指標上升源于用戶人數增加,對用戶人數進一步分析可發現平臺具有拉新能力強,復購率低的顯著特征;
因現有數據報表較少,不足以論證復購率低的原因,根據人均銷量可猜測復購率與平臺銷售商品相關,比如商品十分耐用,或者在使用上更趨向于一次性;
拉新能力強體現在單筆成交用戶占比99%+,通過對單筆用戶數的購買行為數據分析,可發現受活動吸引力度和產品豐富度的有效影響;
具體分析13和14年的活動特征顯著月份,以5月和11月的2個活動高峰點為佐證,發現用戶數在14年活動當天的成交人數遠遠高于13年同時間段,甚至達到翻倍的效果,可見具有聚劃算等活動心智的用戶更容易被平臺獲取轉化;
產品豐富度是一個平臺持續擴張運營的核心指標,通過相關性分析,平臺招募更多商家或開發更多產品系列都能促進用戶的下單轉化。相關分析顯示,平臺在一個細分類目下提供更多產品數量,可以減少用戶的跳失。
六、建議
根據以上結論,在利用AARRR模型和回歸分析的基礎上,分別提出如下的建議:
1. AARRR模型
找對人,多留人,提收入,擴規模。
獲取精準客群:
在較低成本下大量獲取的人群畫像是:
0-3歲之間的男童和女童,女童優先級更高,精準人群獲取方式上可采用推送高相關性類目的銷量Top3產品來吸引,比如對0-3的女童,推送”50014815”的Top3銷量產品廣告圖來投放吸引。
激活&留存:
活動是吸引拉新和刺激復購的有效措施,平臺可以通過增加活動檔期和活動的互動玩法等形式。
推薦:
平臺可以鼓勵商家采用會員制或者老帶新的措施,增強用戶黏性。
2. 回歸分析
可以預測2015的銷量,從而調整和優化各部門的KPI指標。
圖片來源于網絡
如上圖,可以根據2015年的總成交量目標拆解到各個一級類目的目標,同時也可以從產品角度確定研發和迭代多少款產品。
以上是我做的數據分析報告,歡迎交流探討!
作者:鯨歌,電商行業數據分析師,為頭部品牌提供數據咨詢服務,熱衷學習與分析,“數據人創作者聯盟”成員。
本文由@一個數據人的自留地 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Pexels,基于CC0協議。
寫的很專業