當環比數據 “失控”:五大妙法還原商戶增長真相
做數據分析時,有時候會碰到一些難以解釋的異常情況,比如文章中這種環比異常增長的案例,如何找到真相?本文分享的五個方法,希望可以幫到大家。
一、問題現狀
做商戶交易分析的時候,經常會碰到一種讓人頭疼的情況。比如說,上個月有些商戶的生意不咋地,交易額只有個位數,可能就幾塊錢。但這個月突然就火了,交易額一下子變成了好幾百甚至好幾千。這一對比,環比增長率就大得離譜,完全不能正常反應商戶的真實經營變化。要是就這么直接看數據,很容易被誤導。
那怎么才能把這些數據處理得合理點,還能清楚地知道哪些商戶環比增長或者減少得多呢?下面就給大家講講幾個實用的辦法。
二、計算方式優化
2.1、設定合理閾值
可以根據業務經驗和數據特點設定一個合理的環比增長率閾值,比如超過 1000% 或 2000% 等視為異常值。對于超過閾值的數據,單獨進行標記或分組處理,在展示和分析時區別對待,既不影響整體的排序和分析,又能關注到這些特殊情況。
例如,在上述商戶交易數據統計業務中,根據以往數據波動情況,發現一般商戶的環比增長率很少超過 1000%,那么就可以將 1000% 設為閾值。
假設我們正在分析某商戶的環比增長數據,原始數據如下:
根據以往該商城商戶數據波動情況,發現一般商戶的環比增長率很少超過 1000%,所以將 1000% 設為閾值。對于超過閾值的商戶 A、商戶 C 和商戶 E 進行單獨標記或分組處理。
整體分析:在不考慮這些異常值的情況下,對剩余商戶(如商戶 B、商戶 D、商戶 F)進行分析,可得到一般商戶的平均環比增長率、增長趨勢等數據,以此了解商城內大多數商戶的正常業務增長情況。例如,這些正常增長商戶的平均環比增長率為 18.3%,說明在正常情況下,大部分商戶保持著較為穩定的增長。
異常值分析:單獨查看超過閾值的商戶 A、商戶 C 和商戶 E。商戶 A 可能是因為上月參加了一個效果不佳的促銷活動,導致基數較低,而本月恢復正常經營且有新的爆款商品推出,使得銷售額大幅增長;商戶 C 或許是獲得了一筆大額訂單,屬于偶然因素導致的增長;商戶 E 可能是成功入駐了某熱門平臺的推薦位,從而銷量暴增。通過對這些異常值的單獨分析,可以挖掘出背后特殊的業務事件或機遇,為其他商戶提供借鑒,或者為平臺制定針對性的扶持政策提供依據。
2.2、采用對數轉換
對數據進行對數轉換,將原始的環比數據取對數后再進行分析和排序。這樣可以壓縮數據的范圍,使極大值和極小值之間的差距相對縮小,減少異常值對整體排序的影響,同時也能在一定程度上反映數據的相對變化趨勢。
例如,原本環比增長率為 10000% 的數據,取對數后會變成一個相對較小的值,與其他數據的差距不再那么懸殊,能更合理地參與倒序排列。
假設我們正在分析某電商平臺上 5 家商戶的季度環比增長率數據,原始數據如下:
通常我們使用以 10 為底的對數進行轉換(當然也可以根據實際情況選擇自然對數等)。對上述環比增長率數據進行以 10 為底的對數轉換。
原始數據排序:按照原始環比增長率從高到低排序為:商戶 A(10000%)、商戶 B(500%)、商戶 C(200%)、商戶 D(50%)、商戶 E(10%)。可以看到商戶 A 的環比增長率數值遠高于其他商戶,在排序中占據絕對優勢,這種過大的差距可能會掩蓋其他商戶之間相對變化的信息。
對數轉換后排序:按照對數轉換后的值從高到低排序為:商戶 A(4)、商戶 B(2.7)、商戶 C(2.3)、商戶 D(1.7)、商戶 E(1)。通過對數轉換,極大值(商戶 A)與其他值之間的差距被明顯壓縮,使得各商戶之間的相對差異更加合理地呈現出來。這樣在分析排序時,我們能更全面地考慮到所有商戶的相對變化情況,而不會過度受極端值(如商戶 A 的超高環比增長率)的影響。對數轉換后的數據能確保資源分配不僅僅傾向于增長幅度極為突出的個別商戶,而是綜合考慮到各類增長程度的商戶,促進平臺整體的均衡發展。
2.3、計算移動平均環比
計算移動平均環比,即不僅考慮當前周期與上一周期的環比,還綜合考慮多個周期的環比情況,取其平均值。這樣可以平滑數據,減少單個周期異常值的影響,更能體現商戶的長期趨勢和穩定增長情況。
例如,計算過去 3 個周期的移動平均環比,用本周期與前三個周期分別計算環比,再求平均值,作為該商戶的綜合環比指標進行排序。
2.4、分區間統計和展示
將數據按照一定的金額區間或環比增長區間進行分組統計和展示。對于那些前一周期金額較小、本周期金額大幅增長的商戶,單獨放在一個區間進行分析和展示,與其他正常增長的商戶區分開來,這樣可以更清晰地看到不同區間內商戶的環比增減情況。
例如,將商戶分為 “個位數金額增長到六位數金額”,“十位數金額增長到五位數金額” 等不同區間,分別分析每個區間內的環比增減情況和排名。
假設我們收集了某電商平臺在一個特定時間段內,1000 家商戶的上一周期和本周期交易金額數據,以下是基于區間統計和展示的具體分析:
1)設定區間
區間一:個位數金額增長到六位數金額
區間二:十位數金額增長到五位數金額
區間三:百位數金額增長到四位數金額
區間四:正常增長區間(上下波動幅度在 ±50% 以內)
2)數據歸類與統計
經過對 1000 家商戶數據的整理,各區間商戶分布如下:
區間一:有 10 家商戶屬于個位數金額增長到六位數金額。上一周期這些商戶平均交易金額為 5 元,本周期平均達到了 150000 元。
區間二:共 25 家商戶是從十位數金額增長到五位數金額。上一周期平均交易金額為 85 元,本周期平均為 18000 元。
區間三:40 家商戶符合百位數金額增長到四位數金額。上一周期平均交易金額為 650 元,本周期平均為 4500 元。
區間四:剩下的 925 家商戶處于正常增長區間。上一周期平均交易金額為 5000 元,本周期平均為 5500 元。
3)環比增減情況分析
區間一:環比增長率極高,平均環比增長率達到了約 3000000%。這些商戶可能是一些新興的特色小商家,抓住了某個熱門趨勢或平臺推廣機會,實現了爆發式增長。
區間二:平均環比增長率約為 21000%。這類商戶可能是在原有基礎上通過優化產品或服務,吸引了更多客戶,實現了較大幅度的增長。
區間三:平均環比增長率約為 592%。這些商戶穩步拓展業務,可能通過一些常規的營銷手段或改進經營策略,取得了較為可觀的增長。
區間四:平均環比增長率為 10%。該區間內商戶增長較為平穩,代表了平臺上大多數商戶的常規增長水平。
排名展示
對于每個區間內的商戶,按照環比增長率進行排名。例如在區間一中,商戶 A 上一周期交易金額為 3 元,本周期達到了 180000 元,環比增長率高達 6000000%,在該區間內排名第一。這表明商戶 A 在這類爆發式增長的商戶中,增長速度最為突出。
2.5、采用相對比率指標
除了環比增長率,還可以引入其他相對比率指標,如定基比率等,從不同角度衡量商戶的增長情況。結合多個指標進行綜合評估,避免僅依賴環比數據導致的異常值影響過大問題。
例如,以某個固定周期為基期,計算每個周期與基期的定基比率,再結合環比數據,綜合判斷商戶的增長趨勢和幅度。
假設我們有某商戶連續 5 個季度的交易數據,如下表所示:
1)計算環比增長率
- 環比增長率 = (本期數 – 上期數)/ 上期數 ×100%
- Q2 環比增長率 = ($12000 – 10000) / 10000×100% = 20%
- Q3 環比增長率 = ($15000 – 12000) / 12000×100% = 25%
- Q4 環比增長率 = ($13000 – 15000) / 15000×100% ≈ -13.33%
- Q5 環比增長率 = ($18000 – 13000) / 13000×100% ≈ 38.46%
2)計算定基比率
- 以 Q1 為基期,定基比率 = (各期數 / 基期數)×100%
- Q2 定基比率 = ($12000 / 10000)×100% = 120%
- Q3 定基比率 = ($15000 / 10000)×100% = 150%
- Q4 定基比率 = ($13000 / 10000)×100% = 130%
- Q5 定基比率 = ($18000 / 10000)×100% = 180%
3)綜合分析
- 從環比增長率看,Q2 到 Q3 增長態勢良好,但 Q4 出現了負增長,Q5 又大幅增長。環比數據能體現相鄰兩個周期的變化情況,但如果某一周期數據異常(如 Q4 因特殊原因導致交易金額下降),可能會影響對整體趨勢的判斷。
- 而定基比率始終以 Q1 為參照,更能體現從基期開始的總體增長趨勢。該商戶從 Q1 到 Q5 的定基比率持續上升,表明整體上交易金額處于增長狀態。
- 通過結合環比增長率和定基比率這兩個相對比率指標,我們可以更全面、準確地評估該商戶的增長情況。例如,在分析 Q4 數據時,雖然環比出現負增長,但結合定基比率發現,相較于基期 Q1 仍有 30% 的增長,說明該商戶的業務總體增長趨勢未變,Q4 的下滑可能是短期波動,而非長期趨勢逆轉。
通過以上一種或多種方法的結合使用,可以更合理地處理數據,既能有效應對環比率異常大的情況,又能準確地看出環比增減大的商戶,為數據分析和決策提供更有價值的信息。
本文由 @一個帽子的世界 原創發布于人人都是產品經理。未經作者許可,禁止轉載
題圖來自 Pexels,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務
分享的方法是有用的,希望可以應用到本身的工作中