數據驅動業務增長:如何做轉化意愿預測?
編輯導語:在日常業務中,數據分析可以幫助我們挖掘業務增長點,提升轉化效率,等等。那么,如何結合一款0代碼機器學習智能工具實現數據分析?本篇文章里,作者結合Amazon SageMaker Canvas這款工具進行了轉化意愿預測,讓我們來看看他的體驗評測吧。
引言
“數據驅動業務增長”是以業務線全鏈路海量數據的收集、存儲、可視化、分析、挖掘作為核心支撐的,需要協同上下游參與且目標一致,最終將數據精準化、精細化為實現商業目的。
一、業務背景
1. 業務介紹
本產品主要是挖掘孩子的綜合素質,覆蓋思維、英語、語文等能力,幫助孩子在認識世界、探索世界的同時,打好全方位的能力基礎,陪伴孩子共同成長。
2. 商業模式
通過低價課吸引用戶,經過一些列課程培養和體驗服務,最終轉化成年課用戶。
3. 分析主題
轉化分析。
4. 現狀痛點
- 營銷運營的目標不夠清晰和聚焦,人效較低。
- 很難快速掌握用戶轉化的核心痛點,轉化率不高。
5. 分析目標
目前屬于發掘的新業務,所以業務需要在招生分析的鏈路上,想要通過一系列的全面復盤和分析,核心提高轉化率。
二、分析思路
所有的分析思路都應該以場景作為切入點,以業務決策為終點,因此本次項目梳理了五個步驟:
- 挖掘業務含義
- 梳理用戶行為路徑
- 拆分場景特征
- 構建模型預測
- 推動數據決策
1. 挖掘業務含義
用戶旅程圖:從用戶角度出發,以用戶調研和業務場景中發現用戶在整個使用過程中的痛點和滿意點,思考產品的增長點。
2. 梳理用戶行為特征
1)路徑拆解
在用戶旅程的大框架下,通過對用戶行為數據的采集,監測獲得的數據進行分析可以讓更加詳細、清楚地了解用戶的行為習慣,將他們的目標、需求與商業宗旨相匹配。
2)用戶行為
根據用戶旅程的體驗中,可以把用戶分為三個階段,其中包含:獲客、留存、轉化,每個階段的衡量反應出的分析目標和邏輯則不同。
3. 拆分場景特征
1)相關性分析
主要用于研究用戶行為事件的發生對轉化的影響程度,針對這一行為特征進行相關性分析,確認導致該行為的影響因素和影響權重。
2)梳理特征(定義數據集)
涉及到原始的數據源,我們需要在亞馬遜中找到S3的存儲桶,將數據源文件傳輸至此。
數據源(行為特征):第一版本共梳理了70+特征因子,這一版本是通過產品和業務的直覺梳理和轉化有的相關性,通過模型在去做篩選和相關性分析。
S3存儲桶:亞馬遜的數據源需要借用S3存儲桶服務。
數據集:S3存儲桶中數據源可以直接同步至畫布的數據集,并且可以針對數據預覽數據,這點兩個功能點很棒,因為正式預覽才發現數據源亂碼的問題。
三、構建模型預測
1. 構建模型
第一步:直接就選擇上傳的數據集就ok了,這一步非常的簡單。
第二步:選擇預測的指標很好理解,關鍵點在于模型的選擇,轉化預測本質是一個二分類的問題,預期是0-1的一個概率值,實戰中選擇的【xgboost】模型進行預測,通過和轉化率強相關的因子和轉化預測分層進行后續的營銷策略。
這里的模型選擇會根據我的數據集推薦模型,也會有一些內容的引導,不過other的模型有的不可選擇,所以默認使用推薦的模型,看下初次效果。
還沒有建模時候可以簡單對目標的相關性做個分析對比。
2. 模型表現
1)模型能力
處理速度:模型個處理速度在耗時3min左右,還是蠻快的,比較超出預期。
模型得分:模型分數和預期(70-80)相比會較高一些,可能由于數據量級較小,造成數據得分偏高;自建模型訓練環境中的F1=0.78、AUC=0.85。
特征分析:這個可以根據轉化意愿分值進行查看指標的影響和分布,這個功能是非常棒的,在數據產品視角對模型分析師偏概覽的,這個可以細致的挖掘更深層的理解。
2)特征相關性
根據初次篩選,得出一些和轉化有顯著相關性的指標因子,并且可利用分布情況,分析背后原因。
顯著相關性概覽:根據是否顯著相關性整理一部分比較有趣,可以看出有一些認為有影響因素的其實問題并不大,有的標簽其實和轉化這個點關系并不強烈,但是可以作何核心的營銷因素。
3)相關性排行
根據相關性整理了分值排行,更能直觀看到哪些影響因子的重要程度。
3. 數據分析
1)分析理論
- 卡方檢驗:著重觀察值與理論值的偏離程度,選擇的考慮主要是基于特征的二分類問題和相互獨立事件居多。
- 斯皮爾曼相關性分析:核心針對兩個連續性變量且成線性關系,所以需驗證其相關性。
2)地域分析
從地域人群量級和轉化率上來看,整體手中人群集中在二三線城市,所以在產品的投放和布局中,需針對等級進行策略規劃。
3)競品分析
卡方校驗非常顯著,從此指標可以看出,用戶安裝了競品,直接可以篩選到核心的種子用戶,因為該用戶對此有強烈的潛在需求。
4)留存分析
這里的留存主要指用戶來學習的次數,分析圖標看,用戶持續學習提現出對產品課程的認可性,非常有利于后續營銷轉化。
4. 訓練模型
1)持續訓練
防止數據量稀疏和數據量較?。ㄔ囉米畲?00w單元格),所以需要加大數據源的量級,加強預測能力,防止結果的偶然性。
2)模型調優
- 調整不合理指標,防止特征穿越(比如瀏覽產品詳情頁,這種標簽穿越特別嚴重,其實在模型中做預測是不太可取,反而可以成為營銷策略的用戶標簽)。
- 對模型進行合理的剪枝規則,增強模型可解釋性(針對特別明細標簽,進行歸因和聚合)。
3)預測模型
重新上傳一組數據對模型進行預測,通過預測結果和本地訓練集進行比對,準確率在70%左右,整體來說已經不錯了,后續可以加大投入力度進行驗證和訓練,尤其是雙向結合的方式,效率會大大提高。
四、推動數據策略
數據分析也好、數據挖掘也罷,只是實現商業目標的手段,真正想賦能業務并且驅動業務,一定要從實際場景觸發,找到切入點。
策略一:提效
1)用戶分層
根據用戶的轉化意愿預測值,進行用戶分層,形成營銷SOP清單,可以針對中高意愿以上的的用戶進行精準觸達,對于大部分銷售人員可以減少人工判斷成本,優先觸達轉化意向高的用戶,合理分配時間和觸達深度,并且可以制定標準的SOP動作,大大提高運營效率。
2)價值收益
提高了80%的人效,人效主要針對單個銷售服務的用戶比值。
策略二:抓手
1)用戶標簽
在營銷工具中實時更新用戶的高意向標簽(溝通意愿強烈)或者策略標簽(學習能力畫像:中),可聯動知識庫進行組合式營銷,為用戶解決痛點,提供優質的服務。
比如:用戶的能力畫像中“思維能力”薄弱,那么可以根據用戶在學習過程中哪些思維題做的不好,引導用戶如何針對性、系統化的提升,解決核心痛點。
2)價值收益
提高了15%的轉化率,轉化率=購買年課用戶/購買體驗課用戶。
五、參賽總結
1. 產品體驗
1)用戶體驗
① 產品設計
樣式上紫色的主色調非常符合當前互聯網人的視覺喜愛,紫色本來帶有一些神秘感覺,在加上機器學習的加持,整體樣式設計很足,而且紫白結合很干凈和簡潔。
② 產品交互
體驗流程很順暢,用起來很方便,比如在模型全鏈條是以流式,從選擇數據集-構建模型-模型分析-模型評估,整體有從無到有的感覺,使用深度逐漸加深,比較符合預期。
③ 產品友好
功能細節上做的比較出色,感觸較深的第一是數據集的預覽,這樣可以直接看見數據集的概覽和樣式,線上和本地會有數據解析的格式問題,第二個是模型的推薦,會根據內容的選擇推薦相對應的模型,有充足的解釋性引導和應用示例。
2)產品功能
- 模型構建:模型構建速度較快,這個有點超出預期。
- 模型評價:模型分析可以直接查看到相關性已經數據更強的透視能力,這個能力提升了很多效率。
3)優化功能
- 數據集兼容能力:這個針對不同數據源可以在上傳做檢驗和預覽,前置風險暴露能力。
- 模型調優能力:增強平臺對模型進行調優的能力,比如可以考慮多個特征因子的融合、指標區間分析等。
- 數據源能力:可以把數據源的上傳和存儲考慮融合在產品內部。
2. 心路歷程
- 參賽目標:首先想了解一下當前亞馬遜的產品力;其次就是想在整個過程中梳理一下分析思路,復盤項目可以增加更多的思考。
- 參賽總結:整體產品體驗我覺得還不錯,有一點超出預期,后續會持續關注產品,也感謝人人都是產品經理提供本次參賽的機會~
本文由 @芥末先生 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!