難道線下數據只有熱力圖這個用途么?
線下數據不光只是通過熱力圖來看,重點是如何用這些數據,構建人群畫像,獲取潛客,來達精準化營銷,資源配置,估算人口,招商引資等。
背景
每個做數據分析的人員應該嘗試過熱力圖,熱力圖包含線上&線下,線上的熱力圖其實根據用戶點擊次數來繪制,其目的就是給網站運營&移動運營產品經理等提供對頁面按鈕&功能參考,從而得知用戶興趣傾向,精簡按鈕等。
而線下的熱力圖又叫等值線地圖(choropleth map),以不同顏色表示不同的人口密度、天氣情況、人均收入、或者社會價值等。我們的現實生活中用的最多的是反應人口密度的線下熱力圖,但是我們通常也往往遇到一個問題,這些漂亮的圖有啥用?同時,也會引起我們的反思,難道線下數據只有熱力圖這個用途么?
線下數據的數據源
先說用途之前,我們先說說人口密度數據從哪來,線下熱力圖的核心就是獲?。?strong>經緯度;地址。
線下熱力圖的數據可以從幾個方面來說:
1、IP 地址
IP可以通過各種網段來判斷地址,目前IPV4協議使用的是32位地址,約有42億個地址,全球共用,中國約分配到6000多萬個IP地址,同理各個省、各個地區的地址段也不一樣,因此可以從地址段ip數判斷用戶密度。
但是,現在大部分ip地址是動態ip,如果用ip地址打比方是門牌號的話,動態ip地址就是反應此用戶經常搬家,門牌號不固定,這樣不能精準定位人群以及確定用戶的活動范圍。
所以,IP地址通常定位的數據范圍是城市、省。
2、GPS
GPS全球衛星定位導航系統,常用的設備中其他蜂窩電話網絡如GSM/GPRS也有類似自定位技術。
但是一般而言,GPS會有很多問題:
- 需要開啟定位功能的終端或者APP。
- GPS定位衛星的標準鐘時間不統一,致使在計算客戶端到相應衛星的距離時有誤差。
- 運動狀態,GPS信號頻繁變化。
3、WIFI
其原理就是用AP(路由)接收Beacon,或者發送請求幀(probe request)。
- 被動掃描:就是我們說的wifi 探針,原理就是通過安裝在特定的路由,通過握手協議將手機mac地址收集。
- 自動掃描:手機不定時會發送請求收集wifi信號,同樣也是握手協議,但是我們知道ssid和bssid,但是不知道他們的對應關系(ssid 可以理解路由器名稱;bssid其實就是路由器的mac地址)因此很多公司會派出很多人力去各大地方用自己手機探測wifi去尋找bssid。
同時,不管主動掃描、被動掃描,wifi信號強弱都會被同一個手機握手協議去收集(即穿墻技術),只能通過規則,時長等來判斷此設備到底停留在具體位置。
再者,由于iphone ios8 以上,會發送假的mac地址,因此,不能只通過握手協議來判斷,所以wifi確定的大部分設備系統為安卓。
線下數據源其實對后期數據用途的理解起到一定作用,那么我們這就聊聊線下數據應該怎么使用。
線下數據用途
用途1:估算人口,合理配置資源
我們常用的線下數據是反應人口比例密度,來估算某處的人流量,來提供線下資源配置建議。
分析步驟如下:
案例1
獲取IP定位分析城市:
例如某金融機構,根據他們手機數據IP來源查詢到位于深圳的客戶最多,因此想重點探查下深圳現有網點和人流密度差異,即想查看某處周圍人流密度是否過于稀疏、集中而應該減少、增加網點,支持業務需求。
同時,通過對熱力圖采樣的人流數據,和實際人口統計的人數,估算某地點的人數,與實際kpi核對是否達到設置網點的承載能力。
于是,線下數據用途之一觀察熱力圖,估算人口(見下圖),我們可以根據估算的用戶數增減網點配比。
當然這里是數值是用手機的GPS數據來反應人口密度,數值還可以用發聲用戶量,人口屬性(男女),年齡段最多人數比例等,或者app類型數據等來反映,其目的是要解決實際業務和線下數據問題,這里不贅述,歡迎討論。
繪制線下熱力圖&增加網點分布:
統計時間:15年7月1-7月6日。
統計口徑:在統計時間內打開此金融機構app并開啟定位功能的設備獲取的經緯度。
分析步驟:繪制基于設備熱力圖后,增加此金融機構網點分布。
分析目的:估算的用戶數增減網點配比。
分析結論:
從圖中可以看到編號9、10、13附近,應該增設網點、而在64、70、37附近應該減少網點。
案例2:根據工作日VS周末的不同時間,來估算人口數量
下圖占比為抽樣數據中指定時間內出現在特定地點的流量占比。借助流量占比,結合深圳人口,估算以上地區的流量。下圖工作日的設備密度大于周末,如工作日海岸城在下午和晚上密度較大,周末則選擇18點后去海岸城。
那么,在配置網點時候可考慮周末在海岸城地區多延長運營時間。
用途2:線下人群聚類,構造用戶畫像
用途1學會了看熱力圖,如果我們想了解某個地點的人群畫像,一般情況下是通過圍欄圈定人群,在根據用戶其他屬性做分析得到,此處的數據一般互聯網公司線上屬性都可以收集到,就可以刻畫出來。(此步驟本文不做重點分析)
但是我們想多維度的了解用戶,給用戶分類,標簽客戶,精準化營銷,這時候就需要做聚類。
分析步驟如下:
數據獲取&數據加工:
案例3:某商業地產客戶想了解用戶線下訪問店鋪情況,在精準營銷同時,合理配置店鋪資源。
數據說明:
- 以某商業地產篩選為目標客戶,在為期一周內出現在商場的用戶。
- 數據收集根據wifi探針方式,用訪問手機設備來假設人流密度情況。
- 篩選規則為訪問時間大于半小時,同時排除24點到早6點訪問的客戶(由于wifi探針缺點,防止將員工作為客戶,同時由于wifi的穿墻技術防止用戶沒到店鋪認為訪問店鋪,故定制篩選規則)。
在統計周期內,若該客戶訪問店鋪滿足篩選規則,則標記1,否則為0,具體變量(即店鋪類型)如下表:
客戶分群:
根據建模結果,因此將客戶分為下圖四種類型,左圖表示用戶對品類傾向性,取值范圍在0-1,傾向性由弱變強。例如人群1的特點是美體美發相對于人群II-IV數值偏弱,同時對比自己其他品類,例如西餐快餐,明顯表達出訪問頻次少的特點。因此可以判斷他的性別為男性為主。同時,對中餐訪問的傾向性高于其他人。故給人群I定位為傳統生活型用戶。
由于其他人的自身特點,按照左邊表格得出的數值,依據下圖故命名為四類人群。
分析解讀:
我們根據聚類了解了用戶的線下訪問店鋪特點,那么這些用戶線上特點是什么樣呢?我們由于抓取的是mac地址,因此可以得知用戶的設備,根據數據公司匹配,可以了解用戶的線上特性,例如機型、活躍設備,這樣可以結合線下數據&線上數據的打通,定制化營銷。
例如: 快捷消費型用戶偏重XX寶錢包,以及某銀行支付,那么可考慮在某寶頁面中增加此商業地產宣傳,增加優惠等信息。
同時,根據用戶匹配線上資源我們得到營銷建議。
具體的聚類方法的實現過程,和細節會在之后的文章中涉及到歡迎各位訂閱我的運營號。
用途3:線下圈人,預測潛客
我們現在了解已知客戶的人群,如何來找的潛在客戶人群,了解相似人群分布,便于我們在招商引資過程中合理配置資源,比如偏愛中餐的用戶中我們通過預測得知他們在北京角門東分布集中,那么如果在角門東某商業地產多引資西餐顯然并不合理。
但是如何構建潛在客戶呢,其實,這里面需要運用預測模型,常用的是邏輯回歸,分為正負樣本,其中某一類變量是線下地理位置,在對潛客進行預測打分。
但是大部分公司線下地理位置加工只是停留在區域,并沒有歸類,例如:我們知道某處幼兒園的用戶,但是我們不知道這一個省份中所有幼兒園的用戶,一般來說我們圈定人群就是根據經緯度來劃分,但是我們需要找尋某區域所有幼兒園附近的用戶,這需要數據公司人為歸類,同時利用geohash技術進行詳細規整。
下圖簡版的地理位置數據加工,我們根據熱力圖情況和每時段人次,找尋人口密集的地域,例如某時間周期內,出現人數最多的是四川省成都青陽區,我們知道他的經緯度(GPS獲?。瑥陌俣鹊貓D中看出附近是交通樞紐,在用geohash(精度4-6) 來圈定出現過此區域的人群都是在交通樞紐,這部分就是所說的地域加工。
這個是構建模型加工數據的變量之一,我們后續在區根據其他變量,例如線上屬性,手機品牌等,來構建邏輯回歸預測人群,很多公司也叫此技術為lookalike技術,但是每家公司變量加工維度,變量獲取不同,因此只能給出一個打分排序,分值高低不能說明問題。
最終營銷建議:
小結
因此,線下數據不光只是通過熱力圖來看,重點是如何用這些數據,構建人群畫像,獲取潛客,來達精準化營銷,資源配置,估算人口,招商引資等。但是,這些是方法,我們需要了解線下數據的獲取來源,以及優缺點,這樣我們在做人口估算,人群畫像,預測過程中才能有的放矢,取長補短。
作者:馮大福,新人,公眾號:說說數據分析那些事兒
本文由 @馮大福 原創發布于人人都是產品經理。未經許可,禁止轉載。
中國最偉大
這句話得這么說
您好有些問題需要了解一下
案例3中是怎么根據建模結果,將客戶群分為4類的?求解
哦哦
哦