運營實操|15分鐘學會數據地圖分析

18 評論 54346 瀏覽 375 收藏 27 分鐘

本文慎入!泣血長文(花了鄙人近一周時間進行構思和寫作)?。?!吃透耗時大概15分鐘,但讀后運營功力大增!如果圖片文字過小,點擊圖片即可放大,即可看到清晰的圖片。

什么都不說,先上一張最終的數據地圖效果圖,熱力圖部分是目標用戶的分布,紫色和藍色的購物車表示2種類型的商業購物場所。而深淺不一的藍色格子塊則代表房價。

圖片1

圖1 最終效果圖

那么問題來了:

  • 這張圖的制作需要哪些數據?
  • 你能從這張圖上得到哪些信息?
  • 這張圖能用到哪些地方?

如果你對上述3個問題摸不著頭腦,那很正常,因為這涉及到具體的使用的場景/背景,也就是說,要用數據地圖解決什么樣的問題。

關于這張圖的項目背景和制作過程,下文將和盤托出,而且你不需要懂編程、設計,也不需要懂艱深的統計學知識,用短短15分鐘的時間,你將get到這個酷炫而且還有實際用途的“黑技能”,讓你的同事和老板對你刮目相看!

一、數據地圖是啥?

1.概念及用途

我們在做運營、市場方面的數據分析時,常會涉及到地理坐標、區域和地名與數據關聯的情形,如

  • 某個APP在全國各個城市的注冊會員數分布情況
  • 某個O2O生鮮品牌的線下網點在某個城市中的分布情況
  • 已經擁有某個地區潛在消費者的地理分布數據及相關商業生態信息(購物中心、公交站點和公司分布等信息),需要合理選擇地推場地

像前面兩個問題,以excel表格的形式來顯示就可以了,然而對于第三個問題的處理,需要結合地圖和數據兩方面信息,這就要用到高階的數據處理工具了—

Duang duang duang~數據地圖這時閃亮登場了~~~

現在關于數據地圖的定義還不是很全面。筆者認為,數據地圖是一種將地理數據地理信息有機結合的一種地理數據表達方式。數據地圖應用地圖來分析展示與地理位置相關的數據,以圖示化的展現形式來呈現信息,使得這種數據表達方式更直觀和清晰,更容易發現規律,方便我們挖掘深層信息,更好的輔助決策。

要想正確的使用數據地圖,弄懂“地圖圖層”這個概念十分重要。實際上,“地圖圖層”類似于Photoshop中的圖層:對于我們現實中空間的表達,實際上是通過不同圖層去表現的,然后將這些圖層疊加在一起進行表達(見圖2)。其中,幾乎每個地圖需要用到的圖層是“底圖”,它類似于PS中的背景圖層,是地圖中最基本的地形、地貌數據及某些相關附屬數據或信息(例如公路,河湖、山脈等),常見的有衛星圖圖層、三維立體圖層及二維平面圖等。

圖片2

圖2 數據地圖的圖層結構

地圖的應用目的不同,我們所要疊加的圖層也不盡相同,除了最基本的底圖,我們會有針對性的展示跟目標相一致的信息內容(如不同商業形態、人口統計學信息)。

圖3是幾種常見的數據地圖展現形式。

圖片3

圖3 幾種常見的數據地圖類型

從圖3中可以看出,這些數據地圖的共同點在于:使用不同的圖案標示代表不同類型的數據,不同顏色深淺程度(一般是由淺入深(由冷入暖)表示數量由小到大,)代表不同的程度、數量、類型。

2.數據地圖的一般制作步驟

數據地圖的制作一般分為4個過程,即上傳數據、選擇應用(不同的地圖選項)、加入周邊生態和生成地圖,詳情見圖4。

圖片4

圖4 數據地圖的制作流程

3.常用的數據地圖制作工具

目前關于數據地圖制作的工具有:Excel 2010及以上版本(見圖5)、GeoQ、地圖匯、數據地圖網、Target Map、Geo Commons。用戶上傳包含位置信息的Office Excel數據,通過簡單的操作,即可制作出各種大師級水準的數據地圖。

圖片5

圖5 excel2013中的數據地圖—三維地圖

二、數據地圖案例實操

1.項目背景

最近參與了一個關于孕嬰童方面的項目,需要整合面向0-3歲的各種產品和服務供應商資源和產品/服務資源,協調各方面的利益,一起服務于0-3歲這個母嬰群體,項目具體細節不作詳述。目前本項目的合作商家都有線下實體,所以我們主要在線下進行宣傳和推廣,且在上海市楊浦區進行試點,以“精益創業”的理念作指導,力求以最小成本在短期內快速試錯,攻克測試中的難題且進展順利,將會向全市鋪開,最后大面積擴展。

以上是項目的背景簡介,作為一個即將啟動的小規模試點項目,運營這邊需要解決3個關鍵性的問題:

  • 目標用戶在該區域內的分布怎樣?或是在哪里找到這些目標用戶?
  • 如何有針對性的去選擇合作商家?或是面向的合作商家要符合哪些條件?
  • 本項目的線下推廣該如何布置?

下面的案例分析主要圍繞這3個問題展開。

2.現有數據

手中有2份數據:

  • 2013-02~2016-03的上海楊浦區的新生兒出生數據(近2W條),數據量足夠大,根據統計學的抽樣原理,具有一定代表性,有很大的參考價值,見圖6;
  • 一些有意向參加本項目的候選合作商戶的數據(64家),見圖7。

接下來,我將用這兩份原始數據來做多維度的分析,用以解決上述3個問題。

圖片6

?圖6 用戶原始數據(局部)

圖片7

?圖7 待確定合作商家地理信息(局部)

3.挖掘用戶基礎信息

這個部分不是本文的重點,但為了保持整個分析過程的完整性,所以這里也順帶提一下,也算是前置的小“彩蛋”,有想知道具體怎樣操做的小伙伴可以小窗我。

拿到數據之后,很重要的一個工作就是從里面盡可能的榨干對項目有價值的數據,從中找到重要的線索。對于用戶的數據,我主要從時間和地址這2個維度進行了深入分析。調用excel函數和透視表等工具,將表格做成了如下的形式:

圖片8

圖8 處理后得到的新生寶寶數據信息

在圖8中,我在時間維度里做了深度分析,將其拆分為“日期”和“時間”,在日期里解析出孩子的出生時間段、現在多大了和星座這幾個信息。因為我們的項目面向的是0-3歲的嬰幼兒,孩子現在多大這個維度可以使我們有效的篩選出目標用戶,所以超出這個年齡區間的用戶就不在我們的考慮范圍以內,同時根據孩子年齡大小我們可以有針對性的推薦適合的產品和服務,比如奶粉適合推薦給一年左右的孩子,這時正是母乳喂養轉奶粉喂養的時間節點;星座信息可以作為我們的短信營銷和快遞禮品寄送時的話術參考(如“親愛的金牛座寶寶,*$#&^”)。

4.數據地圖的制作

上面只是挖掘了時間維度的信息,下面就要放大招了。關于地理信息的挖掘,做出可視化的數據地圖!

在做之前,結合這2份數據所能提供的信息,先將之前提到的3個抽象的問題做進一步的具體化:

  • 用戶的地理分布如何呈現?如何借助其他信息判斷目標用戶的價值?
  • 合作商戶的地理區位選在哪里比較合適?需要考慮的因素是什么?
  • 能不能把目標用戶地理分布、合作商家分布和其他輔助信息做在一張地圖上,有助于更好的做決策?
  • 線下推廣在哪個地點、哪個時間段展開,活動效果會更好?

(1)用戶的地理分布如何呈現?如何借助其他信息判斷目標用戶的價值?

本項目因為是一個母嬰資源整合項目,打包后的產品和服務客單價較高,相對來說定位高端人群。同時,針對的是0-3歲的嬰幼兒,所以我們的目標人群定位于高收入的85/90后年輕寶爸寶媽,育兒意識較強但無育兒經驗,生活有品位,消費能力強。其中,關鍵的特征是“高收入”、“消費能力強”、“生活有品位”(見圖9)。

圖片9

圖9 目標用戶的基本特征

我們先將用戶的數據整理下,只留下用戶姓名或編號及詳細地址,注意在只有區級和街道的地址前加上市級區劃,如本項目在上海區開展,前面統一加上“上海市”,以免地圖將坐標定位到同樣名稱的全國其他地區。

制作數據地圖,我一般用到的工具是XXX,其中有很多功能都是免費的,大型商業類項目可能要收錢。。。。。

注冊成為會員后,將整理過的數據載入進去,分別按圖10中標紅的部分操作,得到的初始狀態顯示如圖11:

圖片10

圖10 ?加載數據時的選擇項目

圖片11

圖11 數據地圖初始展現

這個工具載入數據后初始顯示的是散點圖,看起來有點凌亂,貌似發現不了規律,得不到什么有價值信息。不過不要緊,通過地圖展現形式的不同,該問題可以得到解決。

首先了解下該工具中的2個重要選項—“地圖圖層”和“數據展示類型”。地圖圖層,上文曾提到,可疊加顯示;數據展示類型則是坐標的展現形式,本工具一共提供了7類數據展現形式(圖12):

  1. 點符號:單個地理坐標顯示為點,只能將所有坐標標記成統一的樣式,不能做成不同的圖案以示區分;
  2. 燈光圖:跟點符號一樣,只能統一標記坐標,不同的是,可以給點增加泛光,即光暈,顧名思義叫做燈光圖;
  3. 等級符號:根據地表某一類數據的大小標記坐標,如A、B、C三處的銷售額分別為750K、550K、400K,那么在等級上A>B>C,圖示上坐標顯示的圖案大小從小到大依次為C、B、A。
  4. 聚合圖:聚合圖根據某一區域點的集中程度,自動算出這一區域聚集中心;
  5. 熱度/熱力圖:這個比較常見,根據區域間點的密集程度,一般按由淺到深的顏色來表示數據的從大到小、集中到稀疏。
  6. 圖表圖:跟等級符號類似,根據地表某一類數據的大小程度來顯示標示。

圖片12

圖12 數據地圖的7中坐標展示形式

根據所擁有的數據狀況和項目需求,我們主要用到聚合圖熱力圖兩種坐標顯示類型。接下來,我將分別用到聚合圖(圖13)、熱力圖(圖14),以及這種個地圖圖層的疊加組合(圖15)來展現目標用戶的地理分布情況。

圖片13

圖13目標用戶坐標的聚合圖展示

圖片14

圖14 目標用戶坐標的熱力圖展示

圖片15

圖15 目標用戶坐標的聚合圖、熱力圖的聯合展現

從以上的3個圖可以看出,聚合圖可以顯示集中的小區域,但各個區域間的連續性被打破,看起來比較孤立;熱力圖顯示的區域較泛,各區域間的用戶疏密一目了然,有連續性,但沒能集中顯示重要的地點;而在圖15中,兩種圖層的有機結合恰好把這兩種圖示方式的優點整合起來,最大限度的呈現我們所需要的信息。

值得注意的是,可以隨時滑動鼠標,對地圖的比例進行縮放,原則是覆蓋整個目標區域(這里是楊浦區)、包含鄰近地區(這個下面會提到),以及盡可能的顯示該區域的重點坐標(如交通樞紐、商業中心及重要社區)。

在圖15中,我們可以看到,目標用戶較集中的板塊有五角場商圈、黃興商圈、鞍山商圈和中原商圈(圖16),這幾個區域也是楊浦區重要的市級、區域級和社區級商圈。然后,我們根據搜集來的信息確定了各個區域重要的樓盤信息,也就在用戶所在住宅板塊的信息(圖17),這些住宅區將是我們線下進行宣傳的主要地點。

圖片16

圖16 目標用戶分布較為集中的幾個商圈

圖片25

圖17 楊浦區各商圈覆蓋區域及典型住宅區(局部)

數據來源:搜房網

(2)合作商戶的地理區位選在哪里比較合適?需要考慮的因素是什么?

關于目標合作商戶的選擇,我們關注以下幾點:

  • 臨近目標消費人群;
  • 附近的周邊商業生態良好,目標人群經常光顧的區域;
  • 輻射/覆蓋區域較廣。

1)臨近目標消費人群

和上面同樣的方法,載入合作商戶的地理數據,以“類型符號”的形式呈現商戶坐標信息,同時將不同類型的商戶標記為不同顏色的點,因為商戶地標的顯示顏色和地圖底色、熱力圖顏色等存在疊加,為避免信息展現時過于雜亂,去掉聚合層,將地圖的顏色顯示成灰色,如圖18:

圖片18

圖18 目標用戶分布和商戶地理坐標展示

在圖18中,我們選擇在楊浦區內,離目標用戶不遠,甚至部分商戶在虹口區,由此確定第一輪合作商戶的大致地理范圍,大概有三分之二的商戶得以保留。

當然第一輪的篩選還不夠細致,我們還需要進行下一輪的篩選。

2)附近的周邊商業生態良好,目標人群經常光顧的區域

這里需要用到該工具中強大的 “開放數據”數據庫,里面包含興趣點數據(購物、餐飲、酒店、公共設施、休閑娛樂等)、品牌數據(各類消費品和服務的品牌實體店分布)和人口經濟公交數據(人口、住宅和交通等)。

因為本項目涉及到0-3歲的母嬰消費人群,我們要找到這些目標用戶會經常光顧的商業場所,主要是購物中心(如東方商廈、萬達廣場和百聯又一城等)和母嬰用品實體店(奶粉店、泳兒游泳館和嬰兒服裝店等)。因母嬰用品點和購物中心都屬于購物型場所,所以它們分別用紫色和藍綠色的購物車顯示。由此得到圖19:

圖片19

圖19 目標用戶分布和商戶地理坐標及周邊商業生態(購物中心和母嬰店)展示

基于便民的考慮(地理位置近),地圖比例尺測算,選取半徑為5KM的限定待選合作商戶的地理位置,圖19中的紅圈即為周邊商業生態較好的區域。

經過第二輪篩選,我們最終確定下來15個合作商家。

(3)線下推廣在哪個地點、哪個時間段展開,活動效果會更好?

分別明確好目標用戶和合作商戶的地理分布后,接下來我們還需要用數據地圖做2件事—首次地推的場所的確定和地推的時間的安排。這里可以用到大家熟悉而又陌生的一個工具—微信中的“城市熱力圖”。

1)確定目標地推區域

現在大家都提倡精益創業,最短時間內最小成本快速試錯,所以我們必須先找到一到幾個切入點,而不是全面鋪開。因而我們需要這些目標用戶聚集區域中找到價值最高,也就是消費能力較強的用戶聚集地,在附近進行推廣和宣傳,力求打響第一槍。

常識告訴我們,消費能力強的用戶,其所在區域的房價一般較高。因此,我們決定在房價較高的區域進行初次推廣,見圖20。

圖片20

圖20 目標用戶分布&商戶地理坐標&周邊商業生態(購物中心和母嬰店)&各區塊房價展示

在圖20中,五角場附近的平均房價為58,570元,黃興公園附近的平均房價為60,446元,為目標區域中房價最高的兩個區域,根據上面的推斷,這兩處居住的用戶消費能力相較其他目標區域更強。此處地面推廣的話,地鐵站的效果較為良好(人群集散點),因而地推場所選在五角場地鐵站和黃興公園地鐵站。

2)確定目標地推區域時間

確定目標地推區域的時間,需要用到微信中附帶的“城市熱力圖”功能,依次確定此處一周中哪一天和一天內哪個(些)時段的人流較多。該工具打開路徑為:錢包→城市服務→城市熱力圖。

在搜索框依次輸入“五角場地鐵站”和“黃興公園地鐵站”,得到圖21、圖22:

圖片21

圖21 五角場地鐵站及其周邊人流時間分別情況

圖片22

圖22? 黃興公園地鐵站及其周邊人流時間分別情況

圖21中,五角場一周的人流量分布都比較均勻,因為這邊有許多公司和商業場所(主要是購物中心):周一到周五,人流量來自去公司上班的白領人群;周末,人流量來自去商業場所消費的家庭人群。所以五角場這里的地推可以在周一到周日展開;因筆者寫作此文的時間是周日,所以“今天”代表的是周日,可以看出,中午12:00到下午18:00間的人流量較大,虛擬的曲線,即當前到24:00之間也有一個小高峰,這是根據歷史數據推測出來的預測值。地推在白天的效果一般較好,所以選擇12:00~18:00之間開展。

與上述推理類似,根據圖22可知,黃興公園地鐵站的地推可選在周天,時間段可以選在15:00~18:00之間。與五角場不同的是,黃興公園這邊明顯是“節假日經濟”—公司較少,娛樂場所較多(黃興公園、黃興體育運動公園等),周末人流量明顯比工作日多。

值得注意的是,時間段的選取,會受到天氣、節假日的影響,最好在一到兩周內密切關注每日/每個時間段的人流數據情況,作好記錄,按規律找到其中比較穩定的一天或某個時間段。

經過上面的操作和分析,得到圖23,這是經數據地圖分析得出的最終結論:

圖片23

圖23? 由數據地圖分析得來的結論

三、結語

從上面的實際案例可以看出,數據地圖結合了數據信息和地理信息這兩個信息維度,在考慮數量的同時,也兼顧了區位分析,從中能得到比表格更直觀的可視化結果,當然這種綜合分析需要我們有豐富的商業敏銳度和區位學知識,以便在運營分析中做出更準確的判斷。

此外,數據地圖還可以用在:

  • 購房選址、線下店鋪選址等
  • 通過百度熱力圖和微信熱力地圖這樣的實時工具,還可以在旅游前事先了解各景點的人流情況,選擇合適的旅行地點和旅行時間
  • 物流行業的精準營銷
  • 城市規劃

……

 

作者:蘇格蘭折耳喵,微信公眾號:運營喵是怎樣煉成的,個人微信:g18818233178),數據分析愛好者,擅長數據分析和可視化表達,喜歡研究各種跟數據相關的東東。

本文由 @蘇格蘭折耳喵 原創發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 作者的公眾號是改名了嗎?搜不到。。

    來自北京 回復
  2. 能否私信告訴一下,本文做數據地圖的軟件名稱 13146517410@163.com

    回復
  3. BDP嗎

    來自廣東 回復
  4. 考慮用這個方法選址開個店 能否告知下軟件名稱 謝謝 1506457367@qq.com

    回復
  5. 看完后,我發現我做的項目還有很多地方值得去深入思考,數據挖掘分析是一門很好的學科!

    來自湖北 回復
  6. 看完文章需要20分鐘,分析與制作要我至少1-2天了,獲益匪淺

    回復
  7. 工具xxx是啥 求一個

    回復
  8. 牛逼

    來自浙江 回復
  9. 可以分享下數據地圖制作的工具嗎?

    來自廣東 回復
    1. 智圖

      來自上海 回復
  10. GIS專業畢業產品汪飄過……專業軟件可快速用于空間分析與選址,作者講的這種方法顯得有點復雜

    來自浙江 回復
    1. 畢竟我不是專業出身,絕大部分看到這篇文章的也不是專業,而且考慮到免費因素,所以….

      來自上海 回復
    2. 制作地圖工具,可以分享一下嘛? 謝謝 463939732@qq.com

      來自廣東 回復
    3. 同求,制作地圖工具, 謝謝 2289359225@qq.com

      來自北京 回復
  11. 厲害。。

    來自湖北 回復
  12. 厲害??

    回復
  13. 膩害

    來自上海 回復
    1. ??

      來自上海 回復