3500字干貨 | 大家都在談的數據思維,到底要怎么建立?
編輯導語:有時候,即使我們學習了很多數據分析的方法,但是真正需要應用到工作中時,卻不是那么如魚得水。究其原因,是因為缺乏了“數據思維 ”。那么,我們應該如何培養自己的數據思維,更好地運用數據分析方法呢?
前幾天,有一個小伙伴跟我說,自己學了很多數據分析方法,也會好幾門數據分析工具,就是找不到一份好的數據分析工作。大概率可能就是缺少“數據思維 ”。
確實,每個跟數據打交道的互聯網崗位JD都會寫著:具有敏銳的數據洞察力和較強的數據思維。
那數據思維如此重要,今天就帶大家了解下什么是數據思維?如何培養數據思維?
一、什么是數據思維?
數據思維就是使用數據來提出問題和解決問題的能力。說白了,就是面對一堆業務問題的時候,能不能通過數據的方法做分析從而給出建議來解決業務問題。
其核心有兩個,一個是數據敏感度,一個是數據方法經驗。
數據敏感度,我理解的就是你看到一個數字,你大概就能感知這個數字是否合理還是有異常,當數據異常的時候,大概能知道問題可能出在哪里,并且能夠追溯到原因。總之,假如你數據敏感度高,你可以看到數據背后更多的信息。
數據方法經驗,我理解的是你看到這些問題還不行,還需能夠利用數據分析的方法來解決實際的問題,這也是構成數據思維很重要的一部分。
數據分析的方法就很多,比如:漏斗分析、相關性分析、5W2H分析、對比分析、分群分析等等。
舉個簡單的例子,比如,上周和我同事去一家東北鐵鍋燉吃飯,感覺人還挺多的。我同事就說,這家餐廳好火爆,生意還挺不錯的,老板應該可以賺不少錢。老板能夠賺多少錢,他的思考邏輯都是基于“挺多的”、“火爆”、“挺不錯”這樣的虛詞,靠直覺得出的結論。
但是,對于一個擁有數據思維的人來說,他要是很想認真的回答這個問題,可能就會這么思考。
- 餐廳有多少座位,這個大概可以數出來;餐廳有多少平米,可以估算出來;
- 翻臺率是多少,從自己吃飯上菜到吃完的時間和飯點時間跨度是可以估算出來的;
- 客源如何,可以從餐廳附近所處的位置來判斷;
- 每樣菜的毛利率,從菜單和上菜后的量可以推斷。
- 最后,綜合這些維度數據,進行加工,大概率就可以估算出這家店的能不能賺錢,一個月可以賺多少錢。
二、建立數據思維
技能容易掌握,但思維卻很難短時間內培養出來。個人覺得,擁有良好的數據思維,至少還需要有一定的數據基礎。平常在面試數據分析師的時候,我往往會問面試者的數學成績怎樣。
因為數學成績能夠部分反映一個人的數據思維養成的潛力,數學解題的思維方式,其實就是數據思維。
1. 學會建立數據鏈條
剛入職阿里巴巴,我是做P4P廣告數據分析方向,當時遇到一個case,讓我見識了一個廣告產品老大的數據思維。對于廣告部門而言,收入就是KPI,每天的廣告收入是產品老大重點關注的指標,老大的功力在于能從整體的收入下降不斷遞進反推快速命中下降的原因。
當天的真實情況是,我們這些下面的數據分析師不斷的被追問,為什么會下降?降在哪個渠道?哪個廣告點位?是算法策略調整了?還是產品功能優化了?還是促銷活動?
假如像我們這種新手,沒有嚴密的數據鏈條,往往只能是看到一步,沒法看到更深一步的原因。所以,很多新人就會不斷的發出這種感嘆“為什么總是比別人少想一步?為什么不多問幾個為什么?”
不過后來獨立負責一條業務線后,由于對業務框架和細節的了解都比較多,再加上有一定的經驗,慢慢體會到,數據思維是可以學習并且通過不斷反復演練而強化的。
所以,想要培養良好的數據思維,個人認為需要你學會建立嚴密的數據鏈條。如何理解這個概念呢?
做產品經理的伙伴都知道,你們在梳理業務的時候,都會用業務流程圖表明各個模塊之間的關系,伴隨著業務流程產生的數據,就是數據流,各個數據指標之間也存在先后和關聯,這就是我所說的數據鏈條。
舉個通俗的例子,電商行業最重要的數據指標GMV,那GMV是如何產生的呢?大家就可以構想下GMV產生的鏈條,以淘寶APP為例。
首先用戶打開淘寶APP(DAU,APP打開率),進入APP后,用戶可通過不同的入口觸達到商品。
目前淘寶的主要流量還是搜索,那從搜索切入,用戶在搜索框附近可點擊或者輸入,這里面可以細分用戶進入的途徑,比如通過點擊熱搜詞進入的,點擊歷史搜索詞進入的,或者輸入新的搜索詞進入的。
接下來,因搜索引擎會給用戶返回商品列表,用戶會瀏覽或者點擊,此時可以觀察用戶的瀏覽或者點擊行為在序列上的分布,從而了解到搜索詞的分發結構。
第四步,假設用戶點擊了排名第四位的搜索結果進入商品詳情頁(用戶點擊率、用戶流失率)。
第五步,用戶在商詳頁又可以進行各種操作,比如加關注,加入購物車,此時我們可以考察加購的比率。
第六步,用戶在加購之后可提交訂單,然后付款,直至最后成交。
從以上例子我們可以看到,看起來簡單的成交這個動作,可以拆解為不同的鏈條,每個鏈條上由于用戶的動作分支不同會伴隨產生不同的數據鏈條。
只有了解數據是怎么產生的,才能具備反向定位的能力。所以說,梳理業務邏輯,形成清晰的數據鏈條,是建立數據思維的重要一步。
2. 學會定義數據指標
另外,想要建立良好的數據思維,需要學會定義數據指標。數據指標的定義,是培養數據思維要闖的第三道關。
這么多年,我一直是做APP數據分析類的數據產品,對APP數據分析的指標體系比較熟悉,就拿APP數據分析中一些核心指標,給大家做個詳細說明。
(1)激活
大家是如何定義激活的?下載且安裝并打開APP的用戶數?根據定義,那下載沒安裝或者安裝沒打開的用戶,就不計入激活。
但問題來了,一個用戶下載且安裝并打開APP時,根本沒有登錄,他只是一個游客。那激活的定義就會變成:下載且安裝并打開APP的游客數。
如果我們把這個定義交給開發,開發可能會問,拿什么標識定義個一個游客?設備號,每臺移動設備都有一個唯一的設備號,也叫imei。
所以,激活的定義又變成:下載且安裝并打開APP的設備數,以imei作為唯一標識。
有人可能又會問,我更新APP后打開,或者卸載重新安裝APP再打開,算一個新的激活么?這就涉及到統計口徑的問題,一般來講,覆蓋安裝與卸載安裝后的打開,都不計入新激活。
(2)新增
如果把新增用戶定義為過去沒有安裝過的用戶,或者過去沒有注冊過APP的用戶。就這樣簡單粗暴的,把這個指標扔給市場部,恐怕市場部的同事不會答應。
市場推廣APP有多種渠道類型,比如各大安卓應用市場、Appstore、信息流廣告、SEO、流量互換等,每個類型下的渠道,可以用渠道ID來標識。
渠道有區分,APP自身也有區分。最省事的區分是Android包和iOS包。如果市場制作了大量的馬甲包、獨立H5頁,推向市場,需要以產品ID來區分產品(APP、H5)。
另外一個維度是APP版本號,每個版本發布時,市場可能會帶一波量,需要觀察版本新增用戶的推廣成本、轉化、APRU值等,我們可以通過版本ID來區分版本。
以上,通過渠道ID、產品ID、版本ID的區分和篩選,市場部的同事就可以知道,每個渠道下的每個產品的每個版本的新增用戶的規模和質量。
(3)活躍
活躍的定義很簡單,啟動了算一次活躍。但假如只定義一個日活,或者周活和月活指標,未免有點簡單粗暴,我們也可以先從轉化的角度進行用戶層級的劃分。
比如,一家金融公司,要拿公積金數據做授信,幫助銀行篩選優質貸款客戶,這些公積金數據,是用戶在公積金查詢APP上的關鍵行為留下來的數據。
整個使用流程有一個轉化漏斗:激活-注冊-查詢公積金-申請貸款,對應指標是:APP日活、用戶日活、公積金導入用戶日活和貸款申請用戶日活。
APP日活,以APP的一次打開為一個活躍,以設備號為標識,當日的重復打開不計入活躍。剩下的3種日活,以相應用戶群體的一次登錄請求為一個活躍,以用戶ID為標識,當日的重復請求不計入活躍。
跟蹤以上指標,能得到比單純的用戶日活指標更豐富的信息。
(4)留存
以前我們定義7日留存率時,內部就出現了分歧。按照友盟的定義,認為7日留存率指的是,新用戶在第7日的活躍數/新用戶數。
但也有不同意見的,會認為7日留存率應該是新用戶在第2-7日的活躍數/新用戶數。我覺得都沒有錯,為了和市場上保持統一標準,大家都會用第一種統計口徑。
留存率是APP推廣初期尤其要重視的指標。留存率低的產品,等于一個巨大的漏斗,市場砸錢買來的流量,在產生收益前,就都統統漏掉。
留存率有次日留存率,也有7日留存率和30留存率,至于選擇哪個留存率作為唯一關鍵指標,多少留存率為目標,要根據產品特性與市場環境作具體分析。
總結:擁有一定的數據基礎,建立嚴格的數據鏈條,學會定義數據指標體系,是建立良好數據思維的三部曲。
作者:大師兄,10年數據掘金者;專注互聯網營銷廣告領域,負責大數據商業變現和大數據業務架構工作。
本文由@一個數據人的自留地 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
數據思維不能用來解決問題,只能用來分析問題和驗證解決方案吧?比如增長黑客通過數據不斷的發現問題,提出改進方案,然后進行實驗,通過數據驗證改進方案,已經通過數據發現了問題所在,然后不斷通過數據深挖問題本質,最要想要解決問題,還是要開腦洞的吧?到了這一步數據思維還有用么?