以抖音留存分析為例,用數(shù)據(jù)分析改進(jìn)業(yè)務(wù)
很多想要轉(zhuǎn)行的同學(xué),甚至包括已經(jīng)從事數(shù)據(jù)分析行業(yè)的同學(xué),在學(xué)習(xí)數(shù)據(jù)分析時(shí),都會(huì)有一個(gè)困惑——到底怎么才能通過(guò)數(shù)據(jù)分析從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,我應(yīng)該怎么分析才能夠去改進(jìn)業(yè)務(wù),我好像只是在做提數(shù)的工作?
這種現(xiàn)象廣泛存在于很多數(shù)據(jù)分析崗位中,今天用一個(gè)case給大家分享一個(gè)一次完整的通過(guò)數(shù)據(jù)分析改進(jìn)業(yè)務(wù)的流程,希望能有所啟發(fā)。
某天,抖音的產(chǎn)品經(jīng)理發(fā)現(xiàn)最近新用戶的留存比較差,找到作為數(shù)據(jù)分析師的小李想要讓他來(lái)分析一下原因。
產(chǎn)品經(jīng)理:小李啊,最近新用戶的留存比較差,你能幫忙分析一下原因不?
小李心里想,臥槽又是這種問(wèn)題,我不想做啊,但嘴上還是說(shuō):好的,包在我身上。
01 新用戶的源頭在哪里?
小李接下了這個(gè)活后,苦苦思索思路,最后決定采用由上至下的思維方法來(lái)分析。
第一步,新用戶從何而來(lái)?
現(xiàn)在互聯(lián)網(wǎng)獲取用戶的方式多種多樣,但重要的一點(diǎn)是,大部分用戶的來(lái)源都是可追蹤的,在A、 B、C、D四個(gè)不同的渠道上投放廣告,來(lái)自不同渠道的用戶就會(huì)帶上對(duì)應(yīng)的標(biāo)簽,我們就知道用戶是從哪個(gè)渠道來(lái)的,這為數(shù)據(jù)分析提供了基礎(chǔ)。
基于由上至下的思維,小李決定首先分析不同來(lái)源的新用戶留存是不是有差異。假設(shè)小李通過(guò)數(shù)據(jù)分析發(fā)現(xiàn)不同渠道用戶的次留如下:
- A:50%
- B:48%
- C:46%
- D:20%
通過(guò)分析,我們發(fā)現(xiàn)了D渠道用戶的留存遠(yuǎn)低于其他渠道,這是一個(gè)結(jié)論,但分析到這里就結(jié)束了嗎?
當(dāng)然不是,告訴產(chǎn)品D渠道的用戶留存低雖然不能說(shuō)完全沒(méi)有意義,但作為數(shù)據(jù)分析師,你要告訴產(chǎn)品D渠道的用戶留存為什么低才能凸顯你的價(jià)值。
02 D渠道的留存為什么低?
定位到了D渠道的用戶留存低,下面就要分析D渠道的用戶留存為什么低。小李基于業(yè)務(wù)理解想到,不同渠道來(lái)的用戶在本身屬性上可能就有差別。比如在知乎上投放廣告,可能來(lái)的用戶就是新知青年、集中在一二線城市,而在快手投放廣告,來(lái)的小鎮(zhèn)青年就會(huì)比較多。
回到D渠道的分析上,小李基于業(yè)務(wù)理解作出假設(shè),是不是因?yàn)镈渠道的用戶畫像和其他渠道不同,所以導(dǎo)致了其新用戶留存低?基于這個(gè)假設(shè),小李對(duì)D渠道的用戶畫像進(jìn)行分析,發(fā)現(xiàn)D渠道相比其他渠道,五六線城市的用戶更多,而五六線用戶的留存率要低于一到四線城市。
03 五六線城市的用戶留存率為什么低?
小李在第二步發(fā)現(xiàn)了五六線城市用戶的留存率比較差,分析到這里就結(jié)束了嗎?當(dāng)然也不是,我們不能告訴產(chǎn)品五六線用戶的留存比較低,建議你以后放棄五六線城市的用戶,還需要分析五六線城市用戶的留存為什么差。
用戶畫像的差異最終會(huì)反映在app的行為差異上。用戶的畫像不同,其興趣偏好、對(duì)app的認(rèn)知可能就不同,最終就會(huì)導(dǎo)致其在app上的行為會(huì)有差異。到了這一層面,我們就需要分析五六線城市用戶的行為是不是和其他城市的用戶有差異。
那我們?cè)撛趺春饬窟@個(gè)差異呢?這其實(shí)是一種量化思維,需要選取一些合適的指標(biāo)將這個(gè)差異量化出來(lái)。
小李基于對(duì)業(yè)務(wù)的理解,想到在抖音上,影響新用戶留存很重要的一個(gè)指標(biāo)是新用戶刷到的前10個(gè)視頻的完播率怎么樣。
如果完播率高,側(cè)面說(shuō)明用戶喜歡抖音推給他的視頻,但如果視頻的完播率低,用戶的行為可能就是不停的刷下一個(gè)視頻,發(fā)現(xiàn)都不喜歡,就會(huì)覺(jué)得這個(gè)app不適合我,推的視頻我都不喜歡,大概率就會(huì)流失掉了。
基于這個(gè)業(yè)務(wù)理解,小李猜測(cè),五六線城市用戶的完播率會(huì)不會(huì)和其他城市的用戶有差異?
再基于這個(gè)假設(shè),小李分析了五六線城市和其他城市用戶的完播率發(fā)現(xiàn),五六線城市用戶的完播率較差,這是五六線城市用戶留存較差的一個(gè)重要原因。
04 為什么五六線城市新用戶完播率較差?
小李已經(jīng)發(fā)現(xiàn)了五六線城市用戶的完播率差,但分析到這里也沒(méi)有結(jié)束,小李還需要分析完播率為什么差,這也是最重要的一步,只有找到了完播率差的原因,產(chǎn)品才可以做對(duì)應(yīng)的策略進(jìn)行調(diào)整。
首先依然是依據(jù)業(yè)務(wù)理解嘗試做出假設(shè)。大家都知道抖音是基于個(gè)人興趣進(jìn)行個(gè)性化推薦,但是對(duì)于新用戶其實(shí)算法不知道他的興趣的,所以一般會(huì)選一些全站熱門的視頻進(jìn)行推送,比如美食、寵物等,再基于用戶的反饋快速學(xué)習(xí)。
有了這個(gè)業(yè)務(wù)背景,小李做出假設(shè):五六線城市新用戶的完播率差是不是因?yàn)椴幌矚g一開始推給他們的視頻?如果不喜歡的話那么他們喜歡什么樣的視頻?是所有類型的視頻完播率都差嗎?有沒(méi)有完播率比較好的視頻?
基于上面的假設(shè),小李繼續(xù)去做分析,發(fā)現(xiàn)五六線城市的用戶對(duì)于偏下沉的視頻完播率較高,但是對(duì)于其他類型的全站熱門視頻,比如美食、旅行的完播率均較差,而現(xiàn)在五六線城市的新用戶激活時(shí)推薦的又是他們不喜歡的視頻,更符合一至四線用戶的口味,所以導(dǎo)致了完播率較差,又進(jìn)而導(dǎo)致了留存率差。
05 基于分析對(duì)業(yè)務(wù)做出改進(jìn)
小李有了一個(gè)重大發(fā)現(xiàn),五六城市用戶完播率差的原因是因?yàn)槔鋯?dòng)推送的視頻不喜歡,進(jìn)而導(dǎo)致了他們的留存差,在產(chǎn)品上,就可以基于這個(gè)發(fā)現(xiàn)在策略上做出改進(jìn)。
小李提出了對(duì)不同地域的新用戶,應(yīng)當(dāng)采取個(gè)性化冷啟動(dòng)的策略,對(duì)于五六線城市的用戶,一開始推送的視頻應(yīng)當(dāng)更加下沉,而不是現(xiàn)在的推送全站熱門視頻的策略。
基于小李的建議,產(chǎn)品經(jīng)理調(diào)整了五六線城市新用戶冷啟動(dòng)的視頻推送策略,調(diào)整后新用戶的留存絕對(duì)值上漲了5%,產(chǎn)品經(jīng)理大喜過(guò)望,并決定當(dāng)天晚飯給小李加一個(gè)雞腿。
06 結(jié)語(yǔ)
再梳理一下小李的分析鏈條,我們發(fā)現(xiàn)小李的分析方法是由上至下,層層剖析,從一開始發(fā)現(xiàn)D渠道的留存差,到最后發(fā)現(xiàn)四五線城市用戶不喜歡現(xiàn)在冷啟動(dòng)推送的視頻才是新用戶留存差的真正原因,數(shù)據(jù)分析就是要從數(shù)據(jù)波動(dòng)的表象中,發(fā)現(xiàn)問(wèn)題的本質(zhì)。
并且大家可能也注意到了,小李對(duì)于每一個(gè)問(wèn)題,都是先基于業(yè)務(wù)理解做出假設(shè),再通過(guò)數(shù)據(jù)去驗(yàn)證,這是一種業(yè)務(wù)先行的思維方法(與這種方法相反的,是先分析數(shù)據(jù),通過(guò)數(shù)據(jù)發(fā)現(xiàn)再反推業(yè)務(wù),這兩種都是常用的分析方法,有機(jī)會(huì)再做講解)。
新用戶的留存差,那么新用戶是從哪里來(lái)的?是渠道,哪個(gè)渠道新用戶的留存比較差? 留存較差的渠道的用戶畫像是什么樣的?什么類型的用戶留存差? 這類型用戶的留存為什么差?在app上的行為和留存好的用戶有什么差異? 行為差異的原因什么? 基于這個(gè)差異的原因,如何在業(yè)務(wù)上做出改進(jìn)?
通過(guò)上面的分析,我們就完成了一次通過(guò)數(shù)據(jù)分析改進(jìn)業(yè)務(wù)的閉環(huán)。
在現(xiàn)實(shí)業(yè)務(wù)中,原因往往不會(huì)像case里描述的這樣簡(jiǎn)單直接,可能你想了幾十個(gè)假設(shè),分析了幾十個(gè)維度在數(shù)據(jù)上也難以驗(yàn)證,并且在策略的實(shí)施上,也需要考慮更多的因素,比如要給五六線城市用戶推送下沉視頻,那么我們現(xiàn)在的內(nèi)容儲(chǔ)備能不能滿足這樣的需求?我們有沒(méi)有足夠的下沉視頻給用戶推送?如果沒(méi)有的話是不是要培養(yǎng)出一批這樣的內(nèi)容生產(chǎn)者?這就是更深層面的問(wèn)題了,這也是數(shù)據(jù)分析的魅力所在。
作者:阿倫;公眾號(hào):阿倫的數(shù)據(jù)分析之路
本文由 @阿倫 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
受益匪淺!
感謝分享。
簡(jiǎn)要的進(jìn)行總結(jié):留存率低–》分渠道–》哪個(gè)渠道表現(xiàn)最為差勁:試圖找到該渠道和其他渠道組的用戶差異,建立用戶畫像–》解決為什么問(wèn)題,提出假設(shè)并驗(yàn)證假設(shè),是否是由于冷處理推薦的內(nèi)容不喜歡導(dǎo)致完播率低,接著驗(yàn)證,哪類視頻對(duì)于該渠道的用戶來(lái)說(shuō)更為感興趣、有較高的完播率,與大眾推薦視頻的完播率進(jìn)行比較,若是,則可推出推薦內(nèi)容不被用戶喜歡,需要優(yōu)化該方面(業(yè)務(wù)改進(jìn))。
從問(wèn)題一層層由上至下剝絲抽繭,找到問(wèn)題根源,最關(guān)鍵的環(huán)節(jié)是為什么,需要提出不同的假設(shè)在數(shù)據(jù)中得到驗(yàn)證,并支持業(yè)務(wù)改進(jìn)。