在“2013中國技術商業論壇暨領袖峰會”無數據不互聯專場,騰訊云數據分析中心總監傅志華講述了,騰訊如何利用用戶生命周期管理辦法幫助產品經理做精細化運營。
【用數據管理你的“用戶生命周期”】
騰訊的精細化運營是如何貫穿于整個產品過程中的?
騰訊用到一個很重要的方法,即用戶生命周期管理辦法。這也是社交網絡事業群正在力推的一個很重要的方法論。
什么叫用戶生命周期管理?傳統營銷學講的是客戶生命周期管理,因為騰訊社交群主要客戶就是用戶,所以我們叫用戶生命周期管理。但是傳統的對應的理論是客戶生命周期管理,簡稱CLM。《王永慶傳》提到一個一個米店老板怎么做生意,他每天會收集顧客用米的情況,包括家里有多少成員,然后能估計到他每天吃多少米,然后推算出這個家庭什么時候能把米吃完。比如買10公斤大米,估計是半個月,到快吃完時,他就會主動送貨上門,或者主動打電話。他用這種辦法贏得了客戶。很快他的經營網絡就超過了其他店。
再比如一個游戲數據圖表,橫軸是游戲用戶使用時長,縱軸是活躍用戶量。第20軸到25軸用戶分兩波,有60%的用戶活躍用戶量下滑得比較明顯,還有一波用戶是相對保持。所以,就是說用戶在使用一個產品時是有一個新鮮感期,過了這一段時間以后,他感覺就會下降,甚至會流失。比如像這款游戲,在第20軸到25軸的流失風險非常高,60%處于高流失風險的狀態。再看很多網頁應用或者一些手機APP,它的拐點會更早出現,使用這個業務一到兩個月就可能會處于高流失風險的狀態。我們通過數據怎么快速定位?如何預計這些用戶的流失以及幫到產品經理理解它為什么會流失?建議他在產品運營時要策劃什么樣的活動?
這是一個完整的生命周期管理圖,整個周期里面可以分為幾個大的階段,一個是萌芽期、成長期、衰退期等。我今天主要聚焦在兩個階段,也是騰訊認為最容易出效果的。因為我們工作都有KPI,我們的KPI是通過數據能夠幫產品經理帶來收入,或者帶來活躍用戶量。
上述游戲案例其實是一個真實的應用。這個應用在橫軸是加入應用的時間,縱軸是人均操作次數,即用戶活躍度。從這個線能看到,這些用戶在購買這個業務前肯定有很多免費的操作才能刺激他購買這個應用。他打算購買前,活躍度突然變得比較高,他購買后,活躍度開始迅猛地增加。
有很多產品的價值傳遞不一定非常到位,所以我們往往看到很多產品在第一個月和第二個月的流失率非常高。因為作為一個新用戶,如果你的新手教程做得不是很好,或者你的產品不是簡單易用,你認為你有很多的價值點用戶沒有感受到,可能就會流失,而且這個比例非常高。所以,我們會聚焦在幫產品經理去研究說什么樣特征的用戶在這期間會流失得很快,然后我們把它定位出來。定位出來以后,我們要知道它是由于什么樣原因想離開這個應用,或者想離開這個游戲,做快速預警。
【如何利用大數據分析進行精準定位】
另外一個階段是拉新階段,比如有的產品經理想快速發展新用戶,我們用什么樣的數據支撐讓它更精準定位到用戶?
目前,我們將新應用的用戶高流失預防暫分兩個階段。
我們有很多歷史數據可以學習,即什么特征用戶有可能成為新用戶。這個數據以及它的各種可能性的特征我們都可以采集到。然后我們再用機械學習的辦法——主要用“決策樹”的辦法研究什么特征的用戶能夠成為新用戶。比如買房用戶,如果小孩有四五歲時他還沒有房,而且又有一定的經濟能力,他是不是擁有很強的買房需求?這里有很多特征和他購買的驅動力非常相關。
我們通過500多個字段預測用戶下一階段的轉化率?!皼Q策樹”是得到一個知識樹的結構,我們找了比較重要轉化率較高的幾個樹枝去做運營,比如將潛在用戶劃分成七類用戶,每類用戶的轉化率、它轉化概率跟普通用戶的轉化率的倍數都知道。知道這個特征以后,就可以定位這個用戶,然后把這個用戶對應的ID給到產品經理,比如這里面有三群很重要的用戶,轉化概率又比較高,而且我們知道他喜歡什么?
因為“決策樹”能識別出他的特征出來。這可以建議你對這些用戶,比如他喜歡玩虛擬空間裝扮,你的業務又剛好對應這個,你就可以策劃一些活動,拉動他沖動性消費,他就更容易購買這個業務。
剛才我說到500多個變量,500多個字段里面,最后有用的可能也就10來個。有用的10來個里面,很重要的發現是斜率型的變量,或者增長型的變量很重要。
這個是什么概念呢?比如我要買車,我可能在買車前一個月突然會對汽車類的網站,或者汽車類論壇的瀏覽量可能比前幾個月流量要多得多,這很正常。流量的突增其實意味著我有更明顯的購買意向。因此,我們在設計變量時,除了常規型、狀態型統計變量和簡單的統計量,還要考慮設計一些增長型變量。增長型變量其實在預測用戶在轉化過程中更有效。
這是我們在拉新階段用到的一個方法,又是防流失的一個辦法,還是用特征識別的辦法識別有哪些特征的用戶流失的可能性高的一個辦法。
比如這里面是一個決策樹的案例,用戶在使用背景音樂盒每周的操作次數少于1.5次的時候,他的流失可能性達到30%。另外,如果說他每周使用都不到1次,它的流失可能性將更高,達到65%。所以,它是有一個規則,簡單寫一個SQL就能把這個用戶找出來。假設這個條件,同時滿足這個條件的用戶能篩選出來,而且我們知道流失的原因。是因為音樂盒的操作次數變少還是別的什么原因。然后,我們有針對性地在這方面做活動或者做一些文章,讓他更多地體驗這個業務的一些價值點。處于高流失風險狀態下的他很可能就會流回來。
另外一個是我們每周都會給對應的用戶ID打分,它這周28分,下一周39分。哪一些用戶會接觸它呢?一是流失分數超過10%,即第二周比第一周的流失風險要高于10%,第二種是絕對值大于40%的流失風險,這兩個用戶我們都要把他定位出來,完后要做相應的產品改進,或者對他們做一些促銷,或者一些產品運營活動。從決策樹上,我們可以看到哪些方面是用戶的主要誘因。這是我們產品的一個效果。我們做特征識別以后,點擊率比產品經理平常拍腦袋做的點擊率都有不同程度地提升,比如75%,88%等,甚至有的達到翻倍地提升。
做完這還不夠,比如音樂盒的操作小于1.5次,每周大盤的使用情況不到一次,這些規則可以通過數據挖掘算出。
另外,我們定位的每一波人群固化下來,剛才我們看到七類用戶,其中三類用戶是比較重要的,我們就可以把他固化下來,只要他滿足這個特征就可以把他歸類到這類用戶里面,產品經理也對他們做了有效的活動,把這個有效的活動規劃下來。如果用戶來到這個應用,他滿足這個條件,我們后面就可以自動化推薦這個活動。這樣,產品經理就不用苦于說我經常要分析我的用戶流失情況是怎么樣,我的用戶流失怎么定位等,這樣就節省很多煩瑣的非常專業性的事情,它就可以去更聚焦在他的產品創意上,數據挖掘就更聚焦在準確度上。
上述方法論其實也固化在我們給到開發者的一個工具上面,叫騰訊分析和移動分析。在這兩個工具上我們做了數據的儲備,包括4000多臺數據的集群,包括每天新增100TB的統計數據。我們在用戶里面已經可以達到10秒的延遲,在外部給開發商可以更高,而這這是開放的一個里程碑。
源:36dsj
500多個字段來預測,我的天啊。。。
他說的應該是用戶的屬性標簽500多個
我就是來入門的~