騰訊譚安林:大數據賦能數據增長
7月14/15日,由人人都是產品經理重磅打造的「2018中國產品經理大會 · 深圳站」完美落幕。來自騰訊行為預測負責人@譚安林老師給大家分享《大數據賦能,助力數據增長》話題。
分享嘉賓:騰訊行為預測負責人@譚安林
本文為嘉賓現場分享總結整理內容,由人人都是產品經理社區@Foina 整理,編輯有修改:
今天,我想給大家分享一下,在做數據產品這條路上,有怎樣的一些思考和實踐,以及希望能夠給大家帶來一些數據增長的啟發。
一、TO B 和 TO C
其實,騰訊有一個很好的一個基因,就是to C,比如:QQ、微信。但其實還有一些產品隱藏在后面——to B的產品。
以前的to B的產品,外界沒有太多聲音,如:騰訊大數據。我們的一些大數據套件,基礎的平臺能力,一直是在輸出給其他的各個BG等的業務線,比如:QQ、微信、騰訊視頻、其他的一些快報。
那我們一直在考慮一個方向:要怎樣把平臺數據服務能力,從外面進行開放?
這里面會遇到一個問題:我們不僅是比較了解C端的用戶,在多年內部的支撐的情況下,我們也很了解B端的用戶。
- C端的用戶,他更多的希望滿足他的某種體驗上的需求,比如:聊天、交友、發朋友圈。他只是為了分享一些信息,獲得一些成就。
- 而B端的客戶,他是做一個效率的增長。我們要如何減少人力的投入,提高生產效率,花更小的代價去得到更好的流量。
那么,我們會對to B的產品去做一些深入研究,但我們會面臨一些困境——一個to B的產品,要怎樣把它做成可復制、可克隆的,而不是一個case?
但是,我們的客戶其實是to C,那他們想要什么呢?
他們想要的是流水/流量的增長,他們需要去判斷一個用戶,而我們需要去幫助他們——把用戶價值體現出來,發現更高價值的用戶轉化。
大家經常在朋友圈看到一些廣告,其實這些廣告其實是有定向成分。
比如:要結婚的人,他可能會看到一些婚紗攝影;要買車的人,他會看到,如:車險、寶馬、奔馳等這樣的廣告——這背后隱藏了一個to B的一個產品,就像微信廣告平臺一樣。
所以我們會去接收B端用戶的需求,尋找一個高價值的人群,再去做定向的觸達,來提高B端的用戶的轉換率。
目前,中國的互聯網市場已經進入了存量市場,整個活躍的大盤是在12億左右。
但我們在這種情況下,我們也會去思考——怎樣去盤活這些大盤的這種用戶,給客戶去尋找一些價值點?
兩條出路:
- 一條的話是出海:像印度東南亞這些市場,它還有人口紅利的增長,還是一個增量的市場,還有很大的一個空間。
- 另一條是精細化運營:用最小的成本去做最好的一種流量。
二、精細化運營
1. 產品運營周期
這里面就會遇到一些問題:每一個APP都是一個數據的孤島,要融合起來才會是一個大數據。就算你的數據有百萬,有千萬,都只是在某一個領域、某一個方向的數據。那么,你要去完整、有效的刻畫一個用戶是非常難的。
但大數據是什么呢?
平常大家會用到的買C口,或者類似的關系型數據庫,進行數據的存儲。等數據量變得更大,買C口存不下去了,那就說它是大數據。但其實這個理解也不是錯的,可能沒有那么準確。
那怎么定義大數據?
它的數據量非常大,但是很多數據無法有效去衡量它的價值,不能直觀的去進行使用。比如:我們自己的一個數據,它有可能80%的數據是無法理解的,只有20%的數據能做一些提取,再進行使用。
在大數據的基礎之上,才有數據挖掘。
在PC互聯網的時代,用戶的體驗會比較差,營銷方式上更多的是一種轟炸式廣告。
而現在的C端用戶,他們都不是小白用戶,會對用戶體驗有更多的要求;而如果我們還是一種轟炸式的廣告,不僅營銷預算會浪費,還會讓用戶投入了競品的懷抱。
舉個例子:在做運營的時候,我們需要對新用戶做一些預估,去判斷他對哪方面的內容感興趣;對我們老用戶,要做一些洞察,去發現哪些用戶是值得去做營銷轉換。
對現有的客群深入的分析之后,才能知道我們的產品真正轉化、消費的群體是哪些,根據這些用戶,再去進一步的把盤子擴大,去做潛客的挖掘。
2. 尋找靠譜流量
那我們要如何去尋找靠譜的流量來做推廣營銷呢?
這時就會有各種各種的媒體渠道,但判斷一個媒體它是好是壞,最簡單的辦法是——轉化。但是轉化這里面有一個陷阱,適用哪種轉化?
假如:我們是一個APP,我們的轉化是拉新的轉化還是付費的轉化,這兩個場景是不一樣的。
舉個例子:我們在幫助客戶做數據增長的時候,一開始說是做付費的轉化,那我們給你們做付費挖掘出來的人群,會發現評估后它的效果非常的不好。
但是再看后面的轉化的效果,它是比較好的。
在這里面的話,我們對轉化的定義會有比較多的一個衡量點,要看我們當前產品是處在哪個階段——是處在需要有更多的活躍用戶,還是處在一個就是追求營收的階段?
回歸到靠譜的流量、靠譜的渠道。
在市場上,有三方監測的工具,大家可以去進行使用,比如:品牌效果監測,或者是效果廣告檢測。在這里面,好的媒體,惡意流量可能在10%以內;但是比較差的,它的某些惡意流量可能在60%,甚至是70%,這都是有可能的。
還有一些其他的方式,比如:一些反作弊工具使用,但這樣你的整個評估都會比較滯后。
轉化,其實是付費的轉化。這樣的一個戰略的轉化,可能是一個月甚至三個月,才會有一個效果的數據。
3. 轉化漏斗分析
這是一個轉化漏斗的一個分析,做產品、運營時,都會用精細化的轉化分析。
以數據產品為例:面向to B的APP用戶,投了廣告之后,用戶從官網到最后我們的成功上線,它是有個過程的,每一個環節它都可能流失。
那么,我們是一般怎么去做內容?
我們會基于用戶行為的路徑,加上他的畫像來進行分析;這兩個方式不能解決的時候,我們需要去跟蹤問題,去發現它流失的真正原因。
那如果我們的數據不多,但用戶量會比較大的時候,去做轉化漏斗的分析就會存在一個問題——人力成本會比較大。
假如:你有多個商品,你再看每個商品的轉化的路徑分析,那投入的成本會非常巨大。
4. 數據建設之路
做數據化的運營,不管是說大小的公司,都會經歷這樣一個路徑。
(1)第一個階段:基礎運營分析
我們要明確每一個階段的指標,在當前的階段要做是DAU還是營收。那我們要有:數據支撐、數據采集、APP打點,到最后產品化的一個數據。
(2)第二個階段:數據挖掘的應用的階段
這個時候,要投入更大的人力成本,比如:十個人、20個人的一個團隊,會包括數據分析、后臺開發,還會包括算法模型的同學。那么在這個過程中,需要去構建很多的標簽,去建模型,最后進行應用產出。
但這里會有很多的坑,如:標簽,你要知道是怎樣去構建哪些標簽;模型,你要去選擇應用的場景,要選擇哪種標簽把它融入進去,還是要做標簽的裁剪。
三、行為預測
1. 核心問題
行為預測,是預測一個用戶它發生某種行為的概率。我們目標是——精簡我們客戶的數據工作,提升產品的效率。
那么,我們會預測哪些用戶的行為?
當然是根據B端用戶的需求。
如果說客戶關注的是當前的池產品,那我們會去促成會員的一個轉化,我們需要知道哪些用戶是更容易開通會員的。而會員會也分好幾種,如:鉆石、黃金、鉑金這樣的一些等級。
那他會更對哪一個更感興趣?
其實做產品運營,都面臨的一個核心問題——哪些用戶值得去重點培養?哪些是高價、高凈值的用戶?
因為只有了解用戶,才能做針對性的運營。
那我們要怎樣去了解用戶?
我們需要去做用戶洞察——也就是數據分析、畫像分析能力。
在做用戶的分析洞察時,會持續的去構建特征。一開始我們不是按照這種分類、分層的方式去做,而是一二十個數據分析的同學畫一個方向。
比如:這個APP,它行為和興趣會按照垂直的方向去畫,但這樣會導致在算法使用的時候會比較亂,會不知道這個特征和其他的特征有沒有關聯性。在具體使用的時候,需要做一個篩選,但這個成本非常巨大。
那在后面分工上,讓大家專注于我們主要的分類目,來進行一種分工,然后再分類目之下,再進行通用行業以及場景化個性化的一種處理。
2. 標簽挖掘分享
大家可能會比較關注是——我們的標簽會有多少?
會很多人說,我們有上萬維的標簽,打寬或泛化之后的話,是有十萬維甚至是百萬維。
其實,本身原始的標簽庫差不多也是有上萬維,那打寬之后的話,也就只有萬維——但并不是說這些標簽、模型都可以直接拿去使用。
我們實有上萬維的這種標簽,在某一個行業、某一個具體的場景下面,可能就只用了800維900維——因為在實施的過程中,要去做的一些裁解。
那我們去刻畫一個人,要刻畫到什么樣的程度,才能識別出他當前的人生狀態?
比如:她是30歲的一個女性,已婚,從事的是金融行業,喜歡奢侈品、健身——那從這些維度是可以識別出來的,這是她的一個基礎屬性,但具體要落地到她是否會開通會員,其實還做不到。
那我們就會結合第一方APP上報的一些行為的數據,兩方來進行融合,提供這種場景化個性化的這種特征。如果對數據有了解,就會知道數據在比較少的情況下,效果會比較差。
在這里,提供了三種方式的合作模式:
(1)提供一個線索包,然后進行打分
這種方式,會在線索包里做一個過濾,判斷出來哪些用戶值得去做精準化廣告投放。因為廣告投放平臺,它的流量越來越貴。
假如有一個一百萬的包,全部去投的話,成本是比較大的;如果這100萬包里面,篩選出來30萬,這30萬是比較有價值的,然后也更容易轉化??赡苣阃读?0萬,但達到的效果跟100萬包差不多。
(2)線上新增的用戶
比如:你一個用戶來了你的APP之后,數據會比較少,會很難發現他的意向、意愿。在這個時候,常規的做法是讓他沉寂一段時間,他這個APP用一段時間后,再去看他們有什么樣興趣、偏好。
那在這個過程中,數據要積累到一定的程度才能去刻畫??赡苄枰獌芍堋⒁粋€月甚至三個月,要看用戶的操作頻次,以及看他對我們內部哪些內幕感興趣。
在這里就是把評估提前,只要用戶來了之后,就可以根據他的這種設備相關的這種指紋信息以及它這種環境的信息,再加上我們已有的大盤的脫敏標簽庫,來進行一個評估,判斷他是不是我們某一類的開通會員。
這種場景下的用戶,是不是付費某一個產品、某一個商品的用戶。做到這種程度,渠道質量的評估也可以納入進來,在這里做一個提前的這種預估。
(3)用戶的分群
去重點群體的挖掘(留存用戶),要花費比較多的精力,我們要確定怎樣去把這些用戶進行盤活,哪些用戶能帶來營收上的增長?哪些用戶可以帶來分享或其他一些渠道帶來的新的流量的增長?
但APP本身會因為數據孤島的問題而變得很難。
我們結合大盤的一些特征和用戶在APP上面的行為特征,去做一個精準化的刻畫:
本來一個用戶在過去到現在他已經買了某個商品,這時候我們已經獲悉了他的特征,我們再用結果去反向預測當時的情況,就會出現問題。
所以,我們建立了回溯機制——就是說某一個客戶他提供給我們的樣本,假如說:今年3月份的4月份的,那我們只用這3月份4月份的特征去做模型的建設,再用它現在的特征去做預測,這樣就可以達到模型上的可適用性。
我們也提到上萬維的特征,在具體落地的時候,不知道哪些特征會有效。
在這時候,就需要先進行一些大量的相關性分析,讓重要性的分析根據線索的人群去做。
在這里,會涉及到重復性的、大量的、人工的一些實踐過程中的開銷。如果我們的新客戶提供的樣本比較少的情況下,就算做了一個建模,把其他的特征做了很大程度的優化裁剪,它的每一個效果都不好。
我們一個比較大的一個樣本,那它就會有比較好的一個點擊數,它可以更深的刻畫我們一個群體的特性。我們也會對客戶的一些樣本數提供一些要求,但其實很多這種APP,它是一個逐步從零一到1,再從1到100的過程,有很多數據是沒有的,那么我們就是提供一些通用性的數據。
3. 案例介紹:網貸行業
這里分享一下網貸行業,大家會經??吹揭恍㏄2P的一些新聞——某個公司就倒閉了、某個創業合伙人跑路了。
其實根本原因是對風險的一個控制,對風險的一個承受能力。在這里其實也基于逾期行為的預測,去判斷一個用戶他是不是可能會逾期,甚至是不還。
大家會發現:在不同的行業上,有不同的訴求;不同的場景下,它是有不同的模型要求。那就需要一個一個行業的去探索相關場景化的一些標簽、一些解決方案。
但對某一個行業,提供了相應的解決方案之后,這個方案是可以復制的。當然,這種復制,是把解決方案的能力進行復制,針對于不同的用戶它的數據不一樣,它的模型效果會有一些差異。
而且在網貸行業,我們會發現:同樣的網貸場景的客戶,他們提供的樣本是不一樣的,有些他們可以提供帶錢的樣本,沒有經過任何風控、任何人工干預,就是自然的一種流量上的放款。這種的話效果會比較好,因為沒有其他人工的干預。
那么還有一種是——貸后樣本,它經過了其它的反風控的規則或者黑名單的過濾。那在這個過程中,它相對那種單純模型而言效果會比較差,但是在實際使用上面的效果,不見得比上一種差。
4. 安全思考設計
我們會提到一個數據安全問題,我們提供給to B的用戶to C的這種預測,那我們把我們的產品模型構建好之后,等著我們用戶來接,然后客戶他說:
“唉,我把我司數據給你之后,我的數據不安全?!?/p>
這種被動,應該怎樣解決呢?
- 比如:我們的教育行業張三,他看了李老師數學的課程,這個課程,我們會進行數據的脫敏,讓我們的B端客戶覺得這個數據是比較安全的,但是客戶不知道它的具體的一些信息是怎么做。
- 比如:數學的具體內容信息,對它進行數據脫敏,但不是把00001變成0002,這樣是沒用的。所以客戶將張三標記成0001,但我們不知道這個標號是什么。對我們來說,我們只能拿到一部分行為的內容數據,但并不知道用戶的隱私數據。
但其實可以減少很多不符合客戶需求情況,就如:我們預測某一個用戶,他是否會去開通會員。
四、精準觸達
1. 信鴿移動推送
那在這里,介紹一個移動的推送信鴿,在我們內部,推送信鴿其實持續使用了很多年。像王者榮耀,我們持續保航,在五分鐘內,可以向王者幾千萬用戶推送過去,這是一個有相應性能的產品。
在這里,我沒有強調畫像的能力,我們可以去做一些精準觸達,比如:我們APP有百萬級用戶,我們有很多這種群體,我們想把某一個運營信息單獨的推薦給年輕、喜歡健身的女性,那我們可以做到這一點。
2. 更多精準觸達
當然,數據產品,其實大家一般都會畫圖。
- 第一層,是做地方的數據融合,加上內部的畫像。
- 賦能第二層的話,會進行標簽的工具特征,然后進行相應的模型選擇。模型的選擇,需要去判斷在線的分類模型,還要根據實際的特征,去用到CN或者RN這樣的一些模型。
這其實就是一個服務落地,我們最根本的一個營銷是——一個用戶的分群,是以什么樣的理念去分群。
最后就進行一個就是小步實驗,簡單來說可能是一個A/B test。在我們內部的話,會是實現一種分層的實業邏輯,再往上的話,我們的場景運用,是具體某一個行業的方向。
以上為嘉賓分享內容。
相關閱讀
雖然很多人都被點名,但很少有人被選中|2018中國產品經理大會深圳站現場報道
本文為嘉賓現場分享整理內容,由人人都是產品經理@Ella 整理,編輯有調整
未經本站許可,禁止轉載,謝謝合作
- 目前還沒評論,等你發揮!