前LinkedIn高級總監張溪夢:6個步驟,學會數據驅動產品的秘訣(附PPT及思維導圖下載)
作為前LinkedIn的首位做變現盈利的數據科學家,張溪夢負責的業務就是如何能用數據分析來增加銷售,促進產品的研發效率、做更好的風險控制等。這個世界上第二大的B2B的云端軟件企業,每年的銷售額從七千萬美元躍升至將近30億美元,一個重要的推手就是數據的幫助。那到底怎么樣才能用數據來推動產品優化呢?
3月10日,起點學院特邀GrowingIO 創始人 ,前LinkedIn美國商業分析部高級總監@張溪夢做客免費在線講座「起點學院公開課」欄目,分享通過6個步驟,教大家學會數據驅動產品優化的秘訣 。
嘉賓介紹:
張溪夢,GrowingIO?創始人兼CEO?,前LinkedIn美國商業分析部高級總監
美國Data?Science?Central?評選其為“世界十大前沿數據科學家”,親手建立了LinkedIn將近百人商業數據分析和數據科學團隊,支撐了LinkedIn公司所有與營收相關業務的高速增長。
以下為分享正文,由人人都是產品經理團隊@張婷 依據嘉賓現場分享內容整理,編輯有修改:
一、什么是數據?
數據有四個屬性:時間、地點、人物和事件;舉個例子,在電子商務這個環境里,假設分析一個交易數據。這個交易數據在時間上,它必須有一個時間戳,這個數據必然會在某一個地點發生,還有對應的交易者,在事件的級別,消費者要購買某種產品,花某種價格,通過某種支付手段,進行交易。所以說,這是一個事件。真正的用戶的行為,往往都是以事件為核心的數據點。這些數據點,會造成一個整體的事件流。
二、數據的幾何級數增長
舉幾個例子,像LinkedIn這家公司每天大約會產生100億條事件;通過用戶行為產生的事件,在不到5年的時間之內,咱們全球大約會有40億的人每天會產生大量的數據,同時,它是一個4萬億級別的市場;在全球范圍內,將近有2500萬個app誕生,不但有針對普通用戶的app,還有對企業級服務的app;另外會有將近250億活躍用戶的各種設備將會接入我們的網絡;最后,每年將近產生5萬億GB的數據。
三、什么是數據分析
1、數據分析的基本概念
數據量這么大,呈爆發式增長,它的價值曲線,數據量,數據設備數,人的關聯度不斷增加,但這并不表示數據本身能夠帶來價值,真正的商業分析的核心,是通過5個步驟不斷把低價值的信息或者數據變成高價值的產出。一般數據分析可以分成5個步驟。
- 了解以前發生了什么;
- 分析為什么會發生這件事;
- 觀測目前正在發生什么事;
- 預測未來將會發生什么;
- 全局優化。
前四步是數據分析中的基礎步驟,包括數據預測,它本身并不能產生太大的價值,只有通過全局優化,才能產生有價值的產出。
2、數據分析的發展歷程
對于產品經理來講, 數據可以作為產品優化的依據,比如交互、留存。實際這一切都是基于對數據基礎的理解,在過去的5年,數據框架在技術的推動下,有幾次主要的迭代時期:
- 第一個時期:數據庫和數據倉庫的時期。傳統的公司都使用數據庫或者數據倉庫來存儲數據,他們應用一些數據庫管理工具獲取數據,再通過一些經典的BI軟件,比如Cognos或者Businessobject進行數據可視化,形成報表發給管理層。一般對于這些數據,只有管理層決策層才使用。這個階段發展了將近15–20年。
- 第二個是我們現在所處的階段,至少在過去的五年,數據量呈爆發式增長。數據研究者開發出了一套分布式的技術,這套技術以Google和Yahoo為代表—-Google table和Yahoo的Hadoop,它能處理大量的半結構化數據,然后通過分布式的方法,能并行地計算處理很多信息。
Google和Yahoo的辦法增加了數據處理的容量,大大降低了數據庫的成本,分布式技術將數據庫的技術提升了一個層次。以往數據分析只能支持幾十個人的決策,現在能夠支持幾千甚至上萬人的決策。它使得數據分析從一個非常貴的、緩慢的流程變成了一個有效的、價格相對較低的層次。
但這其中還有一個問題:以往的軟件都是比較結構化的,很多人都可以使用。但是Hadoop這種大數據結構,很多人都很難用,這就造成很多技術性瓶頸。具體體現在:
- 數據收集來源增加,文件收集復雜性提高。
- 對工程能力操作感各個公司拆解很大。
3、數據分析驅動產品設計的意義
如果能夠用好數據分析公司,會產生一種戰略性優勢。用不好數據分析的公司,在發展上則會產生很多瓶頸。
在現在的美國和將來的中國,要想做好一個產品經理、設計師、產品運營人員。核心不再是依靠分析師來分析數據,而是能夠熟練地應用各種企業級應用,來達成數據驅動產品的手段。
如何利用數據驅動產品設計?
- 必須要有數據驅動產品設計的意識,這個意識已經被美國的Facebook、LinkedIn證明;
- 善于觀察用戶的行為,用戶的行為是不會說謊的,用戶的行為往往能夠反映出用戶對于產品的容忍度和熟練度;
- 我們要很聰明的用技術做決策;
- 今天的企業已經由流量型向用戶體驗和產品設計方向迅速進化和衍化。這種進化和衍化的結果就是:每一個企業,不論大小,都需要用精益化運營的思維做好產品。
互聯網已經從web2.0進化到web3.0,意味著流量為王的時代已經結束;這樣的形態下,企業往往不注重流量的轉化,而在乎流量獲取的速度。而在今天這個時代,一個企業如何能夠在一定時間內快速地對用戶進行轉化,增加用戶的體驗,增加用戶的留存,這是當代互聯網產品的核心。
四、如何通過數據分析驅動產品設計
精益化運營
精益化運營不得不提的三個指標—轉化率、用戶的活躍度、用戶留存率。這三點組成了一個產品最基本的一個骨架。
以往我們談論的都是流量:你有多少用戶,多少活躍度,僅此而已。但今天來說,那些粗淺的指標已經不足以衡量產品的優秀。一個好的產品,我們首先要關注的是用戶的留存率和用戶粘度。在傳統互聯網企業,用戶的留存率和粘度一般是后期才會關注的;但是在今天,在產品設計的早期,我們就需要關注這個指標。這個指標可以細化成5個不同的點:
- 能夠通過非常簡單的方法讓用戶知道這個產品的價值;
- 產品使用的流暢度。今天產品設計的思路已經演變為流式的設計,一步步引導用戶如何使用你的產品,降低用戶的使用門檻很重要;
- 產品的區隔。這也是精益化運營的思維。不知道大家在平時做產品的時候有沒有考慮到用戶是可以分成不同的屬性,同樣的產品,針對不同的用戶應該有不同的功能點,不同的體現,這就要求產品經理和運營人員花足夠多的時間去了解這些不同的用戶對產品交互的不同的需求,喜歡什么,不喜歡什么;
- 要分析用戶的行為。用戶的行為是產品經理了解用戶最好的方法,用戶行為的分析往往能代表最真的用戶需求;
- 結合前邊五點的分析,對產品進行改造。
Facebook提倡一句話:Move fast and break things。它講的是一種黑客的文化——快速迭代。可以犯錯,但要快速迭代;持續迭代,小范圍改進;最后會產生幾何級數的變化。
傳統的方法,則是建立一個較長的項目周期。這樣來做的話會有幾點風險。
- 實施周期長;
- 迭代速度慢;
- 成本高;
- 不能在短期之內理解用戶需求。
所以在過去幾年,硅谷提倡MVP(這個概念在《精益創業》中有提到)。一個核心的概念是:產品設計者如何能夠產生一個最小的產品,迅速把它推向市場或用戶;測試完之后衡量產品的數據,通過數據來驗證假設,進一步完善產品;再進入下一個迭代的循環。
精益創業概念的核心,并不只適用于創業公司,其實在很多公司都有體現。比如Facebook,就應用了這種概念,對產品進行小范圍體驗,數據分析,然后迅速迭代。
產品各階段關注指標
在普通的傳統的公司,當我們做數據分析時,很多人用PV、轉化率來衡量產品的好壞,而用數據驅動則會用更全面的數據來衡量產品。
如何用數據衡量一個產品呢:
- 首先,它應該有一定的認知度,否則就不會有用戶知道。SOV、PPC、CPM這些詞都是顯示廣告投放的;
- 其次,需要衡量用戶的增長。這種增長的指標在美國已發展成為一種學科,有多少新增用戶,你的漏斗模型是怎樣的,你的霍克模型是怎么樣的,這個用戶的存留區間是怎么樣的;
- 第三,用戶活躍度。衡量每月,每天的活躍度,以及有多少獨立訪客
- 第四,衡量如何賺錢。比如電子商務網站,衡量的是GMV—整個交易額,ASP—每個商品的平均價格, LTV—生命周期價值;這些KPI對產品分析是一個整體性的東西
一個產品,我們必須全面衡量。產品經理需要有這種直覺——不能用一個指標來衡量產品,而是要用多個指標來衡量。
比如,9年前,我剛加入eBay,要衡量150個指標,每天發送一份報告,這份報告大概有20-30個指標,來衡量業務的發展。這些指標的增長或者降低都是由業務戰略的決策造成的。如果每分鐘見證指標0.1的變化,對當時的eBay來講,將是一個5000萬金額的變化。
好的產品經理不能只看產品的KPI,需要通過市場、運營、產品設計的角度以及最后銷售的角度來衡量。
比如LinkedIn,每天關注的是50-60個核心指標,公司CEO早晨起來的第一件事,就是要看這些Report。在線營業額增加了65%,是由于哪條產品線上的哪個功能引起的,為什么會帶來這些變化,這些為什么會分解到每個產品線?產品經理會對此進行細化,找出原因,進而優化產品。
數據分析需關注指標以及指標拆解
首先,我們核心要關注的指標往往不是150個指標,或者500個指標,我們重點關注的指標往往不超過三個指標,這三個指標根據不同的業務線會有很大的差別。這三個指標有:
用戶留存(用戶活躍度)—-最核心的指標;LinkedIn會衡量月活躍用戶和日活躍用戶。一般會把MAU分成三個檔次——明天或下星期或下個月或今年我對用戶的增長預期是什么,這是一個中位數。然后,還會做一個高點和低限,就是按照我們的預期,這個增長最高不會超過這個水平面,最低也不會低于這個水平面。這樣,我們把KPI分解成了四個不同的KPI值—-平均值、高值、低限、還有實際值。這樣來說,實際值如果高于高點或者低于低限,對于業務運營來說,都是一個很大的問號;
再舉個例子,比如我把月度活躍用戶進一步進行分解,分解成:新注冊用戶、既有用戶今天重新回來的用戶、以往用戶今天開始不使用的用戶、上周新來用戶這周不使用的用戶。把月活躍用戶分解成了新接入用戶,持續活躍用戶,以往活躍今天不活躍,剛剛新增用戶就開始不活躍用戶。為什么將這四個指標分解成這四個指標,因為這四個指標可以和產品關聯起來。比如拉新,如何有拉新的手段;第二,如何促進用戶的活躍。第三,已經流失的用戶,如何減低它的流失,第四,新增的用戶如何減少流失。這個數字相加,就是每月的活躍用戶。這四個指標是可以采取行動的指標。
再比如,LinkedIn新增的用戶,來源的渠道是不一樣的,活躍的用戶,流失的用戶,是我們需要持續關注的,因為它不斷地把我們新增的用戶活躍度減低,因此我們要盡量減低流失率。新用戶的流失,在一個產品里面,非常忠誠的用戶流失的可能性比新增用戶流失的可能性低很多。但是如果我們的忠誠用戶在迅速流失,那么說明我們這個平臺上的用戶的粘性有很大的問題。但是新增用戶的流失,可以用培訓的方法,引導用戶的方法,促進它的活躍度。這樣,就把一個宏觀的指標,分解成了更細化的指標。另外一點,分解指標的好處是,我們分解能產生增長或者衰竭的原因。比如下邊這張圖,
我們可以看到每條線,變化是不一樣的。最后的增長就知道它的成因。
一個活躍用戶,或者流失用戶,可以進一步對它進行分解。這種方法就是通過維度的分解。舉個最簡單的例子,比如說我把用戶的流失率,用男性和女性的方法拆解開來,比如上圖中,綠色是男性,紅色是女性,大家可以看到,綠色的活躍度是高的,說明平臺比較適合男性用戶,女性用戶偏少。如果我們想刺激活躍的話,可以針對這兩種不同的人群采取不同的方法。
再講一個分解核心KPI指標的方法,咱們講一個促活的例子。比如說,用戶很少用一個平臺的產品,我們發現,當把這個指標進行拆解的時候,假設上圖中橘黃色的這條線是IOS用戶,藍色的線是安卓用戶,綠色線是PC用戶,大家來看,我們把一個重新激活的用戶分成了三個組,可以看見,IOS用戶在不斷增長,它的活躍度是在不斷增加的, 安卓用戶表示的線比較平緩,PC線相對來說是衰減趨勢的,這樣來說,在哪個平臺上,你的用戶是十分活躍的。
AARRR以及產品指標拆解案例
在美國有一個概念—AARRR。A—獲取用戶,A—激活用戶,R—用戶的留存,R—用戶產生多少價值。R—-用戶與用戶之間的推薦。用戶之間的推薦,是最好的獲取客戶的方法。對這個指標進一步進行分解,比如說在LinkedIn上的推薦,它是通過下面幾種方法來實現的:
- 通過你可能認識的人來把LinkedIn推薦給一個用戶;
- 通過上傳地址錄來推薦給別人;
- 通過電子郵件來做產品的推薦;
當我們做了這樣的一個渠道的分類之后,我們發現,在產品上的模塊—您可能認識的人,產生了最多的推薦用戶數量。這對于產品運營人員來說,可以進行各種優化。
給大家舉個實例,在最早的時候,LinkedIn研究如何使用戶爆發式的增長,他們發現從首頁上登錄的用戶活躍度和忠誠度比從EMAIL地址邀請來的用戶的活躍度高的多。當時的產品經理做了一種嘗試:大范圍優化從網站上來的用戶。怎么做呢,就是對每個人的簡歷進行優化,優化之后,使它更方便SEO爬蟲的搜索,這樣一來,從網站上獲取的用戶就遠遠大于從郵件獲取的用戶。它的核心的方法論是這樣:
- 我要增長核心用戶;
- 通過分析用戶的來源,找到了那些不斷增長的活躍用戶大部分來源于網頁,而不是從電子郵件來的;
- 迅速做一個產品嘗試—-優化每個人的簡歷,增加SEO的曝光率。
這次改變以后,為當時的LinkedIn增加了50%的擴張速度。這次成功嘗試背后的一套核心觀點是:如何用數據驗證它的這種假設,或者迅速驗證這種業務的判斷。就是那么一個簡單的例子,帶著一個假設去做一個產品的改動,改動之后再用數據證明自己的改動是有效率的。如果這個改動是沒有效率的,那么需要立刻停止這個改動。
再舉個例子,也是今天我認為產品分析驅動產品設計最核心的指標—-用戶的留存度。一個好的產品,是能夠讓很多用戶在你的平臺上產生價值的,用戶必然會花更多的時間會有更高的粘度。這是今天衡量一個產品最核心的一個指標。
這張圖,是一個衡量隔日留存率的圖,就是隔天有多少用戶在使用。這張圖為什么很重要呢?因為在很多產品里邊有一些魔術數字,很多人都嘗試著在產品中找到這個魔術數字,這個魔術數字往往是從這張圖里迭代出來的。比如說我的產品利用某個功能的隔日留存,還不到10%,利用另外一個功能的隔日留存變成了30%,不用某個功能的用戶的隔日留存是10%,用這個功能的用戶的隔日留存提到了30%。這個告訴了我們什么?
- 我們的產品里邊,用戶是有區隔的,不同群組的用戶在用不同的功能
- 用某種功能的用戶,對我們的平臺或產品有很高的粘度和依賴度。這個提醒我們,要增加這種有高粘度的產品功能點,讓大量的用戶能夠用這個功能點,潛在的或者間接的就會增加用戶的留存度。
總結一下:
通過留存圖找到不同用戶的群組在留存率上的區別。比如用功能A和用功能B 的用戶在留存上是有區別的,那么我們就要專注打那個功能點,讓更多的用戶來使用這個產品FEATURE。
聽起來很直接很傻的方法,但是被很多公司屢試不爽。LinkedIn找到了這個魔術數字是:在第一周連續增加5個社交網絡鏈接的用戶群,這類用戶的留存度和他們在未來為平臺貢獻的價值,是第一周貢獻少于5個社交連接的用戶群的5倍以上。
- 發現這個魔術數字后,當時的產品經理立刻將這個增加鏈接的功能點做到了很多頁面上去:
- 在首頁的入口大范圍增加了一個功能欄,讓用戶上傳它的地址簿(因為已上傳地址簿,自然會增加用戶連接);
- 給每一個新登錄用戶推薦和他在一個公司工作的他可能認識的人;
- 數據分析發現,當用戶要邀請他的好友的時候,需要打字才能邀請。LinkedIn想能不能不要讓用戶打字,直接推薦給他可能認識的人,這個功能點再一次增加了第一周之內登錄用戶增加社交連接的可能性。
大家看,通過那一個點找到了magic number,然后產品經理通過各種不同的產品設計來促進這個魔術數字的發生,就產生了未來LinkedIn病毒式的增長。這種病毒式增長,就是成長黑客最核心的一個概念:如何用最快的最低的成本驅動最小的產品改動,通過數據驅動的方法來大規模獲取客戶。
然后再講講如何用數據驅動用戶體驗:
首先,我們必須要能分析今天的數據,這是所有做最小化產品,精益運營的最核心的一個概念。至少我們能夠看到我們的產品有多少人在使用,如果沒有數據的話,是無法證明自己腦子里的假設。
第二,最重要的一點,我們要找到最關鍵的問題進行思考,比如LinkedIn對產品做的這些改進,通過數據分析的方法找到了問題:
- 從電子郵件邀請來的用戶活躍程度低;
- 我們發現第一周登錄增加了五個社交關系的人活躍度高,不增加的人活躍度低。找到了這個差異點,就要思考如何強力的推動某種改變。
在產品的早期,沒有公司有能力做A/B測試,往往是做很小范圍的改動,隨時看數據的變化,這就足夠了。實驗完了之后,又回到了數據上面,得到了分析結果,要記得看數據,最后,其實數據驅動是很簡單的事,它只要求我們:
- 有信念;
- 要有一套非?;A的數據分析系統;
- 需要創新的精神,能夠很迅速的進行產品迭代。
以下是小伙伴們現場提問的一些問題:
問:小公司是否應該使用A/B測試?
答:A/B測試是產品經理一定會用的一個功能,但是在產品早期沒必要做一套產品測試的A/B系統。
為什么呢?因為A/B測試對初創公司,是非常高的成本。需要同時上線兩個版本,同時對這個網站以及APP的流量進行準確切割,而且還需要搭建一套非常實時的數據分析系統,或統計學檢驗的系統,特別是產品的版本控制需要做到非常精確。我覺得在早期,進行試錯是非常重要的,但是并不是非得用A/B測試。比如新產品上線,我可以用5天時間來做產品feature的測試,是否能夠被很多人喜歡,當你看到轉化率有一個很核心的提升,那么我也能夠知道這個用戶的基本的反饋了。
但是,當產品達到越來高的時候,尤其是當你的流量足夠多的時候,就非常有必要做A/B測試了。還有,當一個公司里有大量的產品經理,有普通產品上線的時候,有一套A/B測試就是非常重要的,因為其中一套非常重要核心的統計模型,比如如何切割流量,如何能分配KPI,比如得到一個指標,是否有意義,還是需要這套系統的。
問:統計學分析學,數據挖掘的書看了不少,如何能做數據分析
答:這個取決于大家核心關注的東西。
如果你是一個產品經理或者產品運營,我覺得沒有太多的必要大肆的讀這方面的書。我建議看一些入門級的書,比如說美國比較流行的《精益分析》,用簡短的篇幅描述了不同形態的產品該關注什么指標;
如果你是專業的分析師,那該學的東西就太多了:統計模型、可視化工具、數據可視化等;另外,對邏輯回歸也要有一定的理解。還有,需要有商業直覺,并且必須用自己的產品。不用自己的產品的分析師,一定不是一個好的分析師。
問:如何收集自己需要的數據?如何保證數據的準確性?
答:這個是大多數pm的痛處。對于一個小型的公司來說,我強烈建議不要建太大的數據分析系統,要學會應用很多數據分析工具;比如:項目管理工具、電子營銷工具。能熟練使用各種分析工具是一個產品能夠靈活進行工作的基礎。
對于如何保障數據準確這個問題,我認為數據不需要百分百準確,但是需要在趨勢上一致。因為好的產品經理需要利用趨勢來判斷用戶趨勢,銀行需要百分之百的準確性,但是用戶行為的數據只要趨勢對就足夠了
問:針對工具的APP有什么好的數據分析方法?
答:任何app它的核心的數據方法論沒有本質上的區別。
AARRR模型基本可以涵蓋用戶的存留激活轉化營業額以及用戶的推薦。只不過對每個指標需要進行細化,最重要的一個指標是用戶的留存率,這個留存率是如何體現出來的呢?就是從用戶如何使用APP中體現出來的。好的APP用戶使用頻次高,差點的APP用戶使用頻次比較低。當然這個也和業務場景有關,比如一個旅游的app,沒有人天天去旅游,所以這個產品的粘度就和時間有很多關系。但是一個高頻次的app,比如訂餐軟件,使用頻次就會高一些。你還可以將用戶分成高中低三個層次,找到不同用戶對產品不同的需求點。
更多精彩回答,請移步天天問張溪夢專場:http://wen.woshipm.com/activity/detail/tsf.html
思維導圖
可點擊圖片按 F 鍵查看原圖(整理者:錢秋羽、韓疆、大黃雞醬)
本次分享PPT及思維導圖下載:
鏈接:http://pan.baidu.com/s/1pJXFNvl 密碼:jw85
往期【起點公開課】總結文章請往下看:
8年運營實戰總結,串講運營知識體系的那些核心關鍵詞(附PPT及思維導圖下載)
迅雷看看前CEO郝志中:以用戶需求驅動為主線,聊聊我的產品方法論
有道產品總監|3500萬用戶背后的產品迭代秘籍(附PPT下載)
本文系人人都是產品經理團隊@張婷?整理,編輯修改發布,未經許可,不得轉載。
屌屌屌屌
鏈接下載不了了
個人覺得linkin在中國一般,而且國內的各種山寨版更是雞不是雞,鴨不是鴨。。。