當(dāng)toB產(chǎn)品經(jīng)理遇到數(shù)據(jù)分析
編輯導(dǎo)語:toB產(chǎn)品經(jīng)理不僅需要與設(shè)計(jì)師打交道,還需要和數(shù)據(jù)分析打交道。當(dāng)你在業(yè)務(wù)方面遭受到了瓶頸,這時(shí)候就需要用分析自己的產(chǎn)品的數(shù)據(jù)變化,因此toB產(chǎn)品經(jīng)理該如何做好數(shù)據(jù)分析呢?
對于我來講,我本身是學(xué)的軟件工程,后來從事產(chǎn)品經(jīng)理,作為toB端的產(chǎn)品經(jīng)理,可能最爽的點(diǎn)在于設(shè)計(jì)軟件的過程中,能把業(yè)務(wù)吃透,面對龐大的業(yè)務(wù)體系和復(fù)雜的邏輯,很難讓自己在專業(yè)方面沒有提升。
但是在經(jīng)歷面向的大多數(shù)是大客戶和領(lǐng)導(dǎo)層面的人之后,難免會產(chǎn)生枯燥的感覺和到達(dá)瓶頸的挫敗感,因?yàn)榇蠖鄶?shù)情況下,toB產(chǎn)品不需要?jiǎng)?chuàng)新,不需要美感,更不需要突然爆發(fā)的靈感,需要的是對客戶業(yè)務(wù)場景的深入調(diào)研和理解,強(qiáng)調(diào)的是客戶的價(jià)值。
在toC端數(shù)據(jù)分析一片紅海的情況下,toB在此領(lǐng)域倒是顯得有些呆萌,說到底,toB的產(chǎn)品對于數(shù)據(jù)分析這項(xiàng)技能用的很少甚至不會用到。
但是,在經(jīng)歷了上述心路歷程之后,也會有新的發(fā)現(xiàn),那就是在toB端工作久了,越來越發(fā)現(xiàn)對于政策的把控和對于民生發(fā)展的趨勢的把握顯得十分重要,然而在公司的背景下,對于有些東西是現(xiàn)成的,直接拿來上手去做就可以,這就導(dǎo)致了對自身思維的禁錮。
但是哪怕假設(shè)假如以后會創(chuàng)業(yè)(每一個(gè)產(chǎn)品都有一顆創(chuàng)業(yè)的心),對于數(shù)據(jù)分析來講也是寫好計(jì)劃書的一小部分不可忽視的技能,所以當(dāng)toB遇到數(shù)據(jù)分析未嘗不能擦出一些火花。
后續(xù)會更新更加詳細(xì)的步驟包括用到的工具。
以下內(nèi)容均來自一個(gè)初步認(rèn)知數(shù)據(jù)分析的toB產(chǎn)品的總結(jié):
數(shù)據(jù)分析大致可以分為以下幾個(gè)步驟:
- 問題工程:得到什么結(jié)果
- 信源工程:數(shù)據(jù)從哪來
- 數(shù)據(jù)工程:也可以叫數(shù)據(jù)處理(為了格式一致就叫那個(gè)名字吧),目的是得到“好”數(shù)據(jù)
- 特征工程:從哪些維度入手
- 模型工程:標(biāo)簽應(yīng)該怎么分析
- 展示工程:結(jié)果怎么呈現(xiàn)
最后,講好一個(gè)故事,一個(gè)可以將上述步驟都包含進(jìn)去的故事。
一、問題工程
問題工程簡單來講就是想要得到什么結(jié)果。什么樣的曲調(diào)決定了歌詞情感動(dòng)向,如果在一開始就沒有想清楚到底研究的是什么問題,或者沒有一個(gè)明確地主旨的話,那么后面所做的東西都用不上(簡稱:垃圾)。所以第一步雖然是最簡單的,卻也是最重要的。
二、信源工程
1. 信源劃分
可以將信源劃分為信息發(fā)布者、行業(yè)類型、所屬地域和網(wǎng)站類型這幾個(gè)維度。
(1)信源類型
①信息發(fā)布者
可以分為UGC(個(gè)人)、PGC(專業(yè)生產(chǎn)內(nèi)容)、OGC(職業(yè)生產(chǎn)內(nèi)容)。
信息發(fā)布者類型:
行業(yè)類型:
- 保險(xiǎn)業(yè)
- 能源
- 餐飲
- 電訊業(yè)
- 房地產(chǎn)
- 服務(wù)業(yè)
- 服裝業(yè)
- 公益組織
- 廣告業(yè)
- 航空航天
- 化學(xué)
- 健康
- 保健
- 建筑業(yè)
- 教育
- 培訓(xùn)
- 計(jì)算機(jī)
- 農(nóng)業(yè)
- 旅游業(yè)
- 律師
- 體育運(yùn)動(dòng)
- 演藝
- 醫(yī)療服務(wù)
- 設(shè)計(jì)
- 金融
- 交通運(yùn)輸業(yè)
- 咨詢等等行業(yè)
所屬地域:
可以按省市劃分,按國家劃分等。
網(wǎng)站類型:
例如咨詢、社交、百科、視頻、百度經(jīng)驗(yàn)、企業(yè)類。
再細(xì)化一點(diǎn)比如電商的分類:
- 綜合類:淘寶、天貓、京東、蘇寧
- 飲食類:美團(tuán)、餓了么
- 鍛煉類:keep、薄荷健康
- 旅游類:大眾點(diǎn)評、攜程、去哪兒
2. 數(shù)據(jù)類型的劃分
還是舉個(gè)例子,對于電商來講,包括但不限于:產(chǎn)品名稱、任務(wù)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)(評論數(shù)、轉(zhuǎn)發(fā)數(shù))、轉(zhuǎn)發(fā)數(shù)據(jù)、收藏量。
3. 定位有價(jià)值的信源基本步驟
第一步:讀題,解析命題
第二步:拓開思路,列出信源可能的來源
第三步:按照第二步的列表去篩選需采集的信源和數(shù)據(jù)
第四步:在已采集的數(shù)據(jù)中再次精加工,得到有價(jià)值的基礎(chǔ)數(shù)據(jù)
*商品類的分析一定會需要商品售賣的數(shù)據(jù)、商品的描述、商品的口碑、品牌的口碑等等,所以電商數(shù)據(jù)、評論數(shù)據(jù)、口碑?dāng)?shù)據(jù)、微博數(shù)據(jù)這些不可或缺。
*事件類的分析一定會有官媒數(shù)據(jù)、民眾討論的數(shù)據(jù)等等,所以,資訊數(shù)據(jù)、微博、貼吧、論壇這些數(shù)據(jù)不可或缺。
*行業(yè)類的分析一定會有行業(yè)專業(yè)網(wǎng)站、國家政策、行業(yè)論壇等等,所以,需要找的就是專業(yè)性論壇、專業(yè)網(wǎng)站、官方站點(diǎn)、可能還需要toB站點(diǎn)的相關(guān)數(shù)據(jù)。
4. 從信源得到數(shù)據(jù)
收集信源我一般會用火狐,因?yàn)闀泻糜玫牟寮?注:在用Python爬蟲時(shí)可以根據(jù)可以根據(jù)網(wǎng)址的規(guī)律提取連接。
火狐的插件
信源可以根據(jù)列表頁和正文頁獲取,信源的獲取過程中有以下情形:
- 正常的信源頁,我們從源碼中就可以看到可以采集的正文頁鏈接,非常好提取。
- 有嵌套的信源頁,這種直接看源碼是看不到正文頁的,需要我們找到正確的列表頁,比如下圖的某政府網(wǎng)站,需要點(diǎn)開真正的列表。
- 信源頁中的正文頁鏈接是需要拼接的
- 信源頁中有多條信息,需要從中直接提取每條數(shù)據(jù)的字段的(例如:搜索引擎頁面)
- 需要登錄的
- 其他一些做特殊配置的
其實(shí)可以思考一下,按照網(wǎng)站類型可以將以下情景的信源劃分為哪些維度,并給出合適的數(shù)據(jù)(網(wǎng)站)來源。
- 分析天津市針對人工智能專業(yè)博士的需求情況
- 分析互聯(lián)網(wǎng)上針對綜藝節(jié)目《乘風(fēng)破浪的姐姐》節(jié)目評價(jià)及該節(jié)目的受眾人群
以下只是簡單提供一種思路:
第一個(gè)場景按照網(wǎng)站類型可以將信源劃分為判決文書、電商類、資訊類、行政處罰、企業(yè)工商注冊數(shù)據(jù)、百度經(jīng)驗(yàn)、企業(yè)類、法院類、百科等這些維度。
第一個(gè)情景分析天津市針對人工智能專業(yè)博士的需求情況:
首先組合幾個(gè)維度分析,所屬地域限定在北京,行業(yè)類型限定為人工智能,信息發(fā)布者為PGC內(nèi)容,網(wǎng)站類型為行業(yè)專業(yè)網(wǎng)站、國家政策和行業(yè)論壇,進(jìn)一步定位有價(jià)值的信源,就要從專業(yè)性論壇、專業(yè)網(wǎng)站、官方站點(diǎn)、toB站點(diǎn)獲取相關(guān)數(shù)據(jù)
第二個(gè)情景分析互聯(lián)網(wǎng)上針對綜藝節(jié)目《乘風(fēng)破浪的姐姐》節(jié)目評價(jià)及該節(jié)目的受眾人群:
首先組合幾個(gè)維度分析,行業(yè)類型定位在娛樂和影視,信息發(fā)布者UGC和PGC都要分析,因?yàn)閷儆谑录惖姆治?,主要分析?jié)目評價(jià)及該節(jié)目的受眾人群。
所以就要有官媒數(shù)據(jù)、民眾討論的數(shù)據(jù)、民眾自身年齡的數(shù)據(jù)等,所以網(wǎng)站類型要從資訊和社交兩個(gè)方面分析,例如從《乘風(fēng)破浪的姐姐》官方微博、貼吧、論壇找出這些數(shù)據(jù)。
三、數(shù)據(jù)工程(數(shù)據(jù)處理)
1. 數(shù)據(jù)結(jié)構(gòu)化
將數(shù)據(jù)整理成能看的結(jié)構(gòu):
數(shù)據(jù)結(jié)構(gòu)化:
- 傳播力分析:標(biāo)題、出處、發(fā)布時(shí)間
- 人物畫像:微博人物字段
- 消費(fèi)者人物畫像:評論字段
- 汽車指標(biāo):汽車網(wǎng)站字段
- 電商人物畫像:消費(fèi)習(xí)慣
2. 數(shù)據(jù)處理
其實(shí)上學(xué)的時(shí)候也學(xué)過很多數(shù)據(jù)處理的知識,有各種插值法,回歸,聚類等方式處理數(shù)據(jù),但凡有一點(diǎn)在腦子里,我也不至于重新學(xué)。不過基本的我還是印象深刻的:
(1)數(shù)據(jù)清洗
主要是刪除原始數(shù)據(jù)集中的無關(guān)數(shù)據(jù)、重復(fù)數(shù)據(jù),平滑噪聲數(shù)據(jù),處理缺失值、異常值等,讓數(shù)據(jù)變得“干凈”。
(2)缺失值處理
處理缺失值的方法可分為三類:刪除記錄、數(shù)據(jù)插補(bǔ)和不處理。其中常用的數(shù)據(jù)插補(bǔ)方法見下表:
其中,插值有兩個(gè)比較重要的是拉格朗日插值和牛頓插值。
(3)異常值處理
(4)數(shù)據(jù)變換
主要是對數(shù)據(jù)進(jìn)行規(guī)范化的操作,將數(shù)據(jù)轉(zhuǎn)換成“適當(dāng)?shù)摹备袷剑赃m用于挖掘任務(wù)及算法的需要。會涉及到歸一化處理、屬性構(gòu)造、小波變換等方式,從而達(dá)到數(shù)據(jù)使用的標(biāo)準(zhǔn)。
(5)數(shù)據(jù)規(guī)約
數(shù)據(jù)規(guī)約是將海量數(shù)據(jù)進(jìn)行規(guī)約,規(guī)約之后的數(shù)據(jù)仍接近于保持原數(shù)據(jù)的完整性,但數(shù)據(jù)量小得多。通過數(shù)據(jù)規(guī)約,可以達(dá)到:
- 降低無效、錯(cuò)誤數(shù)據(jù)對建模的影響,提高建模的準(zhǔn)確性
- 少量且具代表性的數(shù)據(jù)將大幅縮減數(shù)據(jù)挖掘所需的時(shí)間
- 降低儲存數(shù)據(jù)的成本
數(shù)據(jù)規(guī)約會對屬性和數(shù)值兩個(gè)方面進(jìn)行(具體的我也忘得差不多了),但是講真,簡單的數(shù)據(jù)分析(給自己看的數(shù)據(jù)分析)不會進(jìn)行到這一步的。
3. 數(shù)據(jù)建模
這塊到后面會詳細(xì)說一下,因?yàn)橐坏┱归_就真的太多了。大概會有聚類、分類、關(guān)聯(lián)、回歸、時(shí)序模式、離群點(diǎn)檢測等。
四、特征工程/數(shù)據(jù)分析
分析可以從以下幾個(gè)方面入手:
- 關(guān)注點(diǎn):分析用戶使用情境中的核心訴求,用戶在產(chǎn)品購買使用中最關(guān)注什么?影響用戶選擇的關(guān)鍵要素
- 用戶場景:產(chǎn)品問題是在什么情況下發(fā)生的
- 產(chǎn)品抱怨:用戶集中反饋的產(chǎn)品缺陷,用戶對產(chǎn)品的主要抱怨是什么?
- 競品分析:與競品對比的主要差距,產(chǎn)品哪些地方不如競品?
選擇對用戶體驗(yàn)和銷售最有價(jià)值的產(chǎn)品改進(jìn)方向,實(shí)現(xiàn)產(chǎn)品有效優(yōu)化。
1. 關(guān)注點(diǎn)
聚焦資源,主動(dòng)讓顧客選擇,不讓顧客思考。
- 關(guān)注點(diǎn)提及分析
- 判斷用戶關(guān)注點(diǎn)(四象限圖)
用戶產(chǎn)品需求分析:分析用戶對本品類產(chǎn)品使用的最主要功能性能要求。
用戶購買因素分析:監(jiān)測本品類產(chǎn)品用戶認(rèn)知度對比關(guān)系。
2. 用戶抱怨
(1)類型
非投訴型抱怨:不會直接抱怨但是會向其他人傳遞不好
投訴型抱怨:產(chǎn)品的不好會直接反饋回來
(2)用戶抱怨分析
- 用戶對產(chǎn)品的主要抱怨是什么?
- 用戶集中反饋的產(chǎn)品缺陷有哪些?
- 這些言論在哪些媒體出現(xiàn)?
①不同維度的PSR和NSR
- PSR=正面/(正+負(fù))
- NSR=負(fù)面/(正+負(fù))
②用戶抱怨實(shí)時(shí)監(jiān)測分析(四象限圖)
3. 應(yīng)用場景
什么人在什么時(shí)間、地點(diǎn),帶著什么樣的情緒、動(dòng)機(jī),通過什么行為來滿足什么要求。
這里有四個(gè)因素:用戶(用戶所屬的群體、所帶有的角色標(biāo)簽)、需求(核心)、行為(用戶采取什么行為滿足需求)、情景。
要時(shí)刻思考應(yīng)用的意義,其實(shí)慢慢的又回歸到了產(chǎn)品經(jīng)理的思路上來了,所以數(shù)據(jù)分析有時(shí)離不開產(chǎn)品思維,比如要思考:
- 誰是產(chǎn)品的目標(biāo)用戶?他們的核心需求是什么?
- 在特定場景下,是什么讓他們決定使用或者放棄使用一款產(chǎn)品?
toB只在乎用著順不順手:
toC在乎多方面:
每個(gè)環(huán)節(jié)都要有場景:
用戶場景梳理方法:
4. 競品分析
(1)找到競品top3-5,核心1-2個(gè)
(2)排除非競品:關(guān)聯(lián)詞相似度,話題討論
(3)判斷競爭強(qiáng)度 各維度提及次數(shù)
(4)案頭研究:價(jià)格
(5)輿情指數(shù)分析:消費(fèi)者情感偏好和討論聲量判斷優(yōu)劣勢構(gòu)建四象限圖 橫坐標(biāo)討論聲量,縱坐標(biāo)PSR,四個(gè)維度分別是基本產(chǎn)品、優(yōu)勢產(chǎn)品、小眾產(chǎn)品、劣勢產(chǎn)品。
(6)各維度進(jìn)行抱怨度NSR分析
五、模型工程
根據(jù)RFM模型和NSR、PSR模型進(jìn)行分析,這一點(diǎn)我也會單獨(dú)拎出來做出一個(gè)文章詳細(xì)寫一下。
六、展示工程/數(shù)據(jù)可視化
工具可以用PowerBI,也可以用Python,Python還是很萬能的,而且python有很多現(xiàn)成的包,直接導(dǎo)入直接用,各種好看的分析圖都有,我將單獨(dú)寫一章介紹python的可視化分析。
1. 數(shù)據(jù)標(biāo)簽可視化
2. 例子(PowerBI)
(1)進(jìn)行數(shù)據(jù)的拆分(年月日、性別等等)
(2)數(shù)據(jù)分組
(3)數(shù)據(jù)的篩選
例如:性別統(tǒng)計(jì)。
3. 地域統(tǒng)計(jì)、自我認(rèn)知詞云
4. 頁面大小的調(diào)整
5. 標(biāo)簽數(shù)據(jù)的可視化
四級標(biāo)簽的可視化,設(shè)置二級標(biāo)簽的篩選器,詞云圖可以設(shè)置不顯示某些詞。
七、最重要的就是講故事
具體怎么講,我打算放在后面的文章去說明,因?yàn)檫@篇文章就是一個(gè)小概括而已,也是大概梳理了一下近期學(xué)習(xí)的思路。
作為toB端的產(chǎn)品經(jīng)理有些人覺得著實(shí)是沒必要研究這些,我一開始也是這樣覺得,但是我越學(xué)習(xí)就會越發(fā)現(xiàn)數(shù)據(jù)分析的思路其實(shí)是離不開產(chǎn)品的思維,產(chǎn)品的思維也能從數(shù)據(jù)分析的思路中得到靈感加以開闊,因?yàn)槲覀兊哪繕?biāo)不是一直做產(chǎn)品經(jīng)理,而是去到更大的平臺更高的地方去看這個(gè)世界。
沒有人一拿起來這件東西馬上就能上手去做的,除非天賦異稟,但是大多數(shù)人都是在一步步泥濘中摸爬滾打過來的,我是想說,接受自己平凡,并不斷向前,就已經(jīng)贏過絕大多數(shù)的人了,因?yàn)榭偸菚腥俗悦环病?/p>
本文由 @別動(dòng)我的可樂 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
寫的很好!??????