實例|產品新人如何進行數據分析
如果你一入職,就有產品大神帶你,那么恭喜你,你很幸福。因為有個產品大神帶領著你一路過關斬將,所向披靡。但是如果你是剛入職的小公司產品,那么你很可能只是CEO下面的一個畫圖經理,有想法,卻無法說服老板。經常聽被人說拿出數據來,可是找了一堆數據卻不知道如何用。只能陷入尷尬的“佛系”畫圖經理了。
按照慣例,事先聲明,本文依然是教產品新人如何進行數據分析。如果你是數據分析大牛,那么希望你能出一篇更好的教程。我會為你打Call哦。
由于沒有拿得出手的數據,用其他數據讓人覺得夸夸其談,無法落地。
為了更好地幫助你理解和運用,直接用我上一篇寫的文章做基礎數據分析,即分析我的文章在哪個平臺輸出價值最高,以幫助我在以后輸出文章時選擇首發平臺。
一、確定分析方法和獲取基礎數據和
獲取數據的方法有很多,各種網站都有,這個應該不需要我來給大家指路。
本文為了落地分析,直接使用我上一篇文章《思路|產品新人應如何撰寫測試用例(功能性測試)》在幾個主要平臺的文章數據,分析各個平臺的輸出價值。
想要知道各個平臺的輸出價值,首先得知道文章輸出價值與那些數據相關。由于這是我自己定義的一個名詞,所以我從閱讀者和作者兩個方面闡述下文章輸出價值是什么東西。
- 對于閱讀者來說獲取知識即體現了這篇文章的價值,具體體現在閱讀,訂閱、點贊、收藏、評論等數據;
- 對于作者來說有更多的人閱讀,讓作者寫的東西沒有白費,獲得一定價值。具體體現在閱讀、粉絲、點贊、收藏等數據;
- 對于作者來說,獲得額外的收益,這是最實在的價值,具體體現在贊賞,粉絲等數據。
基于以上三點。我們需要閱讀、訂閱、收藏等等這些文章的基本數據來進行下一步分析。
*注:或者更多,由于這是一篇給初學者的文章,所以就沒有具體展開。
以下是收集各個平臺的基本數據。
我的文章在各大平臺的閱讀量、收藏量等等數據有點慘,你們就將就將就吧,反正我是沒臉看。
二、分析數據
既然已經獲取到了數據,那么就要開始對數據進行分析了。不過一般如果從正常業務中獲取的數據,都需要先進行數據清洗,才能分析。不過這里我們就省略了,畢竟都是用excel分析的,就不玩那么高大上了。
1、數據標準化處理
所謂標準化即將大額數據歸結到一個很小的數據中,這個過程也被稱為“歸一化”。通俗地說,就是把所有數據都歸結到[0,1]之間。
數據標準化通常有兩種方式。分別為min-max、z-score。這里我主要用min-max標準化。
min-max公式為:
x* = (x-min)/(max-min)?
我這里將標準化后的數據都×10,生成以下數據:
注:數據×10主要是為了好看。你要是喜歡也可以不×10。
以上是我們通過基本數據進行分析的第一步,將數據標準化處理。
2、根據維度進行加權評分
所謂加權評分,就是將第一步得出的數據進行加權處理,即:
加權評分值 = 標準化數據 × 權重
在進行加權評分前,我們先得進行權重處理,權重處理可以使用矩形分析法獲得。
如下圖:
了解每個維度的含義,然后通過以下步驟進行權重分析:
- 設置基本原則。 我個人認為重要性應按打賞 > 訂閱 > 評論 > 收藏 > 點贊 >閱讀進行排序,由于閱讀者愿意打賞,那么文章肯定幫助到了他,以此類推分析;
- 根據設置的原則,進行處理。即行列對比,如果行比列重要的設為1,行沒有列重要的設為0。
- 對每一行數據進行合計;
- 對合計進行權重計算,即:維度權重=維度合計/總維度合計,由于某些維度合計為零,因此需要對所有維度合計進行**+1**處理。
根據以上步驟得出數據,閱讀量權重=1/(1+4+2+5+6+5)*100%=4.35%,其他數據以此類推。得出上圖中的各個維度權重的數據。
將權重與評分結合,即得出上圖的維度權重評分數據
四、對平臺進行加權評分
同理,我們需要先確定各個平臺的權重比,因為我們要分析這篇文章在哪個平臺發布的價值更高,那么應該從平臺的影響用戶數去比較。那么,我們可以根據PV/UV去判斷平臺的用戶數來設置權重。
上圖為各個平臺的權重,這里需要說明一下,由于人人都是產品經理和人人都是產品經理討論的平臺,在此不做優劣評比,因此權重占比設為一樣。
根據平臺權重,那么可以輕易得出我的文章在各個平臺的文章輸出價值。
三、數據總結
通過上面的方法,可以輕易得出想要的分析結果。根據這份結果,我如果還想發文章,肯定會考慮這個來選擇首發平臺。而不是通過拍腦門決定首發。
以上為入門數據分析方法,如果你學會了,那么就用起來,開始懟你的BOSS! 嗯,就是這樣。
相關閱讀
作者:光點神奇,微信公眾號:產品研究所
本文由 @光點神奇? ?原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 unsplash,基于 CC0 協議
感覺很有幫助~可是最后那個文章輸出價值評分表沒看明白怎么來的 ??
有一個不理解的問題。
請問,各平臺的PV和UV數據是從何得來的呢?
想問問作者大大,上面的知識在產品經理工作的哪些方面可以運用?
額,可以用的地方有點多呀,比如:判斷這個功能要不要做,或則這個功能要不要繼續深度優化等等
最后那個表怎么得出來的沒太看明白,閱讀量、收藏量那些數據怎么沒了 ??
有大佬講講有哪些地方可以獲取數據嗎
懂了懂了…突然發現有個細節沒讀得很通順
閱讀量權重=1/(1+4+2+5+6+5)*100%=4.35%,其他數據以此類推。得出上圖中的各個維度權重的數據。
一直沒有理解后面的 142565這幾個數字是怎么來的… ??
權重處理的矩形分析法中有個錯誤吧,“收藏”沒有“訂閱”重要吧,應該為0,不是1
x* = (x-min)/(max-min) ,這條公式各代表什么,小白不解,求賜教。
x*表示x對應的標準化的值,在常用函數中通常用y來表示。
x表示自變量
min表示最小值
max表示最大值
示例:要求閱讀量在各大平臺的標準化的值
對于人人都市產品經理來說,x為25000,max為25000,min為276。套用公式,x*為1。由于我*10,所以結果是10
還有一個問題,x是自變量的話,x為什么要取25000,不取別的呢。 ??
min-max 經這個公式算出來的數據,沒有看明白,這里的 min、max 分貝指的是什么數據?
就是那個緯度下最大值和最小值,比如閱讀量,最大值是25000,最小值是知乎的276
標題的序號錯了一個
讀了有啟發
謝謝提醒,我是用markdown 寫作的,然后人人都是產品經理好像不支持,每次都會出錯,需要改很多小地方??????
雖然好像沒太明白,不過好像很厲害的樣子。
學習了~!