數據分析實戰|人人都是產品經理網站(中篇):讀者視角
本篇作者將以讀者視角來分析這些數據,從4萬多篇文章中,找出對于讀者最有幫助最有價值的文章。enjoy~
一. 前篇回顧
前篇《數據分析實戰|人人都是產品經理網站(上篇):平臺視角》中,詳細地介紹了從人人都是產品經理官網(以下簡稱人人)返回的首頁數據中,以平臺運營者的角度來分析:網站目前的內容是否可以支持網站的正常運營。
到本篇則會換一個視角,以讀者視角來分析這些數據,從4萬多篇文章中,找出對于讀者最有幫助最有價值的文章。當然一千讀者有一千個哈姆雷特,每個人對文章的價值都有著自己的判斷,而本文只是從數據統計的角度來分析那些對大多數讀者能夠有幫助的文章。解決的問題如下:
Q1.?閱讀量、收藏量、點贊量和評論量分別的Top10是哪些文章
Q2. 有哪些文章值得收藏?
Q3. 有哪些作者值得關注?
二. 各種Top 10
在Youtube的各種節目中,各種盤點Top 10節目很受觀眾歡迎。所以這里也按俗套劇情先偷個懶,直接把上一期整理好的數據排排坐,分別按照閱讀量、收藏量、點贊量和評論量來進行排個序,看看各種Top的文章是哪些。還沒有學習的同學也可以對本篇點擊一波收藏,之后可以導航深入學習。
1. 閱讀量
(1)99.2萬閱讀量
- 《小白產品經理看產品:什么是互聯網產品》
- 發表:2016-01-29
- 作者:華章圖書
- 分類:產品經理
(2)70.9萬閱讀量
- 《推薦幾個H5頁面制作工具,自己選一下吧》
- 發表:2015-12-22
- 作者:劉子豐
- 分類:產品運營
(3)60.1萬閱讀量
- 《如何繪制業務流程圖》
- 發表:2012-06-27
- 作者:Heidixie
- 分類:產品設計
(4)56.8萬閱讀量
- 《產品需求文檔(PRD)模板下載(附完整案例)》
- 發表:2012-06-21
- 作者:老曹
- 分類:干貨下載
(5)53.1萬閱讀量
- 《Axure教程 axure新手入門基礎(2)》
- 發表:2013-08-19
- 作者:小樓
- 分類:原型設計
(6)52.5萬閱讀量
- 發表:2012-08-06
- 作者:老曹
- 分類:業界動態
(7)52.1萬閱讀量
- 《產品需求文檔的寫作(四) – 撰寫文檔(PRD文檔)》
- 發表:2014-04-18
- 作者:唐杰
- 分類:產品設計
(8)52.0萬閱讀量
- 《[干貨]如何構建用戶畫像》
- 發表:2014-09-23
- 作者:小核桃
- 分類:產品經理
(9)51.5萬閱讀量
- 《【干貨下載】Axure 元件庫- 常用元素1056枚下載》
- 發表:2014-10-13
- 作者:人人都是產品經理
- 分類:產品設計
(10)51.0萬閱讀量
- 《【干貨】H5頁面制作免費工具大集合》
- 發表:2015-05-26
- 作者:木木老賊
- 分類:產品設計
2. 收藏量
(1)4274收藏量
- 《Word產品需求文檔,已經過時了》
- 發表:2015-09-29
- 作者:臻龍
- 分類:原型設計
(2)2407收藏量
- 《在面試時候,如何簡明扼要簡述產品流程(附思維導圖下載)》
- 發表:2016-04-06
- 作者:粵Fun享越快樂
- 分類:產品設計
(3)2407收藏量
- 《如何去做一份競品分析報告》
- 發表:2016-02-18
- 作者:梁嘉琪JackieLiang
- 分類:分析評測
(4)2298收藏量
- 《你會寫報告?產品體驗報告的思路應該是這樣的!》
- 發表:2016-01-14
- 作者:休言萬事轉頭空
- 分類:分析評測
(5)2237收藏量
- 《產品經理面試習題大匯總》
- 發表:2016-11-25
- 作者:留言
- 分類:職場攻略
(6)2120收藏量
- 《絕密原型檔案:看看專業產品經理的原型是什麼樣》
- 發表:2015-04-20
- 作者:GaraC
- 分類:原型設計
(7)1932收藏量
- 《三個步驟教你如何做好后臺產品設計》
- 發表:2015-11-16
- 作者:方東東
- 分類:產品經理
(8)1832收藏量
- 《如何優雅的用Axure裝逼?高保真原型心得分享》
- 發表:2016-02-14
- 作者:ygg
- 分類:原型設計
(9)1779收藏量
- 《干貨流出|騰訊內部幾近滿分的項目管理課程PPT》
- 發表:2015-12-26
- 作者:傅老師
- 分類:產品經理
(10)1774收藏量
- 《全面解讀流程圖|附共享單車摩拜ofo案例分析》
- 發表:2017-10-18
- 作者:臻龍
- 分類:產品設計
3. 點贊量
(1)2181次點贊
- 《Word產品需求文檔,已經過時了》
- 發表:2015-09-29
- 作者:臻龍
- 分類:原型設計
(2)1886次點贊
- 《絕密原型檔案:看看專業產品經理的原型是什麼樣》
- 發表:2015-04-20
- 作者:GaraC
- 分類:原型設計
(3)1730次點贊
- 《產品需求文檔(PRD)模板下載(附完整案例)》
- 發表:2012-06-21
- 作者:老曹
- 分類:干貨下載
(4)1556次點贊
- 《Axure 7.0 漢化版下載》
- 發表:2013-07-07
- 作者:Nairo
- 分類:干貨下載
(5)1406次點贊
- 《交互設計初體驗(iUED)》
- 發表:2014-11-24
- 作者:朱帝
- 分類:交互體驗
(6)1330次點贊
- 《axure 7.0正式版發布(附下載地址和漢化包)》
- 發表:2013-12-19
- 作者:歐陽俊杰
- 分類:干貨下載
(7)1328次點贊
- 《放大你的格局,你的人生將不可思議》
- 發表:2014-11-18
- 作者:大城小蛙
- 分類:產品經理
(8)1111次點贊
- 《Axure 8.0中文版下載(支持windows和Mac)》
- 發表:2015-08-14
- 作者:歐陽俊杰
- 分類:干貨下載
(9)1026次點贊
- 《#woshiPM訓練營#深圳站總結入口頁:對懷孕媽媽的關懷》
- 發表:2014-07-02
- 作者:游某
- 分類:人人專欄
(10)1002次點贊
- 《支付風控系統設計:支付風控場景分析(一)》
- 發表:2016-12-12
- 作者:鳳凰牌老熊
- 分類:產品設計
4. 評論量
(1)1014次評論
- 《Word產品需求文檔,已經過時了》
- 發表:2015-09-29
- 作者:臻龍
- 分類:原型設計
(2)848次評論
- 《絕密原型檔案:看看專業產品經理的原型是什麼樣》
- 發表:2015-04-20
- 作者:GaraC
- 分類:原型設計
(3)723次評論
- 《一套出自設計師之手的Axure組件庫,讓你的原型不再LOW》
- 發表:2016-05-30
- 作者:原型不low
- 分類:干貨下載
(4)456次評論
- 《我的從0到1產品路》
- 發表:2016-12-08
- 作者:luyao93
- 分類:產品經理
(5)373次評論
- 《萬字干貨|產品經理知識體系之需求管理(二)》
- 發表:2017-01-09
- 作者:記小憶
- 分類:產品經理
(6)319次評論
- 《豆瓣APP產品體驗報告》
- 發表:2015-11-30
- 作者:天天向輝
- 分類:分析評測
(7)307次評論
- 《分享PRD:「我是紅人」產品需求文檔》
- 發表:2017-01-13
- 作者:Bass小南
- 分類:分析評測
(8)236次評論
- 《系列文章|產品經理知識體系之idea管理(一)》
- 發表:2017-01-04
- 作者:記小憶
- 分類:產品經理
(9)234次評論
- 《Axure 8.0中文版下載(支持windows和Mac)》
- 發表:2015-08-14
- 作者:歐陽俊杰
- 分類:干貨下載
(10)233次評論
- 《從需求與業務流程來聊一聊,產品經理剛接手TO B產品時該怎么做?》
- 發表:2017-02-27
- 作者:記小憶
- 分類:產品經理
三. 篩選優質文章
對我來說,一年收藏個幾百篇文章到我的材料庫中是非常正常的,之前的這點Top 10根本不夠看,但如果拉長相應的名單又會有很多投機取巧的文章混在其中。人人經過這么多年的發展,已經沉淀了不少佳作。所以,作為一個有點貪婪的人,如何把這些優質內容一網打盡,是我接下來想要考慮的事情。
1. 四個屬性分布
還是之前的數據,我們先再次看一下所有文章屬性中,有價值的數據總覽:
評論這一項相比于其它屬性來說,因為值分布得比較極端,比較適合按類型進行區分,大于25%的文章評論數量為0,大于25%的文章數量評論數大于3,評論數1~2的小于50%。依次可以將其由數值型屬性轉化為分類類型。因為代碼上的處理,這里由低到高的命名為Low,Mid,High。這樣我們可以將原本需要XYZ三個軸再加上空間上點大小的三維散點圖轉化為二維。
根據上面的View(瀏覽量),like(點贊),bookmark(收藏數),comment(點評數)分別做為散點圖的點取值,x軸,y軸,及點的類型,繪制如下:
2. 屬性分析
(1)從上圖中,憑肉眼觀察就能發現約95%以上的文章都集中在左下角的紫色方塊區域內;
(2)雖然紫色方塊區域都是以High為主的藍色居多,但這是將4萬篇文章堆疊在一起的結果,展示上效果有些問題,但從整體比例來說High,Mid,Low也都應該主要集中在這塊區域;
(3)實際對四個屬性的相關性求解也是兩兩之間基本都在0.5以下。雖然是正相關,但屬于比較弱的相關,所以并不能以某一個屬性做為單一的換算比例來“消元”;
(4)四萬多條數據擠在紫色小方塊里,可以在一定程度上將他們在此區間看成是均勻分布的;可以暫時不考慮四個屬性之間的加權問題。
3. 評分計算公式
所以綜上所敘,大致的計算流程如下:
(1)為了四個屬性的值能夠相加起來比較方便,所有值都需要按照[0,1]之間進行等比換算,讓他們能夠保持在一個維度;
(2)為了避免某些文章的屬性因為值過大產生干擾,需要進行一定的修飾。當文章屬性中的值已經大于其它95%的文章時,則只取1。排除掉此部分的值之后,再根據第1條進行換算;
(3)經過上述處理之后,四個值相加則為此篇文章的打分,取值范圍一定是[0~4]。
4. 結果一覽
經過上面如此一番折騰,還能夠打4分的文章還有438篇之多。但對比于全站45000+篇文章來說,1%左右的篩選結果還是可以讓我滿意的。
因為篩選結果有400多篇,所以下面是按時間節選截圖。大家也可以一起來驗證一下我的篩選成果,是不是一些精華中的精華。
(右擊,在新標簽頁中打開即可查看大圖)
四. 哪些作者值得關注?
相信大家也能看到在人人的官網和手機APP中是有作者推薦的。但這個推薦的模型和依據并沒有告訴讀者他們是如何篩選出來的。所以在這里我們利用手上現有的資源做完這點分析,來看看人人上有哪些優秀的作者。
首先,他應該有一定的產量,因為如果作品數量太少,可能會導致較大偏差值,而產生較高的個人分數。所以先排除掉投稿數量低于5篇的作者;
其次,自然就是文章的質量了,結合前文的打分,取當前作者所有作品的平均值即可。下表中為了展示各作者的區別,把分項目的打分也顯示出來。
如此,這些作者就已經有了極大的區分度,而且根據各自的分數,其實在一定穩定上是可以分辨得出此作者的投稿偏好和類型的。如果還沒有關注他們,就趕緊關注一波吧~
補充一點在于,作者的水平描述在人人的體系下,還有打賞、訂閱量和關注量這些緯度可以讓這個打分模型更具有說服力。但限于篇幅覺得已經夠說明問題就不再追加數據了。
下期預告
以上便是本篇讀者視角的數據分析的全部內容,希望大家喜歡。有建議和想法的同學可以在下面的評論區留言討論。
下一期就是本次分析的最終篇,作為作者,取一個什么樣的標題會火!將會從數據分析到數據挖掘建立相應的模型,可以進行預測。
相關閱讀
本文由 @?核桃殼 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Pixabay,基于 CC0 協議
本系列的相關代碼可以在http://walnut-shell.com/ipython-notebook/ 中找到
期待最終篇!
很贊的數據分析文章,個人提一點小建議:1 閱讀量是否可以考慮時效性因素,也就是一篇文章在多長時間內達到多少的閱讀量/收藏量/點贊量;2 指標體系中的指標有權重差異;3 評價特征除了發文量 閱讀量 收藏量 點贊量之外,還得考慮他們的穩定性(方差),如某位作者保持穩定的頻率在一段時間內的發文頻率等
上文中輸出的所有精文章:
http://walnut-shell.com/2018/09/19/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%9C%20%E4%BA%BA%E4%BA%BA%E9%83%BD%E6%98%AF%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86/
不明覺厲,專門注冊給你點贊
感謝支持,請期待第三篇 ??
寫的很贊,閱讀量Top10的有點出入,是不是做閱讀量還原的時候單位M的忽略了,現在最高的應該是《絕密原型檔案:看看專業產品經理的原型是什麼樣》http://www.aharts.cn/rp/149653.html,2.5m的量,一共應該有3篇過百萬的。再次拜讀 ??
檢測了下代碼確實m單位的處理當成10萬了,感謝~ ??