分析2018年「人人都是產品經理」網站的文章數據
在八月的尾巴,深入分析2018年人人都是產品經理網站上的文章數據,你的文章上榜了嗎?筆者爬取了網站1月到現在的文章數據,希望發掘數據背后潛藏的價值。
一. 匯總分析
通過閱讀量排序,得到了Top10閱讀量的熱點文章,總的來看大家偏向于閱讀技術類的文章,特別是與PRD相關的文章。一方面,PRD擁有較為全面的體系,可以讓讀者系統深入地去了解某個APP或者事物;另一方面,PRD撰寫是許多新人難以掌握的技能,值得反復閱讀與學習。
從收藏量榜單分析,與閱讀量相似的是,大部分人都傾向于收藏PRD分享文章,PRD被普遍認為是產品經理有用且值得持續學習的技能。除此以外,一些原理性的知識或者職場道路的發展也被大家認為十分值得收藏的內容。
基于點贊量榜單看,PRD幾乎消失了。大家更多偏向于對于更為細節的方法論進行點贊,閱讀這些文章后筆者發現:相比起收藏量榜單,點贊量榜單上的文章閱讀時間更短、閱讀難度更低、趣味性更高……
總的來說,用戶點贊的驅動力來自于閱讀文章帶來的愉悅感;而收藏的話,用戶則基于文章的可學習性進行收藏——值得反復閱讀。
二.“標題文”分析
筆者設置了這樣的指標來識別標題文:
標題黨可能性數值 = 閱讀量 /(點贊量+收藏量)
如果這個數值越大表明了更多的人只是閱讀而無收藏/點贊,這說明了文章的趣味性或者價值并沒有達到讀者的預期,也就是說文章為標題黨的可能性越大。
這十篇文章在所有的文章里擁有最大的標題黨可能性數值,較大一部分屬于活動策劃類或者深度技術類文章。
這一類文章較難借鑒導致了收藏量的低迷,同時由于文章閱讀體驗一般也沒有引發較高的點贊量,最終出現高閱讀量下少人點贊或者收藏的情況。還有一種可能是這些文章不適合人人都是產品經理的受眾。
那么哪些文章是干貨呢?
這一類的文章可操作性強、閱讀起來簡單易懂成為了大多數人點贊或者收藏的對象。大家可以通過搜索閱讀這些文章,應該會有所得。
我們來從運營的角度分析一下網站的標題文情況:
可以看到數值集中分布于0-2000(占比87%),我們可以認為2000以下的是正常的文章,500以下是較為優秀的文章(收藏率以及點贊率較高)。這樣的分布表明大部分文章擁有良好的質量,數值較大的(5000以上較大可能為標題文)文章只有63篇(占比1%)。
那么我們放大0-2000的分布情況來看:
發現文章數值以數值500為中間向兩邊遞減,進一步說明了文章質量普遍較高,大部分文章都會獲得較高的點贊率與收藏率。
總的來說,網站中的標題文數量不多,絕大多數文章都對用戶產生了十分有用的影響,文章運營情況良好,編輯可以通過監控干貨文來更好地設置推薦位。
三. 類別分析
人人都是產品經理網站上的文章被分為了許多的不同的類別,筆者收集到的有以下十七種:
- AI人工智能
- 業界動態
- 交互體驗
- 產品經理
- 產品設計
- 產品運營
- 分析評測
- 創業學院
- 區塊鏈
- 原型設計
- 大咖分享
- 數據分析
- 文案策劃
- 新零售
- 用戶研究
- 職場攻略
- 營銷推廣
那么大家發布的文章主要是哪一類別的呢?
發布文章最多的類別是業界動態,是一些時效性較強的東西??梢园l現技術性文章集中分布于數據圖的右邊,較少人去分享。
這也跟網站的定位有關,網站用戶更注重產品而非原理,偏好思想勝于技術。
結合“干貨”榜單分析,用戶對于職場攻略、新零售、原型設計和用戶研究等類目都有較大的需求,作家們可以更多地收集或者撰寫這幾類的文章。
結合“標題黨”榜單分析,用戶對于AI、區塊鏈與產品運營等文章的需求過剩,較多的文章并沒有對用戶產品實際有效的作用。
原型設計類別擁有最多用戶收藏,相反,AI較少人收藏與點贊。
以上的數據圖可以簡單地理解為用戶對于類別的需求,而實際上會受到文章質量與閱讀數量的影響帶來偏差,筆者偷懶省去了對數據進行標準化的過程。
比如,新零售類目下擁有了多篇文章上榜“干貨”榜單,但是受到了同類目下其他低贊低收藏文章影響導致了總體分數不高。
來看點贊量排名,可以等同于用戶從最愿意到最不愿意看到的文章類別排序。
像創業、區塊鏈和AI人工智能這些類別的文章由于閱讀難度大導致了較少人點贊,而像業界動態這樣的過于泛濫的文章也會導致讀者不愿意去閱讀。
四. 網站總體運營情況
2018年截止到8月26日平均每周有82萬人次閱讀人人都是產品經理文章,第一個低點是由于春節大家都傾向于過節與放松而較少閱讀。
近來的閱讀低點表明網站用戶有些許的流失,運營需要進一步優化,最重要的核心競爭力就是內容的質量,建議編輯可以通過分析干貨指標讓更多的干貨文有較高的曝光率來提高閱讀量,實際上筆者列出的干貨文榜單上面的文章閱讀量都不是十分的高,可以說是在某種程度上“被埋沒了”。
由于6-7周屬于春節假期,網站總體的訪問量不大,可以忽略6-7周的特殊數據情況。
最后我們來分析網站總體上的文章有效性情況,每周的文章數總體來說還是處在平穩波動中,而總體上看收藏數在以非常小的幅度減少。
以文章數與收藏數的比值設置了收藏比這一曲線,總體上看這一曲線在緩慢地走低,在上兩周達到了全年的低點,反映出每篇收藏量的減少。
兩個維度分析:
- 是不是每周推送的文章數過多了導致用戶沒有時間去好好閱讀每一篇文章?
- 是不是文章的質量下降導致用戶更少地去收藏文章?
五. 總結
本文從淺度的匯總分析到標題黨識別分析到類別分析,最后回到了分析網站文章的總體情況。一步步拆解網站數據的價值,利用數據來推動網站更好地設計與推送文章,一些拙見希望能夠給大家帶來一些借鑒意義。
爬取了不少人人都是產品經理網站的數據,還望諒解,本意希望能夠推動網站更好地建設與發展!
如果有需要數據集或者爬蟲教程的小伙伴可以留言,如果人多的話筆者會另外寫一篇Python爬蟲入門教程,讓大家能夠在簡歷上增添爬蟲與數據分析技能。
本文由 @弓心?原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Pexels,基于 CC0 協議
好棒的文章!樓主能分享一下您的數據集嘛?我也一直想學爬蟲,應該怎么做呢?
求爬蟲教程啊,大神
數據爬取需求 蠻大的求指導(>﹏<)
請問數據來源是哪啊
大數據這么火,反而數據分析的文章排名那么靠后~~~
數據分析的平均點贊量和收藏量都是不低的,存在一定的需求缺口