知乎簡史1:為了理解知乎,我分析了創始人的2699個回答和200位種子用戶
想到成長的最好辦法還是先找到行業的標桿,學習他人的思路并加以應用,內容社區PGC這方面的標桿必然少不了知乎。
從2010年創始之初,知乎在互聯網行業一直就有著不小的關注度,不論是早期的邀請制,早期創新工場李開復老師的天使投資還是近期的騰訊領投C輪、今日資本領投的D輪融資都讓知乎上了不少次科技媒體的頭條。
私下里,互聯網圈不少朋友也會時常上知乎去尋找今天可以和朋友們交流的熱門話題,或者是看看來自不同行業的大牛們的長文解讀,甚至于去年的百度魏則西事件,支付寶“白領日記”圈子等等輿論熱點都是在知乎完成了第一輪輿論發酵。
因為我們團隊在騰訊云近期也在負責和知乎有類似之處的PGC內容產品——騰云閣,主要是邀請騰訊系的技術大牛和騰訊云客戶中的架構師和中小開發者們來以技術文章的形式分享自己一手技術經驗。目前正處于一個種子用戶不足200人的冷啟動階段,所以想到成長的最好辦法還是先找到行業的標桿,學習他人的思路并加以應用,內容社區PGC這方面的標桿必然少不了知乎。
為此我結合近期剛學習的python分析了一些PGC專業社區最為重要的部分內容。再加上近期用3個月的時間在知乎積累了11000+粉絲,獲得了知乎“互聯網”領域話題優秀回答者的標簽,所以干脆把這次的分析整理成一篇文章,分享給其他和我一樣對知乎社區演變、功能迭代、社區機制感興趣的互聯網產品經理和運營同學們。
知乎爬蟲運行在騰訊云主機上的原因是怕被網站封IP(這里提醒下各位程序員:在部署爬蟲的時候注意不要調的太高并發,對于網站的正常用戶訪問造成影響,這也算是使用爬蟲主要注意的一點基本技術素養吧):
1.知乎種子用戶的占比
知乎200位種子用戶中創業者占比最高,設計師類活躍度最高。
周源接受外界采訪的時候說的知乎200名種子用戶。通過分析四位創始人各自關注的前200名用戶,并剔除重復數據,我們可以用爬蟲獲取他們的行業背景,在知乎的活躍程度(回答數)以及粉絲數量。
在158位有職業信息的用戶中,以創業者(63人)占比最大,其次是程序員(27人),媒體人(21人)產品經理(17人),投資人(10人),設計師(10人),其他(藝術、教育等10人),這些互聯網行業用戶的認真答題氛圍對于知乎的PGC氛圍影響很大。
在知乎種子用戶來源上我發現了不少有意思的現象:不少種子用戶都是通過知乎內測階段的邀請機制加入的。比如騰訊的CEO ponyma是和菜頭邀請來的,和菜頭又是http://dinehq.com創始人杜瀟邀請來的。
很有意思的數據是:與邀請的早期用戶占比數不同,到目前為止,用戶的關注人數超過10000人占該類用戶占比(用戶在知乎活躍與否參考值),比例最高的是其他、設計師(60%),其次是媒體人(52%),產品經理(47%),創業者(44%),投資人(40%),程序員(15%),這部分活躍度的數據與作者本人日常在知乎萬粉群里觀察到的比例比較接近。
2.是否存在對于創始團隊活躍度的依賴?
知乎四位創始人在知乎上回答的時間分布-活躍曲線,看看知乎這樣的社區產品是不是存在對于創始團隊活躍度的依賴?
知乎CTO 李申申是四位創始人中最宅的,回答數量最少,最不活躍(當然不排除李申申 老師有小號,可以偷偷看@VCZH 輪子哥帶逛的美女圖片)。張亮老師最活躍,個人回答問題數1408個 抵得上其他創始人回答數之和(1288個)。黃繼新老師關注的知乎用戶最多,關注了9000多人…爬了好一會…
3. 回答的問題中涉及關鍵詞的詞頻分析
分析回答的問題中涉及關鍵詞的詞頻分析,看看知乎的社區氛圍在創始人們回答中體現的如何?
在一份給定的文件里,詞頻(term frequency,TF)指的是某一個給定的詞語在該文件中出現的次數。這個數字通常會被正規化,以防止它偏向長的文件。
作為問答社區,知乎有以下幾類詞語討論的較為頻繁“問題”,“回答”,“為什么”,“如何”,“看待”。同時由于初期用戶的背景“蘋果、互聯網、創新工場”等詞匯出現,在幾位創始人愿意回答的問題里出現的都比較頻繁。
4.四位創始人獲贊最多的10個問題
分析知乎四位創始人獲贊最多的10個問題,分析這點純粹是我個人好奇。
回答對應的問題 時間 點贊數 作者回答鏈接
##什么叫「見過大世面」?2013-1-21 10566個贊 張亮
##北師大東門的野草書店是一家怎樣的書店?2013-7-2 9346個贊 張亮
##怎么看待戀人的戀愛史?2011-2-4 8557個贊 黃繼新
##如何評價郭敬明小說改編的電影《小時代》?2013-7-7 6902個贊 張亮
##電影《社交網絡》給你最深的感受是什么?2011-1-27 6438個贊 黃繼新
##為什么在現實中從來見不到知乎大神那樣的人?2015-3-25 5955個贊 張亮
##快速入睡有哪些妙招?2012-1-30 5904個贊 周源
##過去的五年(2011~2015)你經歷了哪些重要的人生節點?對現在有哪些影響?2016-1-26 5226個贊 周源
過去的五年(2011~2015)你經歷了哪些重要的人生節點?對現在有哪些影響?
##經常有人說史玉柱、周鴻祎等把握住了人性、人的欲望,是否能系統的說明人性、欲望有哪些?如何把握?能否推薦相關書籍?2013-7-23 4730個贊 張亮
經常有人說史玉柱、周鴻祎等把握住了人性、人的欲望,是否能系統的說明人性、欲望有哪些?如何把握?能否推薦相關書籍??
##百度為什么不收購知乎?2011-11-3 4440個贊 張亮
小結:從以上數據我們可以看出
- 知乎的近200位種子用戶中,互聯網領域創業者、投資人、程序員、媒體人偏多,但是從用戶活躍數據來看,知乎上、藝術、教育、電影等其他類目的用戶也頗為活躍,“互聯網”以外其他話題的火熱,也是知乎能夠走到今日用戶規模的重要原因。
- 知乎社區亟待形成認真回答氛圍的早期,需要創始團隊積極參與社區內容建設。知乎的4位創始人在知乎成立的頭三年(2010-2012)年累計回答了2345個問題,占他們4人累積回答數的86%,13-15年合計回答了312個問題,16年-17年一共才回答了39個問題,說明社區的氛圍走上軌道了。
- 知乎的創始人們回答問題也不是都能達到超過1000個贊,知乎創始人們累計回答2696個問題,獲贊27萬,也就是平均1個回答100個贊左右,所以你的知乎回答,獲贊數量有沒有超過100個贊這個水準呢?
后續計劃在下一篇文章中分析知乎產品迭代的版本歷史,分析哪些是核心的功能迭代,知乎整體的信息流來源與分發機制,商業變現的產品形態;從知乎小管家的文章看社區機制的變化,社區成長的不同階段,KOL群體演化的歷史,比如傳說中的知乎萬粉群的存在。
作者:賀嘉 公眾號:kuajie123,騰訊云布道師、騰訊云小程序教程作者。全國最大公益組織孵化器恩派的傳播顧問,廣東電臺財經頻道客座嘉賓。多次作為深圳文博會、中科院可穿戴學術會議主講嘉賓
本文由 @賀嘉 授權發布于人人都是產品經理,未經作者許可,禁止轉載
還在等下一篇知乎的分析
老師,兩年過去了,你的下一篇知乎的分析怎么還沒有出來呀