從產品的角度分析:知乎核心功能——《問答》
如今,知乎已經不只是一個產品,而是一個品牌。而問答,是知乎最核心的功能。
知乎:一個真實的網絡問答社區,幫助你尋找答案,分享知識。
2011年起,知乎的百度指數一路上升。
知乎百度指數
Alxea排名顯示,知乎已經成為中國的第三十二大網站。而排列31名和33名的,分別是新華網和cctv。
知乎Alxea排名
雖然知乎后來推出了讀讀日報/知乎日報/知乎live/知乎專欄等內容,但最核心的流程仍然是提問和回答。本文討論問答的流程。紅色框內的流程將在下文詳細討論。
知乎的問答流程
為了優化問題下的回答質量,我們能做什么?
- 在單個問題下,將優質答案放置于更加明顯的位置。讓點進問題的用戶第一眼就能看見優質回答。而將質量一般的回答放置于底端較不明顯的位置。并且將不友善的問題折疊
- 讓優質答案得到更多的曝光。包括得到點贊,推薦到知乎日報,官方微博,發現頁面等。
- 促進交流:讓問題發表后可以得到有質量的評論。
- 激發歸屬感和認同感:這里有我喜歡的內容/用戶,我希望能加入他們。
- 設置收藏夾,專欄等,將更多的優質內容沉淀下來。而不是隨著時間流逝,消失不見。
下面將從產品的角度分析所有提及的優化點
根據答案的優劣程度排序,將游戲答案放置于最明顯的位置怎么實現?
要根據答案的優劣程度排序答案,首先要定義什么是優質答案。
百度知道定義的“優質答案”來自于提問者的選擇。只要提問者選擇了一個自己心中的優秀答案,問題就會被蓋棺定論。未被選擇的答案可能會被折疊。如果后人搜索到百度知道的問題,很可能只能看到提問者選擇的優秀答案。當然,提問者選擇的答案主觀性較強,未必是最被認可的答案。
而在知乎,回答好像是以問題為核心的開放性的“命題作文”。大家以問題為中心,各抒己見,更多的是百花爭鳴的觀點碰撞,而不是將某一個答案作為終極的標準。同時,隨著知乎用戶量的大幅增加,單個問題下可能會產生成千上萬個回答。
當單個問題下答案較多時,根據回答質量來排序答案順序將是極為關鍵的。如果點進問題后首先看到的是一些高質量回答,將會極大提高信噪比,提升用戶感受。
這類(根據少量樣本判斷總體情況的問題),非常適合采用威爾遜算法。
舊算法可以簡化為: 得分=加權贊同數-加權反對數(用戶在某個問題下的權重,是根據他過去在相關話題下的回答得到的贊同/反對/沒有幫助票數計算的。高權重的投票會對排序有更大的影響。知乎并不計算用戶的全局權重,而是分領域計算權重。
舊算法有如下瓶頸:
- 假如A答案有600加權贊同,400加權反對,而B答案有90加權贊同,10加權反對。此時A答案的贊同率是60%,而B答案的贊同率是90%。B答案贊同率高,被大家認同的概率較大。但是根據舊算法,A答案的得分高于B答案。 具體來說,抖機靈卻沒有幫助的答案,可能會得到大量贊同和大量反對。但是由于加權贊同數大于加權反對數量,仍然會排列在干貨滿滿但得贊較少的答案前面。
- 最先產生的答案如果質量不錯而獲得高票,那么新產生的質量較高的答案,由于票數較少會被排列在最下面,難以得到瀏覽,從而很難得到點贊而名列前茅。
那么直接計算贊同率合適嗎?【得分=贊同數/(贊同數+反對數)】當投票量較大的時候,這樣做是合理的;當投票量較小的時候,這樣就不合適了。假如A問題質量較高,得到9900贊同100反對,贊同率99%,而B問題質量較差,只有1個贊同。將B答案放置在A答案之前顯然是不合理的。
如果算法能夠彌補投票量較小時候得到的贊同率不準確這一缺點就好了。 1927年,美國數學家 Edwin Bidwell Wilson提出了一個修正公式,被稱為“威爾遜區間”,很好地解決了小樣本的準確性問題。(以下內容涉及一部分數理統計知識)
用戶的答案有什么特點呢?
- 用戶只有贊同和反對兩個選項。(設贊同數=u,反對數=v,總票數n=u+v)
- 用戶之間投票行為獨立。
- 當投票量增加的時候,樣本贊同率(u/n)逐漸趨近總體贊同率(n等于無窮大時候的u/n)。
很顯然,用戶的投票是二項分布。根據用戶投票,可知樣本贊同率和樣本贊同率的置信區間。 置信區間的寬窄,取決于樣本的數量。計算置信區間的方法有很多,(大學教材中計算置信區間的方法是”正態區間法“,但是這種方法不適用于小樣本的置信區間計算)。威爾遜算法能夠很好的計算小樣本情況下的準確度。
(具體來說,900贊同,100反對的A回答,贊同率90%,有95%的把握可以斷定,贊同率在[89%,91%]之間。而9贊同,1反對的B回答,贊同率90%。有95%的把握可以斷定,贊同率在[85%,95%]之間。B回答的贊同率下界85%低于A回答贊同率的下界89%,所以B回答應該放置在低于A回答的位置。)
知乎的算法步驟:
- 計算贊同率(總投票數可能較小,所以將實際贊同率看作樣本贊同率,通過樣本贊同率,估算可能的總體贊同率)
- 計算贊同率的置信區間下界,得到得分(計算公式如下圖)
- 根據得分排序(只需要在有用戶投票時候重新計算)
z
(如果在wiki查威爾遜區間,會發現下圖公式。知乎算法采用的是威爾遜區間的下界)
新算法有什么影響呢?
(1)舊算法下,排名反應的是加權贊同數和加權反對數的差。而新算法下,排名反應的是經過修正的贊同比。也就是說,一些贊同數遠大于反對數,但是贊同比較低的答案將會被放置在靠后的位置上。算法克制了爭議性較強的問題。類似的情況包括:
- 抖機靈爆照但沒有幫助,煽動性較強但沒幫助,大v用戶的低質量回答,攻擊性回答(這些問題自帶很多贊同和很多反對,贊同比較低)
- 爭議性話題下的優質回答(話題天然爭議性較強,明確表達自己觀點的回答自帶大量贊同和反對,從而被放置在不明顯的位置。而較為中庸卻沒有輸出任何實際內容的回答,卻被放置在了明顯位置。(對于百家爭鳴類型的討論,這樣到底合適嗎?)
- 某種程度上鼓勵了“知乎政治正確”。一些符合知乎政治正確但是并不客觀的回答被置頂,而真正客觀理性的回答被放置在不明顯的位置。(之前寫快手分析報告的時候去知乎查資料,很希望看到一些客觀的討論,但發現傾向性非常強的答案放置在頂端,而較為客觀又干貨滿滿的回答被放置在底端)
(2)普通用戶也許更愿意答題了。知乎的首頁timeline來自用戶關注的人。以前知乎大v出場自帶500贊(當然可能也自帶500反對)。而新算法按照贊同比排序。即使已經有了幾千個回答,幾個贊同仍然能讓新的優質答案被放置在頂端。小透明也不怕被無視了。
(3)專業領域下大v的作用更明顯了(新算法本就加強了用戶投票對排名的影響,擁有專業領域下投票加權的大v的投票可能更為關鍵。很可能大v點一次反對,頂端的答案立馬下沉,底端的答案瞬間置頂)
總而總之,新算法是有利有弊的,但更多應該是利大于弊。
其他采用威爾遜算法的網站還有:reddit,yelp,digg(我懷疑虎撲步行街評論,網易云音樂評論也是類似算法,但是沒有證據……)
讓優質答案得到更多的曝光。包括得到點贊,推薦到知乎日報,官方微博,發現頁面等。
知乎首頁的timeline是用戶關注的人的動態。如果你關注了一個人,就會看見這個人所有的動態。這極大地增強了知乎的媒體屬性,讓話題得到快速的傳播(之前的童瑤,血友病吧,阿里巴巴月餅)并且回答詳情需點進原文查看,而不是新浪微博的轉發。這極大地增強了答案的曝光率。
對于一部分優質內容的生產者來說,被推薦到知乎日報/官方微博等,是非常興奮非常爽的事情。得到認可是很強大的激勵。是馬洛斯需求理論最頂端的一層。如果你認真輸出過內容,比方寫過公眾號/知乎回答/帖子。比方認真更快手/美拍/B站,你就明白看見自己作品的點擊量與回復數量上升的快感。對于很多知乎用戶來說,這比金錢利益激勵更重要。
而對于另一部分生產者來說,他們在知乎上花精力輸出內容,營造個人品牌,可以產生更多利益。比方說引流到自己的公眾號/pr宣傳/求職招聘/軟廣告等。任何平臺都有這樣的行為。(微博營銷號/微信訂閱號廣告/B站UP主/直播主播/快手小廣告/今日頭條號/論壇版商等等等等)這樣的行為對于內容生產者和平臺來說是雙贏。而對于平臺來說,要合理把控這樣的行為,找到平臺,內容生產者,用戶的平衡點。
促進交流
更好的營造討論的氛圍,讓回答發表后可以得到有質量的評論。
激發歸屬感和認同感
這里有我喜歡的內容/用戶,我希望能加入他們
在知乎,一個問題可能對應N條回答。特別是熱門話題,可能會看見幾千條回答。你可能會在知乎看見針對熱門事件的不同角度的分析。(阿里巴巴月餅、支付寶紅包、血友病事件等)。
知乎首頁呈現的信息是關注人的動態。這極大地加強了知乎的媒體屬性,讓新鮮熱門的話題得到快速的傳播。如果大v點贊或者回答某個問題,所有粉絲都能看見(比方說輪子哥觀光團)。那么知乎和微博這樣媒體屬性極強的應用有什么區別呢?
微博的媒體屬性極強,轉發輕松便捷。信息可以飛速傳播,瞬間得到成百上千次轉發。但微博呈現出來的是單條內容。信息碎片化極強,信息多而無序。討論僅限于某條單獨的微博,而非整個事件。微博難以形成討論和知識沉淀的氛圍。信息會隨著時間而迅速的沉淀。(如果你在微博搜索某關鍵詞,會出現很多很多條信息,但是想要整理出較為完整的信息,想要看到不同種觀點和看法,這是比較困難的。在傳統bbs、微信公眾號也是這樣。即使是在bbs的精品區,想要找到對于同一個問題的不同看法的帖子也較為麻煩。而找到自己喜歡的微信公眾號也并不容易,公眾號也更像是孤島。)
但是在知乎,搜索某個關鍵詞,看到的是若干個相關問題:一個問題下有N個回答??赡苤恍枰匆粋€問題下的回答,就能找到自己需要的信息。問題和回答更多偏重于分享思路,而非實現細節(舉例:知乎上的問題是“怎樣的健身計劃是真正合理的?”其他平臺上的問題可能是“我在做xx健身操,第三課第六屆第十八個動作這樣做對嗎?”)問題的回答是開放性的,也沒有時間限制。
新回答可能會源源不斷的產生。問題被提出后,關注問題的人可以不斷看到新產生的討論和回答,從而完整的了解問題全貌。通過點贊和反對,回答將會被恰當的排序。
知乎的產品選型天生適合以問題為核心的討論。而優質的內容,是對喜愛內容的用戶的天然篩選。
有了內容,有了內容的傳播機制(點贊,關注等)。自然能夠產生內容與用戶之間的聯系,產生人和人之間的聯系。
參考內容
- 《認真的人永遠存在:關于知乎,這可能是最真誠的一篇分享了》——閆浩
- 《我在知乎做運營,一個知乎離職妹子的3年運營感悟》——拉勾網lagou
- 《社區產品如何冷啟動,看看知乎早期是怎么做的》——Shokunins
- 《知乎產品體驗分析 》——交槍不殺
- 《基于用戶投票的排名算法(五):威爾遜區間》——阮一峰
- 《How Not To Sort By Average Rating》——Evan Miller
- 《知乎問題:如何評價知乎的回答排序算法?》
- 《知乎問題:知乎如何計算用戶在某個領域下的權重?》
- 《這次,我給知乎點32個贊同——淺析知乎新的回答排序算法》——曾加
作者:?phhhy
來源:http://www.jianshu.com/p/4a42d0fbf8c7
本文由 @phhhy 原創發布于人人都是產品經理。未經許可,禁止轉載。
BaiDu搜索“暴雨推廣”暴雨營銷,靠譜!
很贊~~
有時候,我們在聽BAT的成功之路和模式,就像聽愛因斯坦的成功之路一樣!然而,問題的核心是,我們改如何修煉自己
可否標明出處后轉載簡書?