產品策略算法——神奇的對數
在產品策略公式中,如果加減乘除實在搞不定,那么你可以試著用一下對數。
1. 生活中的對數
作為一個數學渣,實在無力從對數的起源開始一番復雜的推導然后再得出結論。直接給出一個判斷吧——需要用對數處理才能很好計算的數據,基本上都是符合長尾分布的數據。
長尾分布的特點是,少數的item集中了大量的份額,但是在數值上,尾部的item的數值下降非常緩慢,不會直接下降為零。這么說可能有點蒼白,那么舉幾個例子好了。
人的收入,年收入1萬~10萬的人是大多數,年收入10萬~100萬的比較少,年收入大于1000萬的更少,但是年收入大于1000萬的人卻占據了社會財富的大多數份額。
電商中,店鋪銷量最高的店鋪占據了GMV的大多數,商品頭部爆款占據了GMV的大多數。
知乎中,頭部的大V占據了大多數的關注,高票答案占據了知乎大多數的贊同。
自然界,對于地震的衡量是使用對數的,地震等級每相差2級,能量增加1000倍。
人的感覺上的強度,大約和刺激強度的對數成正比。比如,我們感覺聲音大了一倍,不是因為聲源功率增加了一倍,而是聲源功率增加了一個數量級。
2. 一個幾乎萬能公式
其實在之前的文章中,不止一次出現過對數的使用。比如:
在《Feed流設計:怎樣用策略掌控用戶視線》中,介紹了一個來自Reddit的核心排序算法,在兼顧了Feed流中頭部都是熱門數據的基礎上,能夠自動完成數據的更新。
在《【搜索Case分享】五分鐘,教你優化知乎搜索》中,最終給出的用戶搜索排序算法,既保證了用戶之間的關注關系得到了尊重,也保證了用戶的搜索相關度得到了尊重,同時也保證了粉絲數和贊同數能起到作用。
這些例子其實都是下面這個幾乎萬能的公式的變形:
其中a代表根據需求需要調整的參數,M代表業務數據,M之所以要+1,一方面是歷史的進程,另一方面也是為了保證為正值。這個公式是為了平衡長尾分布的業務數據與有界的關鍵性數據之間的關系。
這個公式之所以說萬能,是因為大部分產品數據都可以分為長尾分布的業務數據,或者有界的關鍵數據。比如搜索就是典型的例子,長尾的業務數據就是銷量或者點擊量,有界的關鍵性數據就是文本相關度。
3. 策略公式的應用
接下來就是舉例子的時刻了。
場景一:假如淘寶店鋪,年末要搞一個最佳店鋪排行榜
這個時候肯定是要用到GMV(銷售額),也需要用到DSR(detail seller rating,就是寶貝描述,服務態度,發貨速度這些)。上面我們已經討論了,淘寶的銷量是數量差別是非常大的。大店鋪每月銷售額10億的數量級,小的精品店10萬銷售額也不錯。如果單純用銷量去排列,很多精品店無法挖掘,如果單純用DSR排列,則不考慮GMV,這無法體現大店鋪的優勢。
這個問題中,DSR是有界性關鍵指標,GMV為長尾分布的業務數據。那么排序公式可以是:
假如a取1:
- 一個GMV為1億,DSR為4分內的店鋪A分數為11
- 一個GMV為1000萬,DSR為3分的店鋪B分數為10
- 另一個GMV為100萬,DSR為4.5分的店鋪C分數為10.5
A>C>B,比較起來就比較公平,一個店鋪的命運當然要考慮自己的努力(DSR),但是也好考慮歷史的進程(GMV)。
場景二:知乎要搞一個知乎最佳貢獻者排行
這個時候既要考慮這一年收獲了多少贊,也需要考慮這個人的答案質量,假如粗暴地認為答案質量度為(閱讀+5*點贊+15*收藏)/曝光次數,如果只考慮質量度,筆耕不輟的人怎么辦?如果只考慮收貨贊的數量,那么一些長期抖機靈沒營養的人可能會占便宜。
這個問題中,質量度是有界性關鍵指標,點贊數為長尾分布的業務數據。那么排序公式可以是:
假如a取1:
- 一個用戶A答案質量度為5,贊同數為1萬,則得分為9
- 一個用戶B答案質量度為3.5,贊同數為10萬,則得分為8.5
用戶A排名大于B。
場景三:如何幫三毛找對象?
荷西問三毛:你想嫁個什么樣的人?
三毛說:看的順眼,千萬富翁也嫁??吹牟豁樠郏瑑|萬富翁也嫁。
荷西就說:那說來說去你還是想嫁個有錢的。
三毛看了荷西一眼說:也有例外的時候。
“那你要是嫁給我呢?”荷西問道,
三毛嘆了口氣說:要是你的話那只要夠吃飯的錢就夠了。
“那你吃的多嗎?”荷西問道。
“不多不多,以后還可以少吃一點?!比⌒牡恼f道。
在這個例子中主觀評分的是否順眼為關鍵性指標(假設為1~5),財富值為重要的業務指標。那么排序公式為:
因為三毛非常看重是否match(順眼),所以a我們假設為2,那么:
- 千萬富翁A,順眼指數為4,則得分15;
- 億萬富翁B,順眼指數為2,則得分12;
- 荷西沒錢,順眼指數為5,則得分為10。
這個時候我們發現這個公式沒有解決問題,荷西不是最高的。三毛會選擇千萬富翁。
hmmm,這就是為什么我說這個公式是一個幾乎萬能的公式,而不是萬能的公式。因為總有些異常的case需要進一步處理。
如果算法改為:
if(name=“荷西”)
{
score=100;
}
else
{
}
這個問題就迎刃而解了。
4. 總結
這確實是一個幾乎萬能的公式,但是M值怎么選取,X值怎么選取,參數怎么制定,就需要產品經理對業務有自己的思考了。業務理解力是前提,公式的靈活運用,都是在業務理解力的前提下才能發揮作用。
理解公式是一個層次,靈活運用公式是一個層次,而在靈活運用公式的同時,再加上對業務的思考,則又是另一個層次了。
本文在使用的案例的都是比較理想案例,在真實案例中,數據往往不能直接比較,而是設置不同的參數,那么有什么常見的闡述設置情形呢?又有什么常見的參數設置方法呢?
本文由 @潘一鳴 原創發布于人人都是產品經理。未經許可,禁止轉載。
大佬新書什么時候上線,舉手報名預購
干貨哈 ??
請教:“這個問題中,質量度是有界性關鍵指標,點贊數為長尾分布的業務數據。那么排序公式可以是”這句話種的“質量度”是不是應是“閱讀數”啊?
往前看,這里說的就是質量度
有意思~
不裝逼的說。。。。公式一個沒看懂! ??
荷西的順眼指數是10086好嘛~
厲害
“M之所以要+1,一方面是歷史的進程”
太暴力了