正態(tài)分布在用戶等級劃分的應(yīng)用

4 評論 16744 瀏覽 78 收藏 4 分鐘

為了便于描述和應(yīng)用,常將一般正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。通過查標(biāo)準(zhǔn)正態(tài)分布表,就可以直接計算出原正態(tài)分布的概率值。

  • 問題:根據(jù)用戶播放時長,劃分若干等級。目前可使用的數(shù)據(jù)為日人均播放時長。等級從低到高,要求達(dá)到的時間越來越長。
  • 理論:日人均播放時長符合正態(tài)分布,可通過繪制QQ圖驗證。

正態(tài)分布圖如下:

可知,3σ原則為:

  • 數(shù)值分布在(μ-σ,μ+σ)中的概率為0.6827
  • 數(shù)值分布在(μ-2σ,μ+2σ)中的概率為0.9545
  • 數(shù)值分布在(μ-3σ,μ+3σ)中的概率為0.9973

即x≥μ-σ的發(fā)生概率約84%,x≥μ發(fā)生概率約50%,x≥μ+σ發(fā)生概率約16%,x≥μ+2σ發(fā)生概率約為3%。

實踐:

本例中要求劃分為4個等級:

  • 第一步,取某足夠長時間的播放數(shù)據(jù);
  • 第二步,計算日人均播放時長(分);
  • 第三步,計算日人均播放時長的平均值μ=62和標(biāo)準(zhǔn)方差σ=12.5;
  • 第四步,計算3σ分布。

  • 第五步,得出各點的概率。

  • 第六步,計算最終時間,單位:分鐘。

解釋:

理論上來講:

  • 84%的人一周后獲得第一個等級;
  • 50%的人一個月后獲得第二個等級;
  • 16%的人6個月后獲得第三等級;
  • 3%的人12個月后獲得第四個等級。

小結(jié):

  • 第一個等級350分鐘——即5.8小時;
  • 第二個等級1860分鐘——即31小時;
  • 第三個等級13500分鐘——即9.4天;
  • 第四個等級31755分鐘——即22天。

展望:

由于一般的正態(tài)總體其圖像不一定關(guān)于y軸對稱,對于任一正態(tài)總體,其取值小于x的概率,只要會用它求正態(tài)總體在某個特定區(qū)間的概率即可。

為了便于描述和應(yīng)用,常將一般正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。通過查標(biāo)準(zhǔn)正態(tài)分布表,就可以直接計算出原正態(tài)分布的概率值。

根據(jù)該理論可以實現(xiàn)任意等級的劃分,只需將正態(tài)分布轉(zhuǎn)為標(biāo)準(zhǔn)正態(tài)分布,根據(jù)每個等級可達(dá)到的概率進(jìn)行查表獲得相應(yīng)的分界點。

 

本文由 @Vector 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. “84%的人一周后獲得第一個等級;50%的人一個月后獲得第二個等級;16%的人6個月后獲得第三等級;3%的人12個月后獲得第四個等級?!?br /> 請問一周、一個月、6個月、12個月這個的依據(jù)是?求科普

    來自北京 回復(fù)
    1. 依據(jù)是你希望多少人達(dá)到的。

      來自山東 回復(fù)
  2. 為什么簡單的一個分層講這么復(fù)雜

    來自上海 回復(fù)
    1. 簡單背后有依據(jù)

      回復(fù)