清明節,用數據思維案例聊聊平均死亡年齡和期望壽命
本文中,筆者將結合清明節聊一聊如何用數據思維分析“平均死亡年齡”和“期望壽命”。
前些天,我所在的一個產品經理群里面,無意中有人聊到了社保,繼而聊到了關于中國人平均壽命的問題。問題如下:
中國現在對外公布的平均壽命,如:2018年平均壽命75歲,是一個名叫“期望壽命”的指標。
而中國人2018年的平均死亡年齡實際上只有66歲左右,所以群里有人認為,期望壽命是國家忽悠人一個指標,應該用平均死亡年齡來作為平均壽命的指標。
對此,你有什么看法呢?
中國人到底壽命多長,如果讓你去收集數據然后得出結論,你會怎么做?
要知道平均壽命66歲和75歲,差別可是非常巨大的,會導致完全不同的輿論和國家政策。
群里面不少人隨聲附和,什么毒奶粉地溝油又被提起了,然而一個專業的產品群居然很少有人對上面的說法提出質疑。
看到大家的反應,我擔心的倒不是中國人的平均壽命,而是擔心產品經理的整體職業素質。
作為職業產品經理,平時都說自己根據數據分析來改進結果,這么多人對于這么明顯的數據坑不能識別,那么得有多少決策是錯誤的?
在很多人看來,產品經理可能是一個門檻很低的職業,然而數據思維真的是很多人的硬傷。
數據思維不就是統計統計平均值,比比大小嗎?
還真沒有這么簡單,有的看似很簡單的問題,卻藏著巨大的坑。
忽略掉基數,是很多時候數據分析的一個大坑,對認真學過統計的人,識別這個坑并不難,但是多數產品人員并不能,只會做簡單點加減乘除求平均。
就像上面那個問題一樣,如果想要計算一個國家人口的平均壽命,就把死亡年齡算個平均數不就OK了。
你要是不這么計算,他還說你把簡單的事情復雜化。被“簡單化思維”洗腦的人群其實也蠻可怕的,會變得有點反智。
這個世界上有的東西本質上就是不能簡化的,過度簡化就是錯誤。
一、平均死亡年齡
平均死亡年齡是一個很容易理解的指標,就是把當年所以死亡人口的年齡算平均。但這個具有誤導性的統計指標,代表不了人群的平均壽命。
為了說明問題,我們來簡化一下問題。假設有兩個群體:
- 第一個群體:由十個10歲的人和五個70歲的人組成;
- 第二個群體:由五個10歲的人和十個70歲的人組成。
2018年,第一個群體中,10歲的人死亡2個,70歲的人死亡4個;第二個群體中,10歲的人死亡1個,70歲的人死亡8個。如下圖所示:
算平均死亡年齡,第一個群體:50歲,第二個群體:63.3歲。
于是,有的人可能就想得出結論:第二個群體的人口比第一個群體人口人均壽命更長。
但是我們仔細看看:
這兩個群體,10歲的死亡率都是20%,70歲死亡率都是80% 。刨除掉不同年齡階段人口基數的誤導,這兩個群體的兩個年齡階段的死亡率是完全相同的,也就是說,這兩個群體的人壽命應該是相同的。
然而,平均死亡年齡這個指標卻相差很大,平均死亡年齡將不同基數混淆在里面了,沒有任何的意義。
一個年輕人非常多的國家,只要年輕人意外死亡很小一部分比例,就能把平均死亡年齡拉的很低,造成大家壽命短的假象。而一個年輕人很少的老齡化的國家,平均死亡年齡就會被拉得很高。
中國當前就是中年、青年人口更多,所有平均死亡年齡會比較低。如果你用平均死亡年齡當壽命指標,就會被誤導。
想要真正反映一個國家當前人口的健康及壽命的狀況,需要刨除掉不同年齡人口基數的影響,要用到一個叫做期望壽命的指標。
期望壽命雖然叫“期望”,但并不是指的“期待”的意思,這個期望是“數學期望”,反應的是當下人真實壽命的,是刨除掉了基數影響的平均壽命。
二、期望壽命
為了刨除掉基數的影響,期望壽命的計算使用死亡率而不是死亡人數。
假設一個群體中年齡最大的是n歲,年齡最小的1歲。
假如在2018年,1歲人群的死亡率是A1(死亡率是一個百分數),2歲人群的死亡率是A2 , 3歲人群死亡率A3,以此類推,n歲人群死亡率 An。
那么人均預期壽命為:
1*A1 + 2*(1-A1)*A2 + 3*(1-A1)*(1-A2)*A3 + 4*(1-A1)*(1-A2)*(1-A3)*A4+….(直到n歲)
這個計算方法,是根據當年各個年齡階段的死亡率來計算平均壽命的,直觀感覺有點類似于有一個虛擬的人在同一年從出生到死去,平均會在多少歲死亡。
還有一種錯誤的理解,在一些網頁新聞中能夠見到。他們認為:2018年的期望壽命是2018出生的人預計能活到多少歲,這也是完全錯誤的。
期望壽命是當前人口刨除掉基數影響后壽命的數學期望值,不是對新生人口未來的預計。
三、總結
在做產品數據分析的時候,也有不少這樣的問題。比如:有的人就直接把不同渠道的轉化用戶直接相加,或者把不同地區的轉化用戶相加等。
要知道這些數據的基數都是不一樣的,很有可能會得出誤導性的結論。
有的人說數據是不會騙人的,其實,數據是最會騙人的,數據思維不過關的更容易被數據欺騙。
數據思維也不是想某些文章講的那樣,有意識地去看看數據就是有數據思維了,那頂多稱得上數據意識。
后續有機會還會繼續分享數據思維相關的問題。
本文由 @ArvinNing 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
這么極端的例子算出來也就差十來歲。
你這個例子,到第二年第三年,逐漸的這兩國的平均死亡年齡就趨于相等了
同為心理學碩士,能不能加個微信交流下???
事實上產品經理就是要學會思考生活。而且生活中的思路產品的思路是一樣的,這個職業就是這樣的,不喜歡嫌累可以盡早別干
感覺真的沒必要分析,如果做這方面工作,那無可厚非,但是產品經理也是人,如果時時刻刻用工作的思維分析生活中的所有事情,那真的會累死的,至少我這種俗人做不到
我覺得反智說的就是你這樣的人,只是一個例子而已工作中生活中都一樣的道理
大一學的概率論又撿起來了 ??