3分鐘,看懂假設檢驗
編輯導語:假設檢驗與區間估計存在著內在的本質聯系,它們二者都是用于總體參數推斷的統計方法。本篇作者就對假設檢驗的概念和操作方法等進行了總結,一起來看一下。
大家好,我是愛學習的小xiong熊妹。
今天來說說假設檢驗。這是個古老的方法,近年ABtest大行其道,使假設檢驗方法迎來了新一波文藝復興,搞得很多小伙伴都在問:如何做假設檢驗?那一堆似懂非懂的統計符號啥意思?
今天小熊妹幫大家整理了一個懶人攻略,大家抄起來用即可??赡苡忻枋霾粶蚀_的地方,大神們勿噴哦。
一、假設檢驗是干什么的?
假設檢驗最常見的場景有兩個:
總之是吵架必備,懟人利器。
二、什么時候適合用假設檢驗?
當錯誤很明顯的時候,不需要做假設檢驗。
比如銷售、運營的表現不好,可以直接取過往X天的銷售業績、運營指標來看。
如果銷售業績一直下滑,還有啥好說的,這時候不需要假設檢驗,直接開懟。
有些問題不那么明顯,比如上邊吐槽的產品壽命問題,除非產品用到爛,否則不知道壽命是多少。
而當用戶遇到產品壽命很短的問題的時候,他們只會默默換牌子,也很少投訴“不耐用”,此時必須做抽樣檢測,就得用到假設檢驗方法。
在論證新點子很好的時候,也需要先把新點子做出來,再做小范圍測試,此時也要用假設檢驗方法。
總之,假設檢驗方法適合于抽樣檢驗/小范圍測試的場景。
三、假設檢驗是怎么驗的?
眾所周知:證偽比證真容易多了。證真要窮盡各種可能,證偽只要找到反例即可。
假設檢驗的基本思路也是如此,它利用了“小概率事件,不可能在一次小范圍抽樣中發生”的樸素原理,先提一個假設,之后看能否用小概率事件推翻它。
能推翻的,就說明假設不成立;不能推翻,就至少說明不能推翻(是否接受假設,可以再驗證)。
基于這個原理,我們一般把要懟翻的結論,作為原假設,然后試著去懟翻它?。ㄈ缦聢D)
很多小伙伴在這里犯迷糊:到底原假設是啥?
最簡單的判斷方法,就是:想懟翻什么,就把什么放原假設(記得帶等號的一定在原假設)。
不過實踐的時候,還是經常會寫錯,這里需要多加練習才行。
設定原假設以后,還要設定“小概率事件”到底有多小。
一般用顯著性水平α來表示。α是一個人工給定的數,一般給0.10,0.05,0,01看起來夠小就行。
四、得到假設以后怎么操作?
得到假設后,需要選擇合適的檢驗統計量,代入參數,計算是否屬于小概率事件。
檢驗統計量,和要檢驗的假設有關系。
比如上述產品使用壽命問題,是一個典型的單總體(只有一個產品要檢驗)+均值(使用壽命,指的是待檢測產品的平均壽命)檢驗問題,因此可以選用t檢驗。
如果是比例檢驗問題(比如檢驗產品的合格率,合格率=問題樣本/全部抽檢樣本),則可以使用Z統計量(如下圖)
有了統計量以后,可以檢驗是否屬于小概率事件。不同的假設,拒絕不同。
關于拒絕區域,有個簡單的記憶方法,就是:
- 如果假設是等號,拒絕區域就是左右兩側。潛臺詞就是:既然咱倆相等,那檢驗值應該不大不小才對。
- 如果假設是小于號,拒絕區域就是右側。潛臺詞就是:既然你比我小,那檢驗值肯定不太大呀。
- 如果假設是大于號,拒絕區域就是左側。潛臺詞就是:既然你比我大,那檢驗值肯定不能太小呀。
這樣就容易區分了。
當然,有很多統計軟件/算法直接給了P值,大家記得:P值小于0.05就拒絕原假設即可。
五、看個簡單的例子
某產品經理宣稱,目標用戶80%都是年輕人(25歲以下),現隨機抽樣200人,發現146名年齡在25歲以下,問:我們能懟翻產品經理的結論不?
解答過程如下:
原假設被拒絕掉了,我們可以認為產品經理在吹逼,打完收工!
六、從假設檢驗到ABtest
實際上,假設檢驗的類型很豐富。
為了小伙伴們理解方便,上邊舉的是最簡單的單總體問題。
單總體問題,常見于已經有了一個預設結論,之后推翻這個結論的情況。
比如證明新版本A比老版本的數據好看。
我們常說的ABtest,如果是真的是設計兩個版本A版和B版,之后再檢驗AB版的區別,則涉及2個總體的均值/比例檢驗,需要用到不同的統計量。
以上檢驗均值/比例的方法,統稱參數檢驗,還有非參數檢驗,比如檢驗身高和體重之間是否有關系。
這些方法在實際工作中有不同的應用場景,之后再慢慢介紹吧。
作者:碼工小熊,微信公眾號:碼工小熊
本文由 @碼工小熊 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
- 目前還沒評論,等你發揮!