為什么用戶調(diào)研需要50位定性和500份定量呢
為什么我們做用戶調(diào)研時(shí),樣本量不是50就是500這樣的數(shù)字?為什么不是300,或者是20這樣?作者通過自己公眾號為例,對這個(gè)問題進(jìn)行了詳細(xì)的分析,并解釋了背后的理論依據(jù),分享給大家。
教員經(jīng)常講,你對于某個(gè)問題沒有調(diào)查,就停止你對于某個(gè)問題的發(fā)言權(quán)。
要注重調(diào)查、反對瞎說。
今天某個(gè)朋友在問我定性和定量調(diào)研的關(guān)系,問定性調(diào)研為啥是50位,不是30不是100呢?
有沒有理論支撐?
我當(dāng)時(shí)被問住了,尷尬了回了句 哈哈哈,好問題。
午飯后,重新思考了這個(gè)問題,做一個(gè)簡單的梳理。
定性調(diào)研:
已購用戶定性調(diào)研,有幾個(gè)關(guān)鍵性的指標(biāo)要明確。
1、用戶是誰
2、用戶在哪
3、用戶使用產(chǎn)品屬于什么階段
舉個(gè)例子,
我在寫公眾號,我的產(chǎn)品就是輸出關(guān)于機(jī)器人賽道相關(guān)的東東。
那我做定性調(diào)研怎么做呢?
一、用戶是誰
通過后臺數(shù)據(jù)會發(fā)現(xiàn),我的公眾號粉絲男女比例,差不多4:1
那我做調(diào)研男女比例也要遵循這個(gè)邏輯。
用戶是誰還要包含年齡、職業(yè)、收入、等等維度,那個(gè)群體多那個(gè)群體相對比例也要增加。
那我在訪談時(shí)就要側(cè)重在26-45的年齡區(qū)間。
二、用戶在哪呢?
還是以我公眾號為例,那我的訪談重點(diǎn)區(qū)域就在這幾個(gè)地方。
繼續(xù)拆解,廣東訪談重點(diǎn)在深圳,江蘇訪談重點(diǎn)在蘇州。
三、用戶使用產(chǎn)品屬于什么階段
1、未使用人群
2、已使用人群
3、重度體驗(yàn)人群
按照階段再結(jié)合地區(qū)和用戶分解
3(階段)x2(性別)xN(地區(qū)選擇)xS(年齡選擇)
按照我的來看
3x2x4x2=48人
這還沒按照粉絲比例去做調(diào)整,那50位是不是算合理呢。
新產(chǎn)品的調(diào)研也可以做參考,也是適用的。
定量調(diào)研:
500份的調(diào)研樣本不代表回收的有效數(shù)據(jù),那為啥是500呢?
我們在讀書階段可能都接觸過一部分統(tǒng)計(jì)學(xué),在統(tǒng)計(jì)學(xué)里有個(gè)概率問題。
我不做科普,樣本量其實(shí)也有幾個(gè)關(guān)鍵性指標(biāo)。
1、置信區(qū)間
2、置信水平
3、人口規(guī)模
4、標(biāo)準(zhǔn)差
感興趣的自行百度
那統(tǒng)計(jì)學(xué)中有一個(gè)概念叫做Z分?jǐn)?shù)。
Z 分?jǐn)?shù)是統(tǒng)計(jì)學(xué)中的一個(gè)概念,它表示你的分?jǐn)?shù)距離平均值有多少個(gè)標(biāo)準(zhǔn)差。在計(jì)算樣本大小時(shí),Z 分?jǐn)?shù)代表了你想要的置信水平。
常見的置信水平有 90%,95%,和 99%,它們對應(yīng)的 Z 分?jǐn)?shù)分別大約是 1.645, 1.96, 和 2.576。
正太分布Z值表是現(xiàn)成,可以看下圖
正態(tài)分布Z值表怎么看呢?
比如,我們想要找到置信水平為 90% 的時(shí)候,Z 分?jǐn)?shù)是多少?
90% 的置信水平意味著中間覆蓋了總體的 90%,留下兩端各占 5%(100% – 90% = 10%,兩端各占一半,所以是 5%)。
在標(biāo)準(zhǔn)正態(tài)分布中,這意味著你需要找到累積概率為 95%(50% + 45%)的 Z 分?jǐn)?shù)。因?yàn)閺淖钭蠖说街虚g覆蓋了 50%,再加上從中間到你的 Z 點(diǎn)的 45%。
使用正態(tài)分布Z值表
找到對應(yīng)的行和列,然后沿著這行和列確定交點(diǎn),你就可以找到對應(yīng)的 Z 分?jǐn)?shù)。如果表是從最左側(cè)到 Z 點(diǎn)的累積概率,你會找到累積概率為 0.9500 左右的 Z 分?jǐn)?shù)。
好像還是沒聊到樣本量,別著急。
當(dāng)你了解了這些信息,自然就會了解到一個(gè)公式
1)置信水平(Z 分?jǐn)?shù)):你需要多大的置信度?這決定了你的 Z 分?jǐn)?shù)。
2)預(yù)期的效應(yīng)大?。≒):這通常是你希望能夠檢測到的最小變化或差異。
通常使用 P = 0.5 作為保守估計(jì),因?yàn)檫@會給出最大的樣本大小。
3)標(biāo)準(zhǔn)差(e):預(yù)期答案的變化范圍。
如果你不確定,可接受的誤差范圍 e 可以用 0.05(即 5%)作為一個(gè)保守估計(jì)。
假設(shè)我們要計(jì)算的情景如下:
置信水平是 95%,所以 Z = 1.96
預(yù)計(jì)效應(yīng)大?。ū壤㏄ = 0.5
可接受的誤差范圍 e = 0.05(即 5%)
我們將這些值代入公式中:
N = (1.962 × 0.5 × (1 – 0.5)) / 0.052 = 384.16
根據(jù)計(jì)算,當(dāng)置信水平為 95%,預(yù)期效應(yīng)大小為 0.5,且可接受的誤差范圍為 5% 時(shí),所需的樣本大小大約為 384.16。
用樣本計(jì)算器計(jì)算,用戶基數(shù)十萬人,有效樣本量382就可以覆蓋。
用戶基數(shù)100萬,有效樣本量384。
用戶基數(shù)一個(gè)億,你會發(fā)現(xiàn)還是384。
神奇不?
沒有調(diào)查,我怎么可能瞎說。
以上
本文由人人都是產(chǎn)品經(jīng)理作者【new bo】,微信公眾號:【new bo】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!