客戶體驗:問卷調(diào)研的樣本量大小怎么確定?

0 評論 4803 瀏覽 14 收藏 13 分鐘

在問卷調(diào)研工作中,不少小伙伴可能會不太清楚如何確定樣本量。本文就對這一問題做了闡述,一起來看看。

在體驗管理日常的問卷調(diào)研工作中,樣本量大小的確定一直是很多小伙伴搞不清楚的地方。

現(xiàn)在網(wǎng)上也有一些免費的工具可以幫助進行計算,不過如果你缺少對其中變量的理解,就是拿到一個樣本量的大小,也不知道怎么去解釋,這很容易被其他人質(zhì)疑

理解這個事情一點都不難,你花幾分鐘時間,我來給你講講~

以下,enjoy~

一、什么是調(diào)研樣本量?

?? 想象一下,你很好奇早餐吃 Weetabix(一種早餐麥片)的長跑運動員和不吃的運動員在比賽中的表現(xiàn)是否有差異???

要弄清楚這個問題,理論上我們需要調(diào)查全世界的長跑運動員,但這顯然不現(xiàn)實。

這時候,樣本大小就變得重要了。

樣本大小是指你在調(diào)查、研究或?qū)嶒炛邪ǖ氖茉噷ο髷?shù)量。

在對大量人群進行調(diào)查時,選擇正確的樣本大小至關重要,因為你不可能向每個人收集數(shù)據(jù)。相反,你可以從整個群體中隨機抽取一些人,讓他們代表整個群體

假設你是一家咖啡店??的老板,你想知道顧客對新推出的「榛果拿鐵??」的喜好程度。你的咖啡店在全國有 500 多家分店,服務超過百萬的的顧客。

顯然,你無法詢問每一位顧客他們對「榛果拿鐵??」的看法,因此你需要進行抽樣調(diào)查。

在這個例子中,樣本大小就是你選擇調(diào)查的顧客數(shù)量。假設你決定調(diào)查 1,000 名顧客。

這 1,000 名顧客需要隨機選擇,以確保他們能夠代表你所有的顧客。這樣,無論是常來的老顧客還是偶爾光顧的新顧客,都有機會被包括在你的調(diào)查中。

通過這 1,000 名顧客的反饋,你可以得到一個關于顧客對「榛果拿鐵??」喜好度的大致了解。

比如,如果 750 名顧客表示喜歡這款新飲品,你可以說,在一定的置信水平和置信區(qū)間下,大部分顧客對「榛果拿鐵??」持積極態(tài)度。

這樣的調(diào)查結(jié)果可以幫助你做出是否繼續(xù)推廣「榛果拿鐵??」或調(diào)整食譜的決策。

通過這個過程,我們可以看到,合理的樣本大小對于獲取可靠信息,幫助我們做出更好的決策是非常關鍵的。

二、計算樣本量需要了解什么?

當我們想了解一個大群體的某個特征時,通常不可能問遍每個人,這時候就需要抽樣調(diào)查。

但怎么確保我們抽取的這一小撮人能代表整個群體呢?這就需要用到幾個關鍵概念:置信區(qū)間、置信水平、人口規(guī)模和標準差。

1)置信區(qū)間(Confidence interval)

置信區(qū)間就像是給我們的調(diào)查結(jié)果劃定一個合理的誤差范圍(margin of error)。

比如,我們在母親節(jié)調(diào)查了一群杭州的朋友,發(fā)現(xiàn) 65% 的人計劃給母親買禮物,置信區(qū)間是 ±2.75%。

這就像是說,我們非常有信心(但不是 100% 確定)真實的比例會落在 63.25% 到 67.75% 之間。

想象一下,你用尺子量東西,但尺子上的刻度有點模糊,所以你會說這個長度大概在 9 到 11 厘米之間,這個“大概”就類似置信區(qū)間。

2)置信水平(Confidence level)

置信水平告訴我們這個“大概”有多靠譜。

如果置信水平是 95%,那就像是說,如果我們進行 20 次獨立的同樣調(diào)查,有 19 次的結(jié)果都會落在那個置信區(qū)間內(nèi)。

這就像是你重復 20 次測量,19 次的結(jié)果都在 9 到 11 厘米之間。

3)人口規(guī)模(Population size)

人口規(guī)模就是你研究對象的總數(shù)。

比如全杭州人就是你的研究對象,那人口規(guī)模就是杭州的總?cè)丝跀?shù)。

4)標準差(Standard Deviation)

標準差是衡量數(shù)據(jù)變化的一種方式。

如果大家的回答的選項都差不多,那標準差就小;如果大家的回答參差不齊,標準差就大。標準差小,你需要的樣本量就會少一些;標準差大,你需要更多樣本來確保調(diào)查結(jié)果的準確性。

當我們把這些因素結(jié)合起來,就可以計算出需要多大的樣本量才能讓我們的調(diào)查結(jié)果既準確又有信心。

如果我們不希望誤差太大,就需要更多的樣本;如果能容忍較大的誤差,樣本量可以少一些。

當然,如果調(diào)查的問題非常關鍵,比如涉及到重大決策,我們就會希望誤差盡可能小,這時就需要更多的樣本來確保結(jié)果的可靠性。

三、如何計算樣本量的大???

要計算樣本大小,了解如何使用 Z 分數(shù)和樣本大小公式是關鍵。即使你不知道總體的確切規(guī)模,這些信息仍然可以幫助你確定需要多少樣本來進行有效的調(diào)查或研究。

1. 什么是 Z 分數(shù)(Z-score)?

Z 分數(shù)是統(tǒng)計學中的一個概念,它表示你的分數(shù)距離平均值有多少個標準差。在計算樣本大小時,Z 分數(shù)代表了你想要的置信水平。

常見的置信水平有 90%,95%,和 99%,它們對應的 Z 分數(shù)分別大約是 1.645, 1.96, 和 2.576。

這里面我們需要使用到「正態(tài)分布Z值表」來幫助我們進行查找,下面是完整的表,可以存起來后面方便使用。

正態(tài)分布 Z 值表怎么看呢?

比如,我們想要找到置信水平為 90% 的時候,Z 分數(shù)是多少?(說明:你只知道置信水平是 90%,但不知道相應的 Z 分數(shù)是 1.645

1)理解置信水平與 Z 分數(shù)的關系

90% 的置信水平意味著中間覆蓋了總體的 90%,留下兩端各占 5%(100% – 90% = 10%,兩端各占一半,所以是 5%)。

在標準正態(tài)分布中,這意味著你需要找到累積概率為 95%(50% + 45%)的 Z 分數(shù)。因為從最左端到中間覆蓋了 50%,再加上從中間到你的 Z 點的 45%。

同樣的,可以知道 95% 和 99% 應該通過以下數(shù)字查表:

  • 95% → 5%/2 = 2.5% → 97.5%
  • 99% → 1%/2 = 0.5% → 99.5%

2)使用Z分數(shù)表

在正態(tài)分布 Z 值表中,你通常會找到累積概率(從最左側(cè)開始計算的面積),或者從平均值到 Z 點的累積概率。你需要找到累積概率接近 95% 的 Z 分數(shù)。

3)查找累積概率

在正態(tài)分布 Z 值表中,找到累積概率最接近 95% 的條目。通常的表類型會是從最左側(cè)到 Z 值的累積概率,意味著是從標準正態(tài)分布的最左端(理論上是負無窮大)到特定 Z 值的累積概率。你需要在表中,找的是 0.9500 左右的值。

注意,還有另外一種表是顯示從平均值到Z點的累積概率,即從標準正態(tài)分布的平均值(Z = 0)到特定Z值的累積概率。如果屬于這種情況,你應該找接近 45%(或 0.4500)的值。

我所演示內(nèi)容是前者,直接找接近 0.9500 左右的值就可以。

4)確定 Z 分數(shù)

找到對應的行和列,然后沿著這行和列確定交點,你就可以找到對應的 Z 分數(shù)。如果表是從最左側(cè)到 Z 點的累積概率,你會找到累積概率為 0.9500 左右的 Z 分數(shù)。

從表中,我們可以看出 95% 存在于 1.64 到 1.65 之間,所以我們找到中間值,Z 分數(shù)就等于 1.645。

所以,置信區(qū)間為 90%,Z 分數(shù)為 1.645。

同樣,置信水平 95% 和 99%,也可以通過對照表找到相應的 Z 分數(shù)。

2. 使用樣本量公式計算

計算樣本大小時,你需要知道以下幾點信息:

1)置信水平(Z 分數(shù)):你需要多大的置信度?這決定了你的 Z 分數(shù)。

2)預期的效應大?。≒):這通常是你希望能夠檢測到的最小變化或差異。假設我們沒有先驗知識,通常使用 P = 0.5 作為保守估計,因為這會給出最大的樣本大小。

3)標準差(e):預期答案的變化范圍。如果你不確定,可接受的誤差范圍 e 可以用 0.05(即 5%)作為一個保守估計。

一旦你有了這些信息,就可以使用樣本大小公式來計算所需的樣本量。樣本大小公式可以幫助你根據(jù)上述因素確定需要調(diào)查多少人,以確保你的調(diào)查結(jié)果既有統(tǒng)計意義又具備代表性。

以一個簡化的公式為例,樣本大小可以用下面的公式估計:

如果你不知道總體規(guī)模,這個公式可以給出一個不考慮總體大小的樣本估計。這個方法特別適用于大總體,因為當總體規(guī)模非常大時,樣本大小不太受總體大小的影響。

假設我們要計算的情景如下:

  • 置信水平是 95%,所以 Z = 1.96
  • 預計效應大?。ū壤㏄ = 0.5
  • 可接受的誤差范圍 e = 0.05(即 5%)

我們將這些值代入公式中:

N = (1.962 × 0.5 × (1 – 0.5)) / 0.052 = 384.16

根據(jù)計算,當置信水平為 95%,預期效應大小為 0.5,且可接受的誤差范圍為 5% 時,所需的樣本大小大約為 384.16。

在實踐中,我們通常會取整數(shù),因此需要約 384 或 385 個樣本來滿足這些條件。這意味著如果你進行調(diào)查或?qū)嶒?,你需要至?384 名參與者來確保你的結(jié)果具有統(tǒng)計意義。

以上。

專欄作家

龍國富,公眾號:龍國富,人人都是產(chǎn)品經(jīng)理專欄作家,CxHub主理人。致力于終身學習和自我提升,分享用戶研究、客戶體驗、服務科學等領域資訊,觀點和個人見解。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)授權(quán),禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!