如何確定你的用研樣本量和數據

5 評論 37006 瀏覽 71 收藏 33 分鐘

在這篇文章中,本文作者將推薦一個公式來確定用戶研究中的定性樣本量,且探討如何收集和分析數據,以實現“數據飽和”,最終將提供一個側重本文觀點的案例研究。

Jen正在向一個運營電商網站的客戶展示她的調研報告。她在12個潛在用戶中進行了訪談,目標是了解用戶會在什么樣的條件下選擇線上購物或線下購物??蛻粼儐朖en,她只與12個人進行了交談,為什么他們應該相信她的調研結果。Jen向她的客戶解釋了她的工作流程,分享了她是如何決定樣本量的,以及如何通過數據飽和的角度來收集分析她的數據??蛻粲X得Jen的解釋言之鑿鑿,讓她繼續了她的展示。

序言

用戶研究員必須能確定他們的研究的樣本量??蛻?、同事和投資人想要了解他們是否能相信研究結果的推薦方案。樣本人口組成和數量是他們建立信任的基礎。你是否訪談了對的人?你是否訪談了足夠多的人?研究員還必須知道如何處理他們收集到的數據。如果你沒有提出好的問題和進行深思熟慮的分析,你的樣本量將不起作用。

定量研究手段(如問卷調查)為決定樣本量帶來了有效的統計技術。它是建立在你調研的人口量和調研期望結果的可信度之上的。許多利益相關者對定量研究方法和諸如“統計學意義”的術語相當熟悉。這些利益相關者傾向于將這個認知搬運到所有調研項目中,而且因此希望在不同的研究項目中也聽到類似熟悉的術語和熟悉的樣本量。

而定性研究人員需要為利益相關者設置一個背景。定性研究手段(如訪談)目前沒有普適的技術。盡管如此,這里你可以采取幾個步驟來保證你采集到和分析了正確數量的數據。

在這篇文章中,我將推薦一個公式來確定用戶研究中的定性樣本量。我也將探討如何收集和分析數據,以實現“數據飽和”。最終,我將提供一個側重本文觀點的案例研究。

(Image credit:?Brandon Sax) (View large version)

定性研究的樣本量

作為調研人員,或與調研人員一起工作的同組成員,我們需要了解和向他人傳達為什么我們選擇了某個特定的樣本量。

我先告訴你一個壞消息。在為定性研究決定一個確切的樣本量的問題上,我們并沒有一個被廣泛認同的公式。任何人都說其他人是錯的。但我們擁有的是——?以學術研究先例為基礎的一些建議方針。我曾參與過僅僅訪談了少于10人的項目,也曾參與過訪談了許多人的項目。Jakob Nielson建議可用性測試的樣本量為5個。然而,他增加了一些限定詞,這個建議僅僅適用于可用性測試研究,不包括探索訪談、情境調查或其他在調研初始階段廣泛使用的定性研究方法。

那么,我們應該如何決定一個定性研究的樣本量?我們需要了解我們的調研目的。我們實施定性研究來獲取某個事物(一個活動、問題、難題或解決方案)的深度理解。這與定量研究是不同的,定量研究的目的是量化或測量某個事物的存在。定量研究通常提供的是對某個事件的淺層且寬泛的視野。

你可以在滾動的基礎上去決定你的定性研究的樣本量。也可以在調研前就先闡明樣本量。

如果你是一個長達數年項目的學術研究員,或者你擁有大量的預算和很長的時間線,建議你采用滾動樣本。你將從預先設定好數量的受訪者中收集數據,在此同時,分析這些數據然后決定是否需要繼續收集更多的數據。這個方法能為你的發現帶來了大量的數據和更真實的證據。你將對你想要去定位的問題擁有更深層和更廣闊的視野。到你已經不再需要繼續收集數據時,數據收集終止。這樣一來,你可能會最終得到一個更大的樣本量。

大多數客戶或項目需要你闡明一個預先決定好的樣本量。事實上,預算和時間通常決定了樣本的大小。如果你的項目期望在8-10周的時間里完成調研-設計-開發工作,你將不會有足夠的時間來訪問50個人并且對數據做嚴謹的分析。一個10到12的樣本量可能對于這樣的項目來說更加現實。從調研開始到分析完畢,你只擁有2周的時間。當你耗盡了你的調研資源時,調研將終止。但我們的客戶和同行想要我們根據這個數據給出一個有影響力的推薦方案。

你對滾動或先決樣本量的使用將決定你如何解釋為什么你終止了數據收集。對于滾動樣本,你可以說:“我們在分析之后,發現收集更多的數據將不再出現有價值的樣本,因此終止了數據收集。” 如果你使用了先決樣本量,你可以說:“在訪談了我們預先決定的數量的受訪者之后,我們停止了數據收集,并對收集來的數據進行了充分的分析。”

我們使用先決樣本量的時候依然能維持一個嚴謹的流程,它的發現依然是有效的。數據飽和幫助我們確保了這個結果。在使用先決樣本時,為了闡明你已經盡職地完成了確定樣本量的調查和達到數據飽和,你需要完成這3個步驟:

  1. 在有意義的基礎上去決定樣本量;
  2. 達到數據收集的飽和;
  3. 達到數據分析的飽和。

在接下來的篇幅將涵蓋每一個步驟的細節。

決定樣本量:從方針到公式

市場調研公司Research by Design的Donna Bonde提供了調研基礎方針(市場定性調研:When enough is enough)來幫助人們提前決定定性研究的樣本量。Bonde回顧了無數的市場調查研究來確定不同研究中樣本量的一致關鍵因素。Bonde認為這個方針不應該是一條公式,它應是影響定性樣本量的各個因素。這個方針是針對于市場調查的,所以我對它們加以修改來適應用戶研究員的需求。我也將相關的因素組織成了一條公式。這將幫助你確定和辨證一個樣本量,且增加達到飽和的可能性。

定性樣本量公式

基于我對Research by Design的方針的翻譯,決定樣本量的公式如下:

樣本量[N]?=(范圍[S]?× 特征[C]?)÷ 專業程度[E]?+ / – 資源[R]

關于這個決定你定性樣本量的公式,這里有其四個要點的描述和例子。

1. 調查的范圍

你需要考慮你在試圖完成什么東西。在考慮樣本量時,這是最重要的因素。你是否打算從頭開始設計一個解決方案?或者你是否打算定義一個提升現有產品可用性的小節點?如果你打算創造一個全新的體驗,你應該最大化你的調研對象。如果你試圖定義你應用中的付款流程有什么潛在的困難,那么你只需要更少的調研對象。

數字上,這個范圍可以是1到無限中的任一個數字。0指的是沒有調研,這是違反用戶體驗設計的原則的。下一步你需要將范圍乘以每個用戶類型再×3(譯者注:下文會解釋為什么還要乘以3)。因此,這個范圍只要比1還大,將大大地增加你的樣本量。范圍可以理解成你想如何應用你的結果。我推薦使用下面的值來填入范圍(scope)中:

  • 針對現有產品的調研(比如,可用性測試,定義新功能,或研究現有的狀況);
  • 創造新產品(比如,一個收納了所有你的員工所使用軟件的新門戶網站);
  • 超越產品之外范疇(比如,在一個研究刊物刊登你的研究成果或宣布一個新的設計流程)。

你的樣本量應該隨著你的范圍的增加而增加。(Image:?Brandon Sax) (View large version)

我給出的調研范圍的方針保證了你的樣本量跟一些學術研究員建議的量是有可比性的。學者John Creswell建議的方針是,調研范圍可以少到如案例研究(如你的現有產品)中的5個人,也可以多到如推出一個新理論(比如,超越產品之外范疇)的20人以上。我們不反對Creswell的建議,因為當你表明你使用了一個公式來決定樣本量時,你將造成一個更強烈的爭議,同時也表現出了對之更好的理解。另外,學者們在具體樣本量的使用上也很難達成一致,Creswell說道。

2. 研究的人口特征

隨著你調研人口的多元增加,你的樣本量也應隨之增加。你將需要每個不同人物畫像的多種代表或用戶類型。我推薦每種用戶類型至少有3個受訪者。這允許我們對每個用戶類型的用戶體驗有一個更深層次的探索。

我們假設你現在正在設計一個應用,這個應用能讓制造業公司輸入和追蹤供貨從倉庫到工廠的訂單、運輸信息。你應該采訪這個流程中的許多人:倉庫基層員工、辦公室職員、從倉庫到工廠的采購員、經理等等。如果你僅僅只是對這個APP的貨運追蹤功能的界面進行重新設計,那么你應該采訪那些關注這個應用的追蹤頁面的人:倉庫和工廠的辦公室職員。

數字上,特征(C)=P × 3,在這里,P等于你已經確定的用戶類型。3個用戶類型決定了C=9。

3. 研究人員的專業程度

有經驗的研究員比經驗不足的研究員更能從小的樣本量中挖掘更多的信息。定性研究員用與定量研究員不同的方式,將他們自身投入到數據收集的工序中。在問卷調查中,你無法根據無法預知的相關話題來改變你的問題大綱。但在定性研究中,你能根據受訪者的實時反饋來調整你的訪問大綱。有經驗的研究員將根據受訪者的回應生成更多更高質量的數據。一個有經驗的研究員知道如何、何時根據受訪者的回應進行深度挖掘。有經驗的研究員帶來的歷史經驗能為數據分析增加洞察力。

數字上,專業程度(E)能從1到無限。現實中,這個范圍應該在1到2 。例如,一個沒有經驗的研究員應該值1,因為他們將需要完整的樣本量,且隨著項目的推進,他們也隨之獲得經驗。采用數值2時你的樣本量將減半(在公式中),這也是最極端的。我推薦每增加5年工作經驗,這個值就增加0.1,例如5年經驗的研究員應該讓你的公式中的專業程度(E)=1.10。

專業能力能加快調研的進度以及減少用研所需的樣本量。 (Image:?Brandon Sax) (View large version)

4. 資源

一個不幸的事實是,在決定樣本量時,你不得不將預算和時間約束考慮在內。隨著你的樣本量的增加,你要么需要增加時間,要么增加這個項目的研究員數量。大多數的客戶和項目要求你確定好預期的調研對象數。時間和資金也將受這個數字的影響。你需要預算時間來招募調研對象和分析數據。同時,為了完成你的職責,設計和開發的需求你也得考慮在內。如果你的研究結果跟他人提出來的結論沒什么兩樣,同行也會覺得你的調研發現沒有什么價值。在團隊急需用研結果的時候,相較于一個需要拖很長時間才能出結果的樣本量,我推薦縮小樣本量來及時獲取信息。

數字上,資源的值可以是N-1N+1或更多(N為預期的樣本量)。你將基于成本和招募受訪者、實施調研和數據分析所需的時間來決定你的資源。在之前的嘗試中,你可能有了一個具體的數字。打個比方,你可能知道采用一個招募服務需要花費大概15,000美元,其中包括租用2天的設施以及15個受訪者1個小時的訪談費用。你也知道招募服務需要至多3周的時間幫你找到你需要的樣本,這取決于你的研究的復雜程度。在另一方面,你可能可以通過你的客戶找到他們的現有用戶,這樣招募來的研究對象不需要花費額外的費用。但是,如果你不能快速找到他們或者潛在受訪者短期內沒空,這會讓整個調研流程拖更多的時間。

你需要將獲取樣本所需要的時間和資源做一個預算,或者相應地減少你的樣本量。因為這就是生活中的現實,我建議你事先把這些事情考慮好。跟你的老板或客戶說,“我們在這個項目中想要跟15個用戶進行交談。但是我們的預算和時間只允許10個人。請在拿到調研結果的時候考慮到這一點?!?/p>

公式使用的例子

讓我們假設你現在正在研究評估一個需求:為一個中等大小的客戶的客服中心職員創建一個門戶網站,職員們可以通過它訪問他們平時用來工作的應用。你想要算出這個調研需要多少個受訪者參與。你的客戶闡述說,這里有3個基本的用戶類型:基層員工,經理,管理者。從調研到門戶網站的設計概念展示再到運作原型和流程圖,你有一個健康的預算和總共10周的時間。你是一個有11年經驗的研究員。

你決定用研樣本量的公式如下:

范圍(S):創建一個新的門戶網站,范圍(S)= 2 ;

特征(C):3個用戶類型,特征(C)= 3 × 3 =9;

專業程度(E):11年經驗,專業程度(E)=1.20;

資源(R):充裕,資源(R)=0;

我們的公式是 ( (?S × C ) / E )?+R

故,( ( 2 × 9 ) / 1.2 ) + 0 = 15,這個調研需要15受訪者。

數據飽和

數據飽和是來源于學術調研的一個概念。學者們對飽和的定義也是各執己見。最基礎的理念是獲取足夠的數據來支持你所做的決定,然后窮盡你所需要分析的數據。為了創造一個有意義的問題和推薦你已經詳盡無疑的數據分析,你需要獲取足夠多的數據。達到數據飽和取決于你具體的數據收集手段。訪談通常被用來做為最能保證達到數據飽和的研究手段。

研究人員通常不單獨使用樣本量作為評估飽和的標準。我支持其中一個雙管齊下的定義:數據收集的飽和與數據分析的飽和。在研究當中,你需要滿足兩者的飽和。你也需要在進行數據收集和分析的同時,了解你在調研結束前是否已經達到飽和。

數據收集的飽和

你會收集足夠多的有意義數據來確定關鍵的問題及作出相應推薦方案。一旦你提煉了你的數據并確定了主要的問題,你是否擁有了可行的解決方案?如果有,那么你應該對你發現的東西感到滿意。如果你無法確定主要的問題或受訪者幾乎都有不同的用戶體驗,那么你需要收集更多的數據?;蛘呷绻谀硞€訪談中出現了一些獨有的事件,你可能會增加一些訪談來探索這個概念。

你可以通過收集豐富的數據來達到數據飽和。豐富的數據為你正在調查的問題提供了深度的洞察力。豐富的數據是良好的訪談問題、隨訪提示和經驗老道的研究員的產出物?;跀祿占馁|量而非樣本量,可以讓你收集到豐富的數據。訪談一個3人樣本,人均1小時,與訪談一個6人的樣本,人均30分鐘,前者更可能獲取到更好的數據。你需要打磨你的問題來收集豐富的數據。當你創建了一個問題大綱時,讓他人幫你優化和提供反饋,并且事先演練一下數據收集,這樣可以幫助你收集到豐富的數據。

你或許會將調研對象限制在特定類型的受訪者當中。這樣能減少擴大樣本來達到數據收集飽和的需要。

舉個例子,假設你想要了解近期人們在什么情形下會切換使用銀行。你是否找到了區分這個人群的關鍵特征?或許是有些用戶之前使用的銀行收費太多,讓他們覺得惱火,因而更換了一個體驗有巨大區別的銀行。

你是否跟許多滿足各個用戶類型的人交談過?不同用戶類型之間的體驗是否有共同點?或者你是否需要對某一個用戶類型或不同用戶類型之間進行更深層次的研究。

如果你僅僅訪談了一個滿足換用銀行這樣一個類型描述的用戶,那么你需要擴大你的樣本,跟更多該用戶類型的人進行交談?;蛟S你會對僅有一個用戶類型與當前項目相關提出異議。但這樣其實可以讓你把注意力集中在一個用戶類型上,進而減少達到數據收集飽和所需要的受訪者數量。

數據收集飽和的案例

假設你已經決定好你的銀行調研項目需要一個15人的樣本。

你創建好了訪問提綱,然后將焦點放在過去的五年內你的受訪者跟銀行之間有怎樣的體驗上,不管是親身體驗還是在線體驗。在每個受訪者身上你花了1小時進行訪問,細致入微地問盡了你的問題線索和隨訪提示。

你同時收集和分析了數據。在12個訪談過后,你發現在你的數據里呈現出了下面幾個關鍵問題:

  • 用戶覺得銀行缺乏透明度;
  • 用戶擁有一個糟糕的初次使用體驗;
  • 用戶更迫切地想要去一個能感受到個人聯系的銀行。

你的團隊聚在一起討論主要問題以及探討如何將之應用到你們的工作當中。團隊最終決定創造一個基于Web的初次使用體驗,促使銀行賬戶收費方式透明化,這個概念旨在向用戶說明你的客戶是如何允許用戶分享個人銀行體驗及邀請他人的。這些都是你的受訪者所說,在開戶體驗上缺失的主要方面。

你已經達到了兩個所需的飽和之一:收集了足夠有意義的信息來定義主要問題和做出推薦方案。你從調研結果中有了一個可行的解決方案:建立一個強調透明化和個人聯系的初次使用體驗。而且它僅僅在你訪談了12個受訪者后就得到了。你完成了剩下的3個訪談來驗證你已經了解到的東西,并為下一部分的“飽和”儲存了更多數據。

數據分析的飽和

你細致入微地分析了收集到的數據來達到數據分析的飽和。不管樣本量是1還是100,這意味著你已經用功地完成了你分析數據的職責。你能通過許多方式分析定性數據。有些取決于你采用的具體數據收集手段。

你需要對你的數據進行提煉(【譯注】data coding:定性研究中將收集到的信息整理、歸納、分類、概括的數據分析方法。)。你可以歸納性地提煉(基于數據顯示的信息),或者演繹性地提煉(預先決定好的提煉方式),試圖確定數據中有意義的問題和要點。當你完成了所有數據的提煉和根據提煉的數據確定了問題時,你就讓數據分析飽和了。這也是研究員的經驗發揮作用的地方了。經驗會幫助你更快地確定和提煉有意義的問題,然后將他們轉化成可行的推薦方案。

你無法在缺少縝密數據分析的前提下達到數據飽和。(Image:?Brandon Sax) (View large version)

回到我們的銀行案例,你向你的客戶展示了你的發現,并且提出了一個初次使用的體驗方案。客戶很喜歡這個想法,但是也提出關于缺乏透明度這個問題可能還有很多信息沒有揭露出來。他們建議你找多幾個人對這個具體的問題進行訪談。

在你同意訪談更多的人之前,你叫來了其他研究員來回顧你的數據。這個研究員發現在透明度問題中存在一些異?,F象,他指出,目前根據數據的提煉結果并沒有涵蓋:“有些用戶認為銀行在費用和服務上缺乏透明度。而另外有用戶提及說銀行在客戶信息的儲存和使用上缺乏透明度?!?最初,你僅僅歸納出了費用方面的透明度缺失。增加“一雙眼睛”來回顧你的數據能讓你達到分析的飽和。你的設計師開始在初次使用體驗和整體體驗上處理這個異常情況。他們強調了銀行的隱私和數據安全政策。

你跟你的客戶探討并建議不再繼續更多的訪談了。當你回顧了數據然后采取了額外的數據提煉,你就能達到數據分析的飽和了。不需要額外的訪談。

樣本量公式和數據飽和案例研究

讓我們來看看一個涉及到本文概念的案例研究。

假設我們跟客戶一起進行他們的臨床數據管理應用的概念化重設計。研究人員用臨床數據管理應用來收集和儲存臨床試驗的數據。臨床試驗是關于新藥物療程的效用測試的研究??蛻粝胍覀兇_定產品設計上有什么提升的空間,以及提高產品的使用和可靠性。我們將在提出設計概念前先實施訪談。

樣本量的飽和

基于本文中的公式,我們要了12個訪談的受訪者。下面展示的是我們是如何決定公式中每個變量的值的。

范圍:我們被指派了提供一個現有產品的設計概念的調查報告的任務。這個項目沒有太大的范圍。我們不會發明一個新的方式來收集臨床數據,相反,我們僅僅只是在優化現有的工具。更小的范圍確定了更小的樣本量。

范圍(S)= 1

特征(C):我們的客戶確定了3個具體的用戶類型:

  1. 研究設計員:掌管系統中研究項目建設的用戶;
  2. 數據收集員:從患者收集數據和將數據錄入系統的用戶;
  3. 研究管理員:掌管項目中的數據收集和報告的用戶。

特征(C)= 3×3用戶類型 = 9

專業程度:讓我們假設我們的主調研員擁有10年的調研經驗。我們的隊伍擁有類似項目的經驗。我們清楚地知道我們需要多少數據,也知我們道想從12個受訪者中了解到什么。

專業程度(E)= 1.20

在這個點上,考慮到資源因素前,我們的公式是( ( 1 × 9 ) ÷ 1.2 ) = 7.5位受訪者。

資源:我們知道可用的預算和時間。從過去的項目中我們也知道實施15個受訪者的訪談這些資源是足夠的。如果我們能訪談少于15位的受訪者,我們能夠分出更多資源在設計上。增加4個受訪者對我們現在的數目(8位受訪者)來說并不會讓我們的資源縮水太多,而且這能讓我們跟每個用戶類型的4個不同受訪者進行交談。

資源(R)= 4

基于決定樣本量的公式,我們向我們的客戶建議需要12位調研對象:

  • 范圍(S):小范圍,升級一個現有產品;S?= 1
  • 特征(C):3個用戶類型;C = 9
  • 專業程度(E):10年;E =1.20
  • 資源(R):足夠總計15人的調研對象;R = +4
  • 我們的公式是( ( S?× C?) ÷ E?) + R ;
  • 故,( ( 1?× 9?) ÷ 1.2 ) + 4 =12,這個研究需要12位調研對象。

數據分析的飽和

我們將建立一個電子表格來管理我們收集的數據。橫向為問題,縱向為受訪對象。

例表1:數據分析電子表格

接下來,我們增加了電子表格的第二個標簽頁,然后基于數據呈現進行提煉(例表2:數據提煉電子表格):

下一步,我們回顧了數據來確定相關的問題(例表3:問題和引言的電子表格):

可信度很快作為主要問題呈現了出來。幾乎每一個受訪者都提到了系統缺乏可信度。研究設計員跟我們說,他們不信任創建研究的架構。臨床數據收集員跟我們說,他們不信任新手研究設計員。而管理員跟我們說,他們不信任研究方案的設計,不信任數據收集員的精準度和系統能100%準確地存儲和上傳數據。

我們的推薦方案把概念設計的焦點放在交互和功能上,以增加產品的可信度。

結論

定性用戶研究人員必須為選擇樣本量提供支撐依據。我們可能不是學術型研究員,但是我們應該為如何決定樣本量而做出努力。我已提供了一個幫助確定樣本量的公式,這個標準增加了我們調研的嚴謹性和可信度。

我們也應該確保數據飽和的達成。為了完成這個目標,我們應使用一個有意義的樣本量、使用健全的問題和良好的訪談技術收集數據,以及進行縝密的數據分析。當我們決定我們的樣本量和分析我們的數據時,客戶和同事將對我們提供的透明度而感到欣賞。

我們必須將決定定性樣本量的討論繼續推進下去。請分享你在決定樣本量時遇到的問題或使用的方法。當被問到你如何決定樣本量時,你給了你的客戶和同事一個怎樣的標準?

參考資源

 

原文作者:Victor Yocco

原文地址:《 Filling Up Your Tank, Or How To Justify User Research Sample Size And Data 》

譯者:門衛阿伯

本文由 @門衛阿伯 翻譯發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 非常專業

    來自北京 回復
  2. 我在做黨建調研的時候參考了您的文章,雖然用了問卷調查,但是還是決定采用定性樣本量的計算。不知道能否和你探討。

    來自云南 回復
  3. 不明覺厲

    來自廣東 回復
  4. 給支付寶的作用可能遠不止于此,僅我自己的行為:普通的刷碼消費,都會有意識的從之前的微信換為支付寶,有了更全面的支付數據,對征信金融等業務作用巨大

    回復
  5. 表示看不懂

    來自黑龍江 回復