為什么你 Only 需要 5 個用戶去做可用性測試?

2 評論 5835 瀏覽 25 收藏 10 分鐘

過于精心設計的可用性測試是一種資源上的浪費。?最好的結果來自不超過 5 個用戶的測試,盡可能分解你的可用性測試變成小測試。

有些人認為可用性測試的「投入產出比」比較低,只有罕見的網頁設計項目才有資格使用這種研究方法,才能承擔大額的預算和奢侈的時間表。 這是不對的。 過于精心設計的可用性測試是一種資源上的浪費。 最好的結果來自不超過 5 個用戶的測試,盡可能分解你的可用性測試變成小測試。

在更早的研究中,Tom Landauer 和我表明在 N 個用戶的可用性測試中發現的可用性問題的數量是:N(1-(1-L)n)

其中 N 是設計中可用性問題的總數,L 是測試單個用戶時發現的可用性問題的比例。 L 的典型值為 31%,這是我們研究的大量項目的平均值。 繪制 L = 31% 的曲線得到以下結果:

曲線最引人注目的真理是:零個用戶只會發現零個問題點。

從第一個用戶開始測試,你就會開始發現問題點,而且幾乎已經發現了近三分之一可用性問題點。 從 0 到 1 數據之間的差異是驚人的。

當您測試第二個用戶時,你會發現此人執行的某些操作與第一個用戶相同,因此你能得到的內容會有所重疊。但人不是絕對相同的,也會有一些不同于前者的新的發現。 所以第二個用戶添加了一些新的見解,但不會像第一個用戶那樣多。

第三個用戶可能會做一些你已經看過兩次的事情。 當然,第三個用戶將繼續生成少量的新數據,即使不像第一和第二用戶那樣多。

在第五個用戶之后,你就會常常浪費你的時間在重復觀察相同的結果上。

迭代設計(Iterative Design)

譯者插嘴:在一個可用性測試中,大約 15 個用戶可以發現 100% 的問題。但是,并不建議這么做,更好的方案是,把這 15 個人分成 3 組(每組 5 人)進行測試。第一組的可用性測試就可以發現大約 85% 的問題,帶著這些問題點進行設計,帶著新的設計對第二組 5 人用戶進行測試,不僅可以發現剩下的 15% 可用性問題點,還可以幫助用戶深入地探究站點基本結構的可用性,評估信息架構、任務流程以及與用戶需求匹配等問題,避免所有的用戶都被表面的可用性問題困擾,第三組(5人)測試同理。

曲線清楚地表明,您需要至少測試 15 個用戶來發現設計中的所有可用性問題。 那么,為什么我建議用少得多的用戶進行測試?

主要原因是,最好將您的預算分配給許多小型測試,而不是將所有內容都放在一個詳細的研究上。讓我們說,你有資金招聘 15 個代表客戶,并讓他們測試你的設計。這個預算花在 3 個研究,每個用戶 5 個用戶!

你想要運行多個測試,因為可用性測試的真正目標是改進設計,而不只是記錄其弱點。在有五個參與者的第一個研究發現 85% 的可用性問題之后,你將希望在重新設計中解決這些問題。

創建新設計后,你需要重新測試。即使我說重新設計應該「解決」第一個研究中發現的問題,但事實是,你認為新的設計克服了這些問題。 但是由于沒有人能夠設計出完美的用戶界面,因此不能保證新設計確實能夠解決問題。

第二個測試將發現新的迭代設計到底有沒有作用。此外,在介紹一個新的設計時,還存在引入一個新的可用性問題的風險,即使舊的問題已經解決。此外,第二個研究(5個用戶)將發現在第一輪測試中沒有發現的大多數剩余的 15% 的可用性問題。(仍然有 2% 的原始問題留下 – 他們將不得不等到第三個研究被識別。)最后,第二個研究將能夠更深入地探究站點基本結構的可用性,評估信息架構、任務流程以及與用戶需求匹配等問題。

在初始研究中,這些重要問題常常被掩蓋,用戶被愚蠢的表面級可用性問題所困擾,阻礙他們真正深入思考。

因此,第二項研究將作為第一項研究結果的質量保證,并幫助提供更深入的見解。 第二個研究將總是導致一個新的(更小的)可用性問題的列表,在重新設計中解決。

同樣的步驟適用于這個重新設計:不是所有的迭代設計都是有用的,迭代設計后會又會發現一些更深層的問題。 因此,還需要第三個研究。

最終用戶體驗通過 3 項研究提高了 5 個用戶每個比一個怪物研究與 15 個用戶更多。

為什么不能只測試單個用戶?

譯者插嘴:看了上面的內容,你可能會有疑惑,按照上文敘述的思路,那研究者把 15 個人分成 15 組,每個人 1 組,15 組迭代測試和迭代設計企不是更有幫助?下面解釋你的疑惑。

你可能認為有一個單一用戶的 15 項研究甚至比 5 個用戶的 3 項研究更好。 曲線確實表明我們從第一個用戶比從任何后續用戶了解更多,所以為什么要繼續? 兩個原因:

  • 總是存在被單個人的虛假行為誤導的風險,一個人可能偶然或以不具代表性的方式執行某些行為,即使 3 個用戶足以了解用戶行為的多樣性和洞察什么是獨特的和什么可以推廣。
  • 用戶測試的成本效益分析提供了大約 3 或 5 個用戶的最佳比率,這取決于測試的風格。 總是有與計劃和運行研究相關的固定初始成本:最好從多個用戶的調查結果中貶值這個啟動成本。

何時測試更多用戶?

當網站有幾個用戶特征顯著差異的群體時,你還需要測試其他用戶。 上面的公式僅適用于相類似用戶。

例如,如果您有一個將由兒童和父母使用的網站,則兩組用戶將具有完全不同的行為,因此有必要與來自兩個組的人進行測試。 對于旨在將采購代理與銷售人員連接的系統也是如此。

即使當用戶組非常不同時,在來自兩個組的觀察之間仍將存在極大的相似性。畢竟所有的用戶都是人類。 此外,許多可用性問題與人們與 Web 交互的基本方式以及其他站點對用戶行為的影響有關。

在測試多個不同的用戶組時,您不需要像單個用戶組的單個測試中那樣包含每個組的成員數量。 觀察之間的重疊將確保每組中較少數量的人測試得到更好的結果。 我建議:

  • 每個類別 3-4 個用戶,如果測試兩組用戶
  • 來自每個類別的 3 個用戶,如果測試三個或更多用戶組(你總是希望至少 3 個用戶,以確保你已經涵蓋了組內的行為的多樣性)

 

原文作者:AKOB NIELSEN

原文地址:https://www.nngroup.com/articles/why-you-only-need-to-test-with-5-users/

譯者:雕左

譯文地址:微信公眾號@37點2度體驗

本文由 @37點2度體驗?授權發布于人人都是產品經理,未經作者許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 干貨

    回復
  2. ??

    來自廣東 回復