十種可用性研究方法

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

漓江

2014-04-12

0 評論 19727 瀏覽 20 收藏

24 分鐘

當你選擇可用性研究的度量方法時，你應該考慮很多的問題才有可能獲得想要的結果，這其中包括研究目的，用戶目標，技術上收集和分析數據的可行性，以及項目預算和交付的時間問題。因為每一個可用性研究具有獨特的屬性，我們不能確切地規定每種類型的研究應該用什么度量方法。

相反，我們能夠定義的，是已經確定的是十種可用性研究類型，以及就每種度量類型提出的參考建議。我們提供僅僅是簡單的就如何去執行一個具有相似特性的可用性研究實踐過程時的建議。反之，對你的研究來說必不可少的度量指標可能沒有出現在項目列表當中。同時，我們強烈建議你深入挖掘你手中的原始數據找到新的度量數據，這對項目目標意義重大。

十種常用的可用性研究情景在表中羅列出來了。常用的或者適合每個可用性研究情景的度量方法都顯示了出來。以下章節將就這十種情景來分別討論。

1.完成一筆交易

很多可用性研究的目的是使交易盡可能順利完成。交易的形式多樣，可能需要一個用戶完成一次產品的購買，注冊一個新的軟件，或者出售一只股票等。交易通常有一個界定明確的開始和結束點。例如對于一個電子商務網站來說，用戶將看中的物品放到購物車里時，交易可能就已經開始了，當他在屏幕上確認完成了購買時，交易也隨之結束。

也許你想收集的第一個可用性度量是任務是否成功完成。每個任務是成功了還是失敗了，這顯需要有一個明確的結束狀態，例如確認交易達成說明任務成功了。

報告參與者的交易成功率是評估交易總體有效性的一個好的的措施。如果交易涉及到某個網站，一些網站的在線度量，如交易的流失率，也是非常有用的。通過了解用戶量是在哪個環節流失的，這樣你就能夠把注意力集中在交易中問題最嚴重的步驟上了。

計算問題嚴重程度可以幫助聚焦與交易相關的特定可用性問題的原因。通過為每個可用性問題匹配不同的嚴重等級，你能夠專注于處理任何交易中出現的優先級高的問題。兩種類型的自我報告式度量也很有用：返回的可能性和用戶期望值。在這些情況下，用戶可以選擇在哪里進行交易，重要的是要知道什么他們的體驗如何。

最好的了解方法之一就是詢問參與者是否會再次使用這款產品，該產品是否達到或超過了他們的預期。當用戶不得不多次重復完成同一交易的時候，那么效率就是一個合適的可用性度量。效率是通過單位時間的任務完成量來衡量的。

2.產品比較

知道你的產品與競爭對手或以前的版本相比差異在哪里是非常有用的。

通過對比，你可以準確把握產品的優勢和劣勢所在，判別改進后的版本是否真的比前一個版本有了提升。使用各種可用性度量是比較不同的產品或版本優劣的最好方式。你選擇的度量方法應基于產品本身特征。一些產品的目的是最大限度地提高效率，而另一些則試圖創造極致的用戶體驗（這都是不同的）。

對于大多數類型的產品來說，我們建議通過三類可用性度量來對可用性建立一個整體意義上的認知。

首先，我們建議關注一些成功任務采用測量方法。能夠正確地完成一個任務對大多數產品而言是必不可少的要求。效率同樣需要著重關注。效率包括任務完成的時間，頁面瀏覽數量（就一些網站而言），或操作步驟的數目。通過對效率的查看，你會對該使用產品用戶需要耗費多少努力有一個感性的認知。

一些自我報告的滿意度度量為用戶的整體體驗提供了一個很好的總結。滿意度測量最有意義的地方在于，它可以說明用戶使用產品時在哪些地方會做出什么選擇。最后，比較產品間可用性最好的方法就是進行整合和比較式的可用性度量。這讓我們從可用性的角度對不同的產品有一個清晰全面的了解。

3.對同一產品的使用頻率進行評估

許多產品是基于使用頻率的多少來設計使用的。

例如微波爐，dvd播放器，Web應用程序等，它們都是作為工作的一部分來使用，甚至還有我們寫這本書都要依靠的軟件程序。這些產品需要易于使用并且具有高效性?？啼沝vd或用微波爐蹦爆米花所需的工作量被保持在最小限度。我們大多數人都不想浪費時間在很難用的產品上，而且也沒那個耐心。

我們建議的第一個可用性度量是任務持續時間。測量完成一系列的核心任務需要的時間將揭示任務所需要的工作量。對于大多數產品來說，完成任務所用時間越少越好。由于某些任務本質上就比其他的任務更復雜，因此比較參與者與專家用戶的完成時間是很有用的。其他與效率相關的可用性度量，如操作步驟的數量或網頁頁面的數目（度量一些網站的情況）也是有用的。每一步的操作時間可能很短，但要完成一項任務需要作出的決策卻會很多。

易學性度量評估的是達到最大效率需要的時間和工作量。易學性也可以采取以前使用過的隨著時間推移的效率度量的形式。在某些情況下，可以考慮自我報告式的可用性度量，如意識程度和實用性。通過測定用戶的意識程度和自我感知的有用性之間的區別，你就能確定，應該優化或突出產品的哪些方面的特質。

例如，用戶可能對產品的某些部分意識不到，但一旦他們使用它，就會發現這些部分是非常有用的。

4.評估導航和/或者信息架構

很多可用性研究著眼于提高導航和/或者信息架構。這可能在網站、軟件程序或電子消費品中比較常見。

研究可能包括確保用戶可以快速和容易地找到他們想要的東西，很容易地在產品不同板塊間切換，知道他們自己處于哪一信息層級，有哪些選項可供選擇。通常情況下，這些研究涉及到線框的使用或部分功能的原型，因為導航和信息機制、信息架構的設計非常重要，幾乎是進行任何其它設計的基礎所在。

評價導航最好的可用性度量之一是任務成功率。通過給參與者設定任務，讓其找到關鍵信息（像是在玩“尋寶游戲”），你就可以了解導航和信息架構是否在任務中起到作用。搜索任務應該觸及產品的各個區域。用于評估導航和信息架構的一個效率度量就是迷失度，將參與者完成任務所需的步驟數（例如，Web頁的訪問步驟）與相對完成任務最低步驟數相比。

卡片分類是了解用戶對信息組織方式的一個特別有用的方法。有一種卡片分類研究被稱為封閉式分類，就是參與者將卡片歸類到已經預定義好的類別之下。從封閉型卡片分類研究中衍生的一個有用的可用性度量是：放置到正確的類別項目下的卡片與卡片總數的百分比。這種可用性度量顯示了信息架構的直觀性所在。

5.提高認知

并不是每一個設計進行可用性評估的目的都是讓產品使用起來更容易或更有效率。一些設計改良的目的是增加特定內容或功能的認知性。這種做法對在線廣告來說是十分必要的，但這對于具有重要功能但沒有得到充分利用的產品來說也是可用的?？赡苡泻芏嘣驅е乱恍┕δ懿槐蛔⒁饣蚴褂?，這其中包括一些視覺、標簽、或放置位置方面的設計。

首先，我們建議監控有問題元素的的交互次數。這也并非萬無一失，因為參與者可能注意到了一些東西只是沒有點擊它或著只是在某種程度上進行了交互。相反，產生了交互，但是自己沒有注意到這種相反的現象也不會發生。因此，數據可以幫助確認認知度，但不能表明缺乏認知度。有時自我報告式的度量中關于參與者是否注意到或意識到一個特定的設計元素的數據也是有用的。

測定顯而易見性的方法是向參與者指出特定元素并詢問他們在任務進行的過程中是否注意到了這些元素。認知度度測量包括詢問參與者在研究開始前他們是否了解產品的某個功能。然而，目前還不清楚這些數據的可靠性如何。因為并不是每個人都有很好的記憶力，有些人試圖挽回面子，說他們看見了，盡管事實并非如此。因此，我們不建議這是你唯一的評估方法，你應該搜集其他數據源來補充你的結果。

記憶是另一個有用的自我報告式的可用性度量。例如，你可以為參與者展示幾個不同的元素，實際上里面只有一個元素是他們之前看到的，然后讓他們選擇哪一個是他們在任務中見過的。如果他們注意到了這個元素，他們的記住的可能性要大于猜測。但如果您有可用的技術，也許用來評估意識的最好的方式是測量行為和生理數據，如眼動跟蹤數據。使用眼動跟蹤技術，你可以測定花費在尋找一個特定的元素上的平均時間，有多少比例的參與人員在看它，甚至是第一次注意到是花費的平均時間。

在評估網站時候，另一個要考慮的度量數據是在線的網站數據變化。觀察不同的設計中的流量模式變化，將幫助您確定其相對于認知之間的關系。在直播網站上替代設計的同步測試（A/B測試）是一個越來越普遍的方式，用來測量小的設計變更是如何影響用戶行為的方法。

6.發現問題

發現問題的目的是確定主要的可用性問題。在某些情況下，您可能沒有任何先入為主的想法，不知道產品上哪個可用性問題是最重要的，但是你想知道是哪里惹惱了用戶。這種方法往往是針對現有的，但還不曾經過可用性測試的產品而言的。

發現問題式的研究也可以用于周期性檢查用戶是如何使用產品，他們之間是如何進行交互的。問題發現式研究與其他類型的可用性研究有所不同，因為它通常是開放性的。

問題發現式研究中的參與者可能會完成他們自己的任務，而不是你所指定的具體的任務。盡可能保持真實性對于研究也是很重要的。這經常涉及到用戶正在使用的產品和用戶通過自己的賬戶去完成一些只與他們自己相關的任務。它也可能包括對參與者使用產品時所處環境的評估，如在家中或工作場所。

因為他們可能正在完成不同的任務，使用情景可能不同，因此對各個參與者進行比較可能是一個挑戰?；趩栴}的度量可能是最合適于問題的發現。假設你捕獲了所有可用性問題，那就很容易將這些數據轉換成頻率和類型。例如，您可能發現40%的可用性問題涉及到高級別的導航，20%的問題與混淆的術語有關。

盡管每個參與者所遇到的具體問題可能是不同的，你仍然可以概括到一個更高層次的問題范疇中。檢查頻率和具體問題的嚴重程度將揭示有多少重復的問題正在被發現。這是一個一次性的事件還是屬于反復出現的問題？通過編目所有問題及其嚴重程度，你能夠得到一個快速優化設計的列表出來。

7.關鍵產品的可用性最大化

雖然有些產品是力求易用和高效，如手機、洗衣機等產品，而有些產品時必須易于使用，且具有高效性，如電擊器，投票機，或者飛機上的緊急出口指示。關鍵產品與非關鍵產品的區別就在于，關鍵產品存在的全部理由就是為用戶完成一個非常重要的任務。沒有完成任務將會帶來十分嚴重的負面后果。

對于任何關鍵的產品來說可用性測試是必不可少的。但只是在實驗室中進行少量用戶測試還是不夠的?；谀繕说挠脩羰褂眯阅軠y量是很重要的。任何不能滿足其可用性目標的關鍵產品都需要進行重新設計。由于這些數據要有相當的可信度，所以你可能需要邀請大量的用戶參與研究。一個很重要的可用性度量是用戶錯誤。這可能包括在執行特定任務時的錯誤或誤操作的次數。錯誤并不總是容易界定的，所以如何去定義錯誤需要特別關注的。最好是很明確的定義出什么是錯誤的，什么不是錯誤。

任務是否成功也是重要的評估依據。在這種情況下，我們建議使用一個二進制的方法來處理。例如，對一個便攜式電擊器的最真實的可用性度量的目標就是有人能夠獨自成功地操作使用。

在某些情況下，你可能希望任務成功是通過不止一個度量來評估，你可能希望任務在一個特定的時間內無差錯地完成。其他與效率有關的可用性度量同樣有用。還是以電擊器為例，只是正確地使用它是一回事，能否在有限的時間內快速及時地完成又是另外一件事了。自我報告式的指標是相對于關鍵產品而言不那么重要。用戶自己想如何使用他們手中的產品并不重要，重要的是他們實際上真的使用成功了。

8.創造具有整體性的積極的用戶體驗

對于一些想努力創造杰出用戶體驗的產品來說，只具備可用性是遠遠不夠的。這些產品需要既能吸引用戶，又能發人深省，而且具有娛樂性，甚至可以讓用戶稍微上點癮。

iPod和TiVo就是我腦海里能想到的兩種產品。這些產品，你和朋友即便是在一個聚會上談論它也無傷大雅。這種產品的知名度通常以驚人的速度上升。盡管產品好的用戶體驗特征是非常主觀的，但他們仍然是可測量的。

雖然某些性能度量可能是有用的，但是真正重要的是用戶的想法，感覺以及如何來描述他或她的使用體驗。在某些方面，這與測量一個關鍵產品的可用性方法相比恰好相反。如果起初用戶使用地并不順利，這可能還不是產品的末日。真正重要的是有多少用戶在當天使用結束后的感覺是什么。當測量用戶的整體使用體驗的時候，自我報告式度量是必須考慮的。

滿意度也許是最常見的自我報告式度量了，但它可能并不是最好的一個。只是“滿意”通常是不夠的。我們使用的最有價值的自我報告式度量之一是用戶期望。最好的體驗是那些超出用戶期望的體驗。當參與者說產品比他之前預想的更容易，更高效，更有趣時，你就知道你做到了。

另一種自我報告式度量涉及到將來的使用。例如，您可能會問這樣一些問題：購買的偏好是什么，是否會推薦給朋友，或者以后還會不會用等問題。另一個有趣的可用性度量涉及到用戶可能會有的潛意識反應。例如，如果你想確保你的產品是吸引人的，你可以觀察一下用戶的生理數據。瞳孔直徑的變化可以用來測量喚醒水平，或者如果你想盡可能多的消除應力，你可以測量心率和皮膚電導率變化。

9.評估微小改動的影響

不是所有的設計改動都會對用戶行為產生顯著影響。

一些設計改動是非常小的，對用戶行為影響也不是很明確。但是即使是微小的改動，只要具備足夠多的用戶量，同樣可以產生巨大的用戶群體影響。這種微小的改動可能是視覺設計的不同方面，如字體和尺寸的選擇，元素位置變化，視覺對比度，顏色和圖像選擇等。非視覺元素，如內容或術語的細微的變化，也會對用戶體驗產生影響。

也許衡量微小的設計改動影響的最好方式是通過網站A/B測試的實時在線度量。A/B測試涉及到原設計與替代設計的比較。對于網站來說，這種方法通常是轉移一部分網絡流量給替代設計，然后對比度量數據結果，例如將網站流量或產品購買量與原設計對比。一個擁有較大用戶量的在線可用性研究也可以是非常有用的。如果你不具備進行A/B測試或在線研究所需的技術條件，我們建議你使用電子郵件和網上調查的方式，從盡可能有代表性的參與者那里得到反饋信息。

10.替代設計比較

最常見的可用性研究類型之一，就是多個替代設計方案的比較。通常情況下，這些類型的研究都發生在設計過程的早期，在任何一個設計得到充分優化之前完成。

（我們通常稱這些為“設計烘焙”）不同的設計團隊一起完成多功能的原型的設計，我們依據預定義的可用性度量來評估每一個設計。進行這樣的研究有一個小技巧。因為設計方案往往是相似的，因此從一個到另一個設計之間用戶可能具有很高的學習效應。讓同一參與者在不同的設計里執行同樣的任務，通常不會產生有價值的信息，即使是特意對設計方案和設計任務的順序進行了平衡也無法抵消。

對這個問題有兩種解決方案。你可以設定研究是在純粹的不同設計主體之間進行，即讓每個參與者只使用一個設計。這能夠獲得一個免于干擾的數據集，但需要更多的參與者加入?；蛘呔褪?，你可以要求參與者使用一個主要設計來完成任務（平衡設計方案），然后顯示其他的設計方案，并詢問他們的偏好。這樣你可以得到從每個參與者關于所有設計的反饋。

當比較很多設計方案時，最合適的度量是基于問題導向的度量。比較高、中、低三種問題嚴重程度不同的設計方案將有助于揭示哪種或者哪些設計更有用。理想情況是，最終設計應該是整體問題較少，且嚴重程度較高的問題較少的設計。

任務成功率和任務完成時間的度量也是有用的，但由于樣本量通常較小，這些數據往往價值有限。兩種自我報告式的度量特別有用。一是要求每個參與者選擇他們最愿意在將來使用的設計原型（作為一個被迫選擇的比較）。同時，要求每個參與者依據不同評價維度，如易用性和視覺吸引力等來進行評估，也能夠幫助發現問題。

本文摘自《Measuring The User Experience》，作者：Tom Tullis和Bill Alibert，由江南大學設計學院研究生劉兆峰翻譯。

via：曉生

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App