如何做好體驗(yàn)評(píng)估(測試)工作?下面這些方法打包交給你!

4 評(píng)論 6669 瀏覽 15 收藏 31 分鐘

編輯導(dǎo)語:產(chǎn)品設(shè)計(jì)交付給開發(fā)后并不意味著設(shè)計(jì)師的工作結(jié)束了,直到產(chǎn)品實(shí)際發(fā)布上線前,設(shè)計(jì)師仍需要配合項(xiàng)目組,尤其是測試人員進(jìn)行最后的測試和評(píng)估。可用性評(píng)估的特性就用戶調(diào)研活動(dòng)一樣,沒有哪一種方法是完美的,不同的方法存在不同的瑕疵,需要互相配合使用才能讓產(chǎn)品達(dá)到最理想的體驗(yàn)狀態(tài)。

「產(chǎn)品可用性的定義:特定用戶在特定使用場景下,為了達(dá)到特定的目標(biāo)而使用某產(chǎn)品時(shí),所感受到的有效性、效率及滿意度。

——《ISO 9241/11》中對可用性的描述」

一、產(chǎn)品為什么需要可用性評(píng)估

產(chǎn)品設(shè)計(jì)交付給開發(fā)后,是不是設(shè)計(jì)師的工作就算結(jié)束了呢?并沒有!從設(shè)計(jì)稿的交接開始,一直到實(shí)際發(fā)布上線前,設(shè)計(jì)師仍需要配合項(xiàng)目組,尤其是測試人員進(jìn)行最后的測試和評(píng)估。設(shè)計(jì)的過程結(jié)束了,但新的起點(diǎn)又開始了。

正常來說,評(píng)估會(huì)有專業(yè)的測試或運(yùn)維工程師來執(zhí)行,不過本著負(fù)責(zé)任的態(tài)度來說,設(shè)計(jì)師自己設(shè)計(jì)的作品是否滿意仍需要自己把關(guān)。畢竟在作品的體驗(yàn)細(xì)節(jié)上,測試運(yùn)維工程師并不具備相關(guān)的知識(shí)儲(chǔ)備和評(píng)估方向。

那么,該如何對產(chǎn)品進(jìn)行評(píng)估呢?難道是運(yùn)用像素眼對著設(shè)計(jì)稿檢查一遍像素誤差嗎?還是說檢查字體字號(hào)大小的問題?其實(shí)以上都有,但實(shí)際的可用性評(píng)估不僅限于這些問題。

評(píng)估的范圍往大了講可以上升到整款產(chǎn)品的全部體驗(yàn)內(nèi)容,比如可用性、易用性和易學(xué)性等。

下面,本節(jié)將圍繞可用性評(píng)估,詳細(xì)說說一款產(chǎn)品該如何進(jìn)行評(píng)估活動(dòng)。

相信有很多讀者認(rèn)為:一款產(chǎn)品如果真的不好用,那也太菜了吧。這算不算是一種極端情況?確實(shí),不可用的情況確實(shí)屬于極端情況之一,但是從過程上來看,大部分項(xiàng)目一開始的目標(biāo)確實(shí)是奔著“可用”去的,然而隨著研發(fā)的不斷推進(jìn),結(jié)果卻會(huì)朝著“能用”方向發(fā)展。雖然只差了一個(gè)字,但是產(chǎn)品使用起來的體驗(yàn)效果卻有了天壤之別,舉幾個(gè)常見的例子:

例子一:用戶在某網(wǎng)站上進(jìn)行注冊。為了認(rèn)證實(shí)名信息,需要填寫20多項(xiàng)內(nèi)容,而且每項(xiàng)內(nèi)容都有嚴(yán)格的格式規(guī)范,比如生日格式必須是xx-xx、手機(jī)號(hào)前綴需要自行填寫地域區(qū)號(hào)、身份證號(hào)碼必須采用間隔符“-”隔開等等。

好不容易用戶全部填寫完畢,碰巧此時(shí)網(wǎng)絡(luò)出現(xiàn)錯(cuò)誤,頁面跳出下圖提示。待用戶調(diào)試完網(wǎng)絡(luò),刷新頁面后,發(fā)現(xiàn)之前全部的已填信息早已清空重置了。

網(wǎng)絡(luò)連接錯(cuò)誤導(dǎo)致頁面失去響應(yīng)

例子二:在某搜索引擎輸入“BOOK”(英文)關(guān)鍵詞,檢索出來的信息卻只是針對大寫B(tài)OOK的展示——搜索引擎忽略了小寫book的字母檢索。

未找到搜索結(jié)果

像這類例子還有很多很多,雖然從產(chǎn)品使用角度而言功能是具備了,也確實(shí)能用,但站在用戶體驗(yàn)角度,這樣的產(chǎn)品可以說是“極其不好用,甚至根本沒法用”。試想一下如果你碰到這樣的問題會(huì)不會(huì)奔潰,也許當(dāng)場就關(guān)掉,以后再也不用了。

現(xiàn)在明白為什么設(shè)計(jì)師要對產(chǎn)品進(jìn)行可用性評(píng)估了吧。因?yàn)檫@些體驗(yàn)項(xiàng)目并不在測試工程師的職能范圍之內(nèi)——他們只負(fù)責(zé)產(chǎn)品數(shù)據(jù)和邏輯方面的問題。只有用戶體驗(yàn)設(shè)計(jì)師從體驗(yàn)角度出發(fā),才能發(fā)現(xiàn)這些產(chǎn)品體驗(yàn)的優(yōu)劣所在。

二、什么是產(chǎn)品可用性

了解了對產(chǎn)品進(jìn)行可用性評(píng)估的理由,那么接下來就詳細(xì)地說說產(chǎn)品可用性具體是指什么?哪些又稱得上是可用性測試的范疇?

在國際標(biāo)準(zhǔn)ISO 9241/11中把產(chǎn)品可用性定義為:特定用戶在特定使用場景下,為了達(dá)到特定的目標(biāo)而使用某產(chǎn)品時(shí),所感受到的有效性、效率及滿意度。

首先是有效性,是指產(chǎn)品能夠?yàn)橛脩籼峁┫胍墓δ?,從而達(dá)成相應(yīng)的目標(biāo)的一種指標(biāo)。從某種程度上來說,有效性是包含在可用性之中的,比如李明通過電商平臺(tái)(A)買到了《卓有成效》,此時(shí)A對于李明而言就具備了有效(可用)的價(jià)值;反之如果買不到,則說明A對于李明而言失去了特定價(jià)值,變得不可用。該例子是站在銷售視角來評(píng)估的,換做是產(chǎn)品本身功能的使用也是同樣的道理。

因此一款產(chǎn)品只有滿足了有效性這個(gè)大前提,后續(xù)的效率和滿意度才發(fā)揮特定價(jià)值。

其次是,是指用戶使用一款產(chǎn)品時(shí)的輕松程度。還是買書的例子,如果李明輕松三步就買到了《卓有成效》,那說明A用起來還是比較輕松的,效率很高;反之如果用戶這點(diǎn)點(diǎn)那翻翻都沒有買到,則說明A對于用戶而言存在使用難度過大,效率不高的問題。

說白了就是用戶完成某項(xiàng)任務(wù)的完成度,如果完成度過于低效的話,問題性質(zhì)就會(huì)上升到有效性層面。

最后是滿意度,是指用戶使用一款產(chǎn)品后所進(jìn)行的一種全方位評(píng)價(jià),比如在書店看書,環(huán)境很安靜,書香氛圍濃厚,那么相應(yīng)的體驗(yàn)感和滿意度就會(huì)大大增加;反之如果邊上的書友吵鬧,外邊的工地還在施工,那么相應(yīng)的體驗(yàn)感和滿意度就會(huì)大打折扣,甚至逼迫讀者離開書店。

所以,滿意度是一種“全方位”評(píng)價(jià),它不會(huì)因?yàn)槟硞€(gè)單點(diǎn)的特殊情況而影響整體滿意度。類似于宜家的體驗(yàn)地圖,它就是一種全方位的滿意度評(píng)價(jià)——會(huì)盡量在各個(gè)細(xì)節(jié)上服務(wù)到位,如果所有細(xì)節(jié)都滿意了,自然整體滿意度就會(huì)上去。當(dāng)然咯,峰終定律在其中也起到了關(guān)鍵作用。

宜家體驗(yàn)地圖其實(shí)就是對“峰終定律”的運(yùn)用

以上三個(gè)維度是在主觀場景下所提出的一種參照標(biāo)準(zhǔn),產(chǎn)品如果同時(shí)滿足這三個(gè)維度,就可以稱得上“實(shí)現(xiàn)了可用性”。然而在實(shí)際工作中,這三個(gè)維度的重要程度和優(yōu)先級(jí)是不同的——有效性是核心也是基礎(chǔ),效率和滿意度只是為了驗(yàn)證有效性的一種指標(biāo)而已。

三個(gè)維度也有優(yōu)先級(jí)的排序

所以在設(shè)計(jì)產(chǎn)品時(shí),請優(yōu)先滿足有效性,然后在時(shí)間和資源允許的情況下再去優(yōu)化效率和滿意度,這才是保證產(chǎn)品最終可用的“標(biāo)準(zhǔn)工序”。

三、評(píng)估和測試方法

那么,有哪些方法可以對產(chǎn)品的可用性進(jìn)行評(píng)估呢?憑借感覺來?說句實(shí)話,感覺這個(gè)方法也不是不行,只不過我們得把感覺評(píng)估進(jìn)階一下,讓它形成系統(tǒng)性的評(píng)估方法或標(biāo)準(zhǔn),就像合意性研究,其實(shí)就是依據(jù)使用感受來對產(chǎn)品進(jìn)行的情緒評(píng)價(jià)。

縱觀市面上比較流行的評(píng)估方法,系統(tǒng)地講,可以大致分成形成性評(píng)估”總結(jié)性評(píng)估”兩大類。

評(píng)估方法的類別

  1. 形成性評(píng)估主要是在產(chǎn)品初期和中期所執(zhí)行的一種可用性評(píng)估方法,目的是為了挖掘產(chǎn)品的設(shè)計(jì)思路,在挖掘過程中加入可用性檢查法對產(chǎn)品進(jìn)行可用性測試。
  2. 總結(jié)性評(píng)估顧名思義,就是一種總結(jié),適用于產(chǎn)品完成后(后期)所進(jìn)行的一種可用性評(píng)估方法,比如跳出率、瀏覽率和滿意度等就是在產(chǎn)品完成后才能測出的數(shù)據(jù)指標(biāo)。

下表列舉了一些常用的可用性評(píng)估方法。細(xì)化到如何選擇評(píng)估方法則需要根據(jù)產(chǎn)品的開發(fā)周期、預(yù)算和針對性問題進(jìn)行合理選擇。無論是采用情緒板、低保真原型、紙質(zhì)原型、口頭闡述還是完整的產(chǎn)品演示等,筆者都建議對產(chǎn)品的評(píng)估應(yīng)該盡早執(zhí)行,嘗試多進(jìn)行幾次,積小勝為大勝,積跬步才能致千里。

評(píng)估方法總結(jié)

(詳細(xì)的評(píng)估介紹會(huì)在筆者個(gè)人主頁逐步更新,本文是對市面上常用、常見的方法所進(jìn)行的總概。)

1. 可用性檢查

可用性檢查一般會(huì)由專家或具備專業(yè)知識(shí)的人來進(jìn)行檢查,是一種有固定模板或思路的檢查方法。它最大的好處是不需要借助用戶就可以直接對產(chǎn)品進(jìn)行可用性評(píng)估。能以低成本、更快速的方式找到明顯可用性問題的方法。

讓專家來進(jìn)行評(píng)估可以提升整體效率,但是專業(yè)知識(shí)的人常常會(huì)因?yàn)椤敖煺叱?,近墨者黑”的?jīng)驗(yàn)之談錯(cuò)過某些問題,所以可用性檢查可以考慮加入用戶來揭示這些問題。所以,可用性檢查應(yīng)配合可用性測試一起為產(chǎn)品的體驗(yàn)做出更全面細(xì)致的優(yōu)化。

2. 啟發(fā)式評(píng)估

啟發(fā)式評(píng)估中有個(gè)極具代表性的方法,那就是“尼爾森可用性十大原則”。起初的啟發(fā)式評(píng)估是作為一種可以“打折扣”策略的可用性評(píng)估法被引入到評(píng)估體系中的。

何為折扣?顧名思義就是節(jié)省金錢或節(jié)省時(shí)間的一種“打折式可用性評(píng)估”,它可以在一般的辦公室場景下進(jìn)行,無需多少資源即可達(dá)成可用性評(píng)估目的。

根據(jù)啟發(fā)式評(píng)估中著名的“可用性十大原則”(下稱啟發(fā)式原則)指出,產(chǎn)品在進(jìn)行檢查的時(shí)候理應(yīng)遵循十個(gè)啟發(fā)式原則來保持良好的用戶體驗(yàn)設(shè)計(jì)。具體的執(zhí)行流程是:

團(tuán)隊(duì)組織3~5名專業(yè)的體驗(yàn)設(shè)計(jì)師,參照啟發(fā)式原則對產(chǎn)品進(jìn)行單獨(dú)評(píng)估。在一開始會(huì)制定一個(gè)明確的目標(biāo)或特定任務(wù)以走查這項(xiàng)任務(wù)所經(jīng)歷鏈路的體驗(yàn)問題,并需要找出任何違反啟發(fā)式原則的細(xì)節(jié)。然后這些評(píng)估人員會(huì)聚到一起,將所有的評(píng)估內(nèi)容匯總形成一份總結(jié)報(bào)告,在其中概述體驗(yàn)中遇到的問題,以及如何為后續(xù)體驗(yàn)優(yōu)化提供相應(yīng)的優(yōu)化建議。

值得注意的是,在評(píng)估過程中沒有硬性要求每個(gè)要素都必須遵從十大原則,畢竟這些原則其本身也多少存在悖論關(guān)系。因此,本著遵循原則的態(tài)度,在對每個(gè)要素進(jìn)行評(píng)估時(shí)應(yīng)盡最大程度地符合原則,如果出現(xiàn)評(píng)估意外也是允許偏離原則的。

言歸正傳,如果真的有一款產(chǎn)品全部滿足了啟發(fā)式十大原則,也并不意味著能和用戶體驗(yàn)100%對等,但想來結(jié)果也不會(huì)差到哪去。

3. 認(rèn)知走查法

認(rèn)知走查法和啟發(fā)式評(píng)估一樣,都是一種按照固定模板或套路所執(zhí)行的評(píng)估方法,屬于形成性評(píng)估法的一種。

它和啟發(fā)式評(píng)估最大的不同在于認(rèn)知走查法是從特定任務(wù)出發(fā),而啟發(fā)式則站在產(chǎn)品整體角度來評(píng)估的,這也是認(rèn)知走查法常常被運(yùn)用在產(chǎn)品早期的根本原因——因?yàn)樗梢詭椭O(shè)計(jì)師驗(yàn)證產(chǎn)品方向是否正確,好及時(shí)作出相應(yīng)的調(diào)整策略。

認(rèn)知走查法的執(zhí)行方式和用戶調(diào)研活動(dòng)中常用的“給定用戶一個(gè)目標(biāo),然后用戶為完成這個(gè)目標(biāo)而使用產(chǎn)品的方法”大同小異,只是執(zhí)行者從用戶換成了設(shè)計(jì)師自己而已。

雖然節(jié)省了用戶成本,但是認(rèn)知走查法會(huì)讓設(shè)計(jì)師容易陷入自我思維中無法自拔,因此走查法對具體的執(zhí)行流程提出了一些建議:

建議團(tuán)隊(duì)組織3~6人組成一個(gè)預(yù)期用戶組。為了提高有效性和評(píng)估數(shù)據(jù)的可靠性,建議這些專業(yè)人士在完成某項(xiàng)特定目標(biāo)時(shí),要考慮到各種各樣的使用因素,并且使用的范圍一定要超出預(yù)期用戶的使用范圍,這樣才能增強(qiáng)捕獲問題的可能性。

同時(shí),專業(yè)人士在進(jìn)行評(píng)估時(shí),需要比較用戶操作和自己操作的區(qū)別,并且將這些內(nèi)容記錄下來方便后續(xù)和其他組員進(jìn)行匯總。也就是說白了,專業(yè)人士不僅要把自己當(dāng)做是用戶,還要把自己當(dāng)作是設(shè)計(jì)者,一人分飾兩角來評(píng)估產(chǎn)品的可用性問題。

4. 可用性測試

可用性檢查的最大好處是不需要借助用戶,同時(shí)這也是該方法最致命的缺陷所在,正因?yàn)榇瞬庞辛藱z查和測試相互配合的現(xiàn)象,這樣才能讓產(chǎn)品的可用性評(píng)估更加全面。

可用性測試是指測試項(xiàng)目必須借助用戶,讓用戶在特定場景中嘗試使用產(chǎn)品完成某項(xiàng)特定任務(wù)或一系列任務(wù)的方法,而設(shè)計(jì)師的職責(zé)就是對用戶使用過程和行為進(jìn)行觀察和記錄。是不是聽著和觀察員的工作很像,沒錯(cuò),在可用性測試中,設(shè)計(jì)師,即主持人就是觀察員!

但在一些工作職責(zé)上存在些許差別,比如設(shè)計(jì)師不會(huì)給予用戶任何的提示和指引,唯一的工作只有觀察用戶行為并且記錄相關(guān)數(shù)據(jù)。其中,所記錄的數(shù)據(jù)包含但不僅限于是否完成任務(wù)、完成任務(wù)的時(shí)間、任務(wù)結(jié)果、是否中斷、中斷位置、跳出率等等。

除此之外,當(dāng)用戶使用完第一款產(chǎn)品時(shí),還會(huì)讓用戶使用其它產(chǎn)品,并要求完成相同的任務(wù)目標(biāo),這樣才能在多個(gè)產(chǎn)品之間進(jìn)行直觀對比,從而確定可用性問題所在。

為了保證數(shù)據(jù)的準(zhǔn)確性,在可用性測試中還會(huì)要求用戶配合使用出聲思維法對當(dāng)下的思考和行為進(jìn)行闡述,這樣可以方便設(shè)計(jì)師及時(shí)了解用戶當(dāng)前的意向。(該做法和焦點(diǎn)小組中的流程式訪談?lì)愃疲虼肆鞒淌皆L談屬于可用性測試的一種衍生。)

可用性測試和檢查不同,檢查是發(fā)現(xiàn)問題后優(yōu)化,再由同一組專業(yè)人員進(jìn)行再評(píng)估。而測試因?yàn)榧尤肓擞脩粢蛩?,因此必要時(shí)候需要開發(fā)人員及時(shí)配合,對產(chǎn)品進(jìn)行快速迭代(畢竟用戶不等人)。也就是說,根據(jù)每一輪測試的反饋結(jié)果,團(tuán)隊(duì)需要對原型或者產(chǎn)品進(jìn)行新的增刪改,然后快速投入到下一輪的測試中去。(該做法和焦點(diǎn)小組中的迭代式訪談?lì)愃疲虼说皆L談也屬于可用性測試的一種衍生。)

從場景上來細(xì)分可用性測試,可大致分為戶外和室內(nèi)測試

4.1 戶外測試

戶外測試和實(shí)地調(diào)研類似,不過沒有實(shí)地調(diào)研的調(diào)研成分,目的很單純,就是為了讓用戶置身于生態(tài)效度下提高測試的真實(shí)性,即將產(chǎn)品置入到實(shí)際場景中,可以發(fā)現(xiàn)更多需要在特定場景才能發(fā)現(xiàn)的問題。

4.2 室內(nèi)測試

室內(nèi)測試和戶外測試正好相反,是將用戶帶到辦公室、會(huì)議室、家等室內(nèi)場景執(zhí)行測試的一種方法集合。雖然室內(nèi)場景缺少生態(tài)效度,不過這樣可以保證所有用戶都處在測試產(chǎn)品的同一起跑線,避免由于受外部環(huán)境影響而產(chǎn)生的數(shù)據(jù)誤差。

Tips:生態(tài)效度指模仿或置身于真實(shí)世界的環(huán)境。

室內(nèi)測試中,有一項(xiàng)測試活動(dòng)比較出名,那就是“眼動(dòng)追蹤”。

4.2.1 眼動(dòng)追蹤

眼動(dòng)追蹤需要借助相應(yīng)的儀器才能進(jìn)行測試。它首次應(yīng)用是在認(rèn)知心理學(xué)領(lǐng)域,后被衍生到醫(yī)療等專業(yè)領(lǐng)域,再后來經(jīng)過在HCI行業(yè)的衍生應(yīng)用,眼動(dòng)追蹤才開始逐漸踏入“研究人眼在哪里尋找信息”的目的,比如用戶在瀏覽界面時(shí),會(huì)盯著哪個(gè)位置看以及界面信息的捕獲頻率等。

各種各樣的眼動(dòng)儀

眼動(dòng)追蹤的具體執(zhí)行過程如下:

需要通過眼動(dòng)儀記錄用戶注釋點(diǎn)和掃視點(diǎn)之間的運(yùn)動(dòng)軌跡,然后創(chuàng)建熱力圖。如果用戶目光在某塊區(qū)域上關(guān)注時(shí)間越長,則說明該區(qū)域的關(guān)注度強(qiáng),在熱力圖上會(huì)顯示紅色;反之關(guān)注時(shí)間越短則說明該區(qū)域用戶一掃即過,關(guān)注度弱,在熱力圖上會(huì)顯示綠色(或藍(lán)色),至于沒有看到的地方則屬于“視覺盲區(qū)”,顯示黑色。

眼動(dòng)追蹤儀下的熱力圖

設(shè)計(jì)師可以通過這個(gè)方法來了解用戶在成品界面上尋找信息和關(guān)注點(diǎn)區(qū)域的熱度,然后直觀地得到要對頁面調(diào)整的方向,嘗試通過熱力區(qū)域讓一些想要被用戶關(guān)注的信息更容易被吸引到,比如Airbnb設(shè)計(jì)團(tuán)隊(duì)就是利用的熱力圖建立出了一個(gè)簡潔的視覺層次,用以傳遞特定信息的區(qū)域被精準(zhǔn)定位(吸引用戶注意力),下面這張圖就是Airbnb的Z子型布局如何吸引和引導(dǎo)注意力的熱力圖:

Airbnb的Z子型布局

總的來說,眼動(dòng)追蹤的目的是為了通過熱力圖的方式來了解用戶在哪個(gè)位置尋找信息,這樣可以了解到用戶是否發(fā)現(xiàn)目標(biāo)位置或正在處理什么問題。

不過,在用戶執(zhí)行眼動(dòng)的過程中切忌讓用戶采用出聲思維來配合表述。因?yàn)楹陀^察員談話或者回憶思索容易改變眼睛的注視點(diǎn)(人在回憶和思考時(shí),眼神容易渙散),這會(huì)將熱力圖的數(shù)據(jù)打亂,不利于后期的數(shù)據(jù)整理。

那么觀察員又該如何知道用戶在執(zhí)行期間的想法呢?建議可以采用回溯性出聲思維,在事后通過向用戶展示熱力圖、眼動(dòng)軌跡和一起錄制好的視頻,讓用戶嘗試采用回憶的方式來陳述當(dāng)時(shí)的想法。

ips:回溯性出聲思維指給參與者播放或展示當(dāng)時(shí)的視頻或行為,并要求說出他們當(dāng)時(shí)的所思所想。

5. 合意性研究

合意性研究不僅可以滿足可用性測試的要求,同時(shí)還可以滿足易用性和易學(xué)性要求。

在《設(shè)計(jì)心理學(xué)》中,唐納德·諾曼曾提出“美觀的產(chǎn)品實(shí)際上更有效”的觀點(diǎn),這句話中的美觀不能狹隘地理解成是“外部的美觀”,其實(shí)應(yīng)該考慮更深層次的“心理美觀”,即ISO 9241/11中所以到的“滿意度”。

所以,合意性研究并不是測試產(chǎn)品某項(xiàng)功能或某項(xiàng)任務(wù)的具體情況,而是在評(píng)估產(chǎn)品是否可以讓用戶產(chǎn)生預(yù)期的情緒反應(yīng)。也就是說,合意性研究關(guān)注的是人的情緒而非產(chǎn)品的實(shí)際效用,如果說產(chǎn)品的實(shí)際效用好了,即產(chǎn)品可用性高,那么用戶自然而然就會(huì)產(chǎn)生一種積極的情緒反應(yīng)。

關(guān)于合意性研究的執(zhí)行流程,是需要在用戶已經(jīng)使用完產(chǎn)品的前提下,設(shè)計(jì)師向用戶提供提前準(zhǔn)備好的情緒卡片(卡片上寫著不同的情緒形容詞),要求用戶選擇出其中“你認(rèn)為符合當(dāng)前使用后心情”的卡片來描述使用產(chǎn)品時(shí)的感覺(卡片描述內(nèi)容不全,也可以允許用戶自行添加)??梢允钦w感覺,也可以是在使用的過程中的情緒波動(dòng)(強(qiáng)烈建議選擇這個(gè)方式),然后參照卡片分類法,創(chuàng)建親和力圖。這樣可以更加直觀地觀察到用戶在使用過程中的情緒波動(dòng),方便設(shè)計(jì)師創(chuàng)建體驗(yàn)地圖來發(fā)現(xiàn)痛點(diǎn),挖掘機(jī)會(huì)點(diǎn)。

情緒體驗(yàn)地圖

6. 快速迭代

快速迭代測試法其實(shí)有很多同類型的理念,比如敏捷開發(fā)、精益設(shè)計(jì)、精益創(chuàng)業(yè)等等,這些方法都算是一種小步快跑、快速迭代的科學(xué)工作和做事的一種方法論。

相對于眼動(dòng)和合意性研究的總結(jié)性評(píng)估而言,快速迭代屬于一種形成性評(píng)估方法。它不同于傳統(tǒng)的可用性測試目的是為了發(fā)現(xiàn)大量且細(xì)節(jié)的可用性問題,快速迭代的目的是迅速確定重大可用性問題,也就是前文所說的極端或接近極端情況的問題,然后快速優(yōu)化。

“迅速發(fā)現(xiàn)問題”是快速迭代法的其中一個(gè)核心環(huán)節(jié),重點(diǎn)在于“快速”。其次“迅速迭代”是另一個(gè)核心環(huán)節(jié),重點(diǎn)在于“迭代”,即一部分人發(fā)現(xiàn)問題,然后再由另一部分人同步進(jìn)行優(yōu)化,如此循環(huán)往復(fù)直至完善。為了避免“閉門造成”的情況發(fā)生,建議在快速迭代法的執(zhí)行期間,多配合其他方法進(jìn)行觀察和測試,避免產(chǎn)生資源內(nèi)耗。

細(xì)心的讀者會(huì)發(fā)現(xiàn),快速迭代其實(shí)和迭代式訪談?lì)愃?,所以?yán)格意義上來將迭代式訪談完全是快速迭代的一種衍生。

7. 灰度測試

灰度測試通常和我們常說的“版本內(nèi)測”概念相似,是指軟件要在不久的將來推出一個(gè)全新的功能或者是重大改版之前,都會(huì)先進(jìn)行一波小范圍的內(nèi)外部測試工作,然后由小范圍逐漸放量,直至這個(gè)新功能覆蓋全部用戶,這個(gè)過程就是灰度發(fā)布,而逐漸覆蓋的過程就叫滾動(dòng)發(fā)布。

從顏色上來理解的話,就是從白(未知)到黑(已知)的過程中間會(huì)有個(gè)灰度區(qū)間,這個(gè)灰度區(qū)間就是用來過渡的。

在這個(gè)過渡區(qū)間,團(tuán)隊(duì)會(huì)通過逐步的放量過程發(fā)現(xiàn)產(chǎn)品在使用期間的問題,包含但不僅限于bug、體驗(yàn)問題,只要是產(chǎn)品問題都會(huì)在灰度測試期間被不斷改進(jìn),也就是常說的查漏補(bǔ)缺,逐步完善,這樣才能為產(chǎn)品正式發(fā)布之前打下堅(jiān)實(shí)基礎(chǔ)。

8. AB測試

從人機(jī)交互的角度來看,AB測試屬于灰度測試的一種細(xì)分方法,是總結(jié)性的評(píng)估方法。其中AB測試的目的是為了通過對比兩個(gè)方案,看出哪個(gè)方案更好的一種方法,比如通過點(diǎn)擊率、感知力度、眼動(dòng)追蹤等方式對結(jié)果進(jìn)行評(píng)估。

在AB測試中,會(huì)生成兩種不同的方案,而這兩個(gè)方案的唯一變量有且僅有一個(gè)(單因素設(shè)計(jì)法),比如紅變綠、大變小等,然后將兩組方案同時(shí)投放給對應(yīng)的兩組用戶(A、B組,這就像初高中的化學(xué)實(shí)驗(yàn)一樣,一組為對照組、一組為實(shí)驗(yàn)組)進(jìn)行測試(同時(shí)投放是為了控制未知變量對用戶的影響),接著通過日志分析、眼動(dòng)追蹤等評(píng)估方法來對比兩個(gè)方案在數(shù)據(jù)上的優(yōu)劣勢。

不過在實(shí)際工作運(yùn)用中,AB測試由于要出兩套方案,所以這是一種雙倍成本的測試方法,所以在使用的時(shí)候一般只會(huì)是很難決策的內(nèi)容才會(huì)考慮采用AB測試。

更何況,AB測試是一項(xiàng)極其復(fù)雜的集數(shù)據(jù)設(shè)計(jì)、測試和分析工作為一體的測試方法,它不僅要涉及到開發(fā)內(nèi)容,還要掌握一定的數(shù)據(jù)分析基礎(chǔ),比如對流量、域、層、桶、同層互斥分配和分層流量正交分配的設(shè)計(jì)等等,這對于用戶體驗(yàn)設(shè)計(jì)師而言跨度比較大。這些工作在大型企業(yè)中往往會(huì)由專業(yè)的數(shù)據(jù)分析師擔(dān)任,而在小公司,則會(huì)由產(chǎn)品經(jīng)理兼顧,不過產(chǎn)品經(jīng)理畢竟不是數(shù)據(jù)分析專業(yè)方向,也僅僅只是兼顧,因此對AB測試的數(shù)據(jù)分析僅流于于表面,更多深層次的數(shù)據(jù)分析還是需要依賴專業(yè)程度更高的數(shù)據(jù)分析師。

根據(jù)結(jié)果顯示,用戶對整體內(nèi)容的框架理解,版本B明顯優(yōu)于版本A

四、總結(jié)

從上述所介紹的諸多可用性評(píng)估方法可以看出,無論是檢查還是測試,它們都同時(shí)具備了和用戶調(diào)研一樣的活動(dòng)目的——用戶調(diào)研注重對未知功能的挖掘,然后設(shè)計(jì)它;而可用性評(píng)估則注重在前者完成的基礎(chǔ)上不斷尋找不足之處,然后嘗試完善它。

因此,可用性評(píng)估的特性就像調(diào)研活動(dòng)(這里主要指的是用戶調(diào)研活動(dòng))一樣,沒有哪一種方法是完美的,不同的方法存在不同的瑕疵,需要互相配合使用才能讓產(chǎn)品達(dá)到最理想的體驗(yàn)狀態(tài)。

 

作者:大圣;公眾號(hào):叨叨的設(shè)計(jì)足跡

本文由 @大圣 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 沒有哪一種方法是萬能且完美的,要綜合運(yùn)用不同的方法,靈活處理,隨機(jī)應(yīng)變。

    來自湖北 回復(fù)
    1. 對的,利用不同的方法來補(bǔ)足優(yōu)缺點(diǎn)。

      來自浙江 回復(fù)
  2. 如何做好體驗(yàn)評(píng)估(測試)工作?這篇文章的干貨實(shí)在是太太……太棒了吧,收藏收藏,必須收藏。

    來自河南 回復(fù)
    1. 感謝認(rèn)可

      回復(fù)