可用性測(cè)試你不知道的Buff!

1 評(píng)論 6029 瀏覽 56 收藏 42 分鐘

編輯導(dǎo)語:可用性測(cè)試,能夠讓產(chǎn)品經(jīng)理借助用戶,更加客觀理性地理解產(chǎn)品功能以及交互,并結(jié)合測(cè)試結(jié)果予以改進(jìn)。每個(gè)產(chǎn)品的迭代都需要進(jìn)行可用性測(cè)試,可以說“可用性測(cè)試”是交互設(shè)計(jì)中進(jìn)行驗(yàn)證必不可少的環(huán)節(jié)。本篇文章分享了一些不一樣的“可用性測(cè)試”技巧,希望對(duì)你有所幫助。

之前群里的設(shè)計(jì)師提起了可用性測(cè)試,說面試的過程中被問到了,其實(shí)它的流程跟方法并不難,網(wǎng)上的教程資源也不少,很多參與過或了解過的人即使沒有主導(dǎo)過卻也能說個(gè)一二。

哪這門蘊(yùn)含科學(xué)的測(cè)試研究方法真就這么簡(jiǎn)單? 借著這個(gè)機(jī)會(huì)結(jié)合個(gè)人的一點(diǎn)小心得,來聊一點(diǎn)不一樣的“可用性測(cè)試”技巧。

一、可用性測(cè)試的應(yīng)用場(chǎng)景與作用

可用性測(cè)試(Usability Test)的應(yīng)用場(chǎng)景是沒有行業(yè)的明確界定的,它一般發(fā)生在產(chǎn)品研發(fā)上線的前中期,在功能或交互流程有待商榷之時(shí),通過可用性測(cè)試可以獲得更加真實(shí)的反饋來幫助決策或改進(jìn)。

當(dāng)然已上線的產(chǎn)品,同樣可以使用可用性測(cè)試為下個(gè)版本優(yōu)化迭代做投資。

其中探索式跟驗(yàn)證式是常見的兩個(gè)可用性測(cè)試類型,探索式適合企業(yè)對(duì)產(chǎn)品進(jìn)行創(chuàng)新設(shè)計(jì)以迎合新時(shí)代發(fā)展的步伐與商業(yè)競(jìng)爭(zhēng)力,驗(yàn)證式適合企業(yè)追求精益運(yùn)營或增長(zhǎng)設(shè)計(jì)。

對(duì)于可用性測(cè)試的概念,這里我用一段類比的情景來揭示出其中奧妙。

做好一個(gè)飯館,而菜品必定是館子的核心競(jìng)爭(zhēng)力之一,菜不好吃,那就很難形成競(jìng)爭(zhēng)力或留住客人,所以開發(fā)新的菜品或改進(jìn)就很重要。

當(dāng)廚師開發(fā)了新的菜品后,首先肯定是廚師們互相品嘗,并不會(huì)直接上菜譜開售,這就像是內(nèi)測(cè)過程,當(dāng)廚師們覺得還可以時(shí),就會(huì)找食客們進(jìn)行免費(fèi)試吃,通常這個(gè)時(shí)候廚師們需要食客們給出反饋或一定意見,如果食客們大多表示這個(gè)菜不錯(cuò),下次還愿意吃,那么就是表示這個(gè)新菜品的可行性很高,用戶滿意度不錯(cuò),就可以考慮對(duì)菜品優(yōu)化上菜譜了。

而這個(gè)過程就像可用性測(cè)試一樣,它為新菜品上菜譜降低了風(fēng)險(xiǎn),為菜品對(duì)菜館整體體驗(yàn)提升了保障,其中“菜館的食客”就像是測(cè)試的目標(biāo)用戶,請(qǐng)求他們嘗試新的菜品并給出意見,這便是招募用戶和測(cè)試階段,詢問食客是否還會(huì)再點(diǎn)這個(gè)菜品,覺得這個(gè)菜品在什么價(jià)位區(qū)間,就算是對(duì)用戶滿意度或可行性衡量了。

相比專業(yè)可用性測(cè)試,只是少了更多的測(cè)試流程、測(cè)試技巧與科學(xué)嚴(yán)謹(jǐn)?shù)姆治鰠R報(bào),但是基本概念是一致的。

但值得注意的是針對(duì)單個(gè)菜品的研究并不是面向整個(gè)菜館的,可用性測(cè)試很少用于研究用戶對(duì)產(chǎn)品或服務(wù)的整體體驗(yàn)。

所以可用性測(cè)試的本質(zhì)就很好理解了,以互聯(lián)網(wǎng)產(chǎn)品為例,其實(shí)就是服務(wù)數(shù)字化后的功能與流程含有不確定性,而決定找到目標(biāo)用戶還原使用場(chǎng)景進(jìn)行測(cè)試驗(yàn)證,以評(píng)測(cè)設(shè)計(jì)是否行得通、哪里需要改進(jìn),為功能上線減少風(fēng)險(xiǎn)加強(qiáng)容錯(cuò),減少試錯(cuò)的成本。

二、高保真原型與測(cè)試場(chǎng)景還原

要測(cè)試就得有測(cè)試內(nèi)容,所以測(cè)試對(duì)象是必不可少的內(nèi)容,這個(gè)過程是我們還原真實(shí)用戶在特定場(chǎng)景下進(jìn)行產(chǎn)品體驗(yàn)的一系列問題反饋,那么為了盡可能的還原“真實(shí)”,肯定不能只是在用戶的真實(shí)性上下功夫,接近真實(shí)的高保真原型就顯得尤為重要。

以互聯(lián)網(wǎng)產(chǎn)品來講,還原一個(gè)可交互的高保真原型并不難,成本也不會(huì)很高,可能就是信息內(nèi)容設(shè)計(jì)與素材準(zhǔn)備會(huì)相對(duì)麻煩點(diǎn),對(duì)于交互動(dòng)效,基本可用就行,不必過分追求。

并且實(shí)現(xiàn)的工具也很豐富,對(duì)于大型框架原型可以使用“墨刀、MasterGo、AxureRP”等制作,小型精致的原型可以使用“Principle、Hype3、Flinto、Sketch、Keynote”等制作。

反而是工業(yè)產(chǎn)品設(shè)計(jì)的原型會(huì)比較麻煩,有的可能要出3D打印甚至開發(fā)測(cè)試樣品,盡管這些工作會(huì)花費(fèi)一定的時(shí)間與成本,但是從產(chǎn)品穩(wěn)健發(fā)展的戰(zhàn)略來看,這些投資是值得的,也是老板們可以接受的。

在大多數(shù)的可用性測(cè)試文章或教程中,用戶都是在一個(gè)相對(duì)降噪的會(huì)議室或?qū)嶒?yàn)室進(jìn)行的,其目的是為了更好的布置設(shè)備用于過程的觀察與記錄,同時(shí)為用戶測(cè)試減少干擾與評(píng)估難度(其實(shí)也省錢),但事實(shí)上還原產(chǎn)品服務(wù)的真實(shí)場(chǎng)景是很有必要的,并且一些產(chǎn)品服務(wù)自身就會(huì)含有一定的場(chǎng)景屬性,所以你的測(cè)試環(huán)境就應(yīng)該考慮接近真實(shí)場(chǎng)景的布置,甚至考慮跳出會(huì)議室、實(shí)驗(yàn)室。

這樣的目的也是為了更加真實(shí)的還原使用場(chǎng)景,以取得更嚴(yán)謹(jǐn)科學(xué)的有效信息來賦能設(shè)計(jì),這也是為什么大多數(shù)產(chǎn)品需要上前線測(cè)試的原因,就像藥品誕生于實(shí)驗(yàn)室,上架于臨床一樣,例如出行、運(yùn)動(dòng)相關(guān)產(chǎn)品,如果依舊停留在寫字樓里測(cè)試實(shí)驗(yàn),那就是閉門造車。

三、任務(wù)與指標(biāo)定制化設(shè)計(jì)

產(chǎn)品的本質(zhì)是為用戶提供服務(wù),用戶會(huì)為了達(dá)成自己的某個(gè)目標(biāo)或需求而花費(fèi)時(shí)間使用產(chǎn)品,而我們需要用戶測(cè)試一系列功能來評(píng)測(cè)是否能夠協(xié)助完成目標(biāo)任務(wù)。

所以我們?cè)谠O(shè)定不同任務(wù)的時(shí)候應(yīng)該以某個(gè)用戶需求或目標(biāo)為導(dǎo)向來驅(qū)動(dòng)用戶使用產(chǎn)品功能,而不是系統(tǒng)的指出完成那些操作任務(wù),那樣沒辦法深入挖掘真實(shí)有效的信息。

所以在向用戶頒布測(cè)試任務(wù)的時(shí)候,我們應(yīng)該為用戶建立一些任務(wù)背景,并且盡可能看起來真實(shí)可靠,容易接受和共情,甚至你可以在測(cè)試前的暖場(chǎng)環(huán)節(jié),根據(jù)此次的功能作用推導(dǎo)一些使用場(chǎng)景和需求,并與用戶進(jìn)行簡(jiǎn)單交涉,看看那些需求很有可能發(fā)生在用戶身上,并以此需求目標(biāo)來調(diào)整任務(wù)的話術(shù)來驅(qū)動(dòng)用戶完成測(cè)試。

值得注意的是如果測(cè)試的部分比較明確,那么你的任務(wù)目標(biāo)也應(yīng)該盡可能的聚焦或明確下來。

好了,為了方便理解我要說人話了。

(1)重點(diǎn)補(bǔ)充

因?yàn)樵谡麄€(gè)測(cè)試的過程中,參與測(cè)試的用戶不止一個(gè),所以在了解用戶情況后,可以綜合一下共同的特征再去提煉優(yōu)化任務(wù)目標(biāo),以保證在多個(gè)參與者中維持評(píng)估的一致性。

并且任務(wù)目標(biāo)應(yīng)該盡可能的準(zhǔn)確有效,我們是要測(cè)試新的拍攝識(shí)別功能,那我們就應(yīng)該要求出來,而不是說看完書后使用APP的筆記并嘗試各種功能支持,產(chǎn)品或功能所沒有的就不要提。不保證有效性,最后也只能讓用戶感到困惑而已。

通常完成測(cè)試任務(wù)的過程中,會(huì)涉及到多個(gè)功能之間的交互,所以任務(wù)目標(biāo)涉及的多個(gè)階段應(yīng)該貼合實(shí)際的操作順序或流程規(guī)范,另外盡可能的避免專業(yè)術(shù)語的出現(xiàn),務(wù)必考慮“適老化”一下。

(2)關(guān)于指標(biāo)定制化

通常在可用性測(cè)試中,是否可用的指標(biāo)被劃分成了三大面:有效性、任務(wù)效率、滿意度,對(duì)于這三方面我們可以繼續(xù)細(xì)化成若干個(gè)二級(jí)指標(biāo)用于界定產(chǎn)品可用性。

至于你家的產(chǎn)品是什么行業(yè)、什么階段、什么用途、有何特性,應(yīng)該滿足哪些指標(biāo)為可用,我就不深入了,相信大家心里都有數(shù)。

簡(jiǎn)言之核心就是考慮產(chǎn)品的特性與階段,靈活的配置可用性的指標(biāo),這里整理了些常見的指標(biāo)與說明用于參考。

四、用戶測(cè)試中常見的問題

盡管我們有測(cè)試腳本甚至測(cè)試排練,已經(jīng)盡可能的保障了可用性測(cè)試的穩(wěn)定可靠,但實(shí)際上在用戶測(cè)試的階段還是會(huì)出現(xiàn)各種問題,用戶像一個(gè)熟睡的嬰兒,何時(shí)醒來何時(shí)哭泣不可預(yù)見,所以這就要求測(cè)試的主持人能夠靈活變通,同時(shí)在技巧上符合可用性測(cè)試的科學(xué)嚴(yán)謹(jǐn)。

可用性測(cè)試過程中的科學(xué)嚴(yán)謹(jǐn)一方面體現(xiàn)在方案的合理性、測(cè)試主持的技巧上、及評(píng)估分析量化的方法上,這些大多可用性測(cè)試的文章或教程中都會(huì)提到,這里就不展開啰嗦了。

常見問題舉例:

1. 他似乎在想些什么但是沒有說出來?

你在想什么可以分享一下嗎?

2. 用戶好像卡住了或遇到bug了。

這沒事兒,是我們產(chǎn)品設(shè)計(jì)的問題,你可以考慮跳過這一步好了。

3. 就是這個(gè),它怎么就那啥了?表述不清。

你剛剛打算做些什么,如果是你,你準(zhǔn)備怎么去設(shè)計(jì)?有沒有一些參考。

4. 然后我要怎么做呢?

對(duì)于用戶提問說明遇到了障礙,嘗試反問你平時(shí)會(huì)怎么做?

5. 用戶反饋了一些趨勢(shì)或點(diǎn)子,看起來很有價(jià)值。

嘗試深挖,順著點(diǎn)子或趨勢(shì)向用戶多問一點(diǎn),但是不要直接問“為什么”,可以嘗試問好在哪里或者哪里不好,讓問題更有頭緒一點(diǎn)。

以上不難看出,即使有了腳本,但是用戶依舊是一個(gè)變量因素,所以腳本依舊需要不斷調(diào)整,也只有去調(diào)整才能更好的保障測(cè)試結(jié)果的有效性,同時(shí)主持者也需要隨時(shí)準(zhǔn)備靈活的應(yīng)對(duì)各種幺蛾子。

五、創(chuàng)新與顛覆性設(shè)計(jì)如何測(cè)試

可用性測(cè)試被很多人視為評(píng)估體驗(yàn)的制勝法寶,但實(shí)際上很多產(chǎn)品在行業(yè)中已經(jīng)逐步成熟,并有大企業(yè)花費(fèi)大量資源進(jìn)行研究摸索,讓生態(tài)系統(tǒng)更進(jìn)一步,所以說要是你的產(chǎn)品沒有特殊的創(chuàng)新或瓶頸,而是傳統(tǒng)的功能研發(fā),其實(shí)并不一定要花費(fèi)成本去做可用性測(cè)試,直接按照行業(yè)標(biāo)桿也是沒問題的。

那么你的產(chǎn)品就是有創(chuàng)新或顛覆性設(shè)計(jì)怎么辦?

通常這個(gè)時(shí)候就會(huì)面臨一個(gè)問題,打破傳統(tǒng)或者顛覆用戶的常識(shí)。類似這種顛覆式或創(chuàng)新技術(shù)其實(shí)非常多,例如按鍵手機(jī)一下到了觸屏?xí)r代、智能駕駛、語言助手的誕生、刷臉支付等,這對(duì)企業(yè)是機(jī)會(huì)也是風(fēng)險(xiǎn),所以在進(jìn)行可用性測(cè)試的時(shí)候也會(huì)有些不大一樣的地方。

我們悉知在可用性測(cè)試的三大指標(biāo)中就有一項(xiàng)是“效率”,對(duì)此也會(huì)有一些完成任務(wù)的時(shí)間作為指標(biāo),這些指標(biāo)通常是根據(jù)內(nèi)部人士或?qū)<彝瓿扇蝿?wù)的時(shí)間乘上2倍或者更多倍做為一個(gè)評(píng)測(cè)指標(biāo)。

但是對(duì)于顛覆性的變化,我們需要給用戶首次測(cè)試留出更多的時(shí)間去學(xué)習(xí)去適應(yīng),在此之后,可以讓用戶再進(jìn)行1~2次的測(cè)試,并且比較多次任務(wù)完成的時(shí)間變化,如果時(shí)間能夠大幅度縮減且完成任務(wù),那就表示可用,而這樣做也是為了保障測(cè)試的科學(xué)嚴(yán)謹(jǐn)性,以避免學(xué)習(xí)門檻對(duì)創(chuàng)新性的評(píng)測(cè)影響。

六、多版本Battle你需要小型可用性測(cè)試

可用性測(cè)試需要招募用戶進(jìn)行測(cè)試,預(yù)算時(shí)間精力可謂一項(xiàng)都不能少,但是大多公司的窘境卻是公司小資源又有限,又不給預(yù)算招募,可用性測(cè)試做不起來??jī)?nèi)部產(chǎn)出版本過多,不知何去何從?別擔(dān)心,小型可用性測(cè)試了解一下!

1. 什么是小型可用性測(cè)試(Small Usability Test)?

小型可用性測(cè)試就是在標(biāo)準(zhǔn)的可用性測(cè)試的基礎(chǔ)上減少了一些流程與要求,這就像是大公司與小公司之間會(huì)有各自的研發(fā)流程一樣,兩者各有千秋,對(duì)應(yīng)公司規(guī)模與背景對(duì)癥下藥。

在小型可用性測(cè)試中,也有腳本、簡(jiǎn)易的暖場(chǎng)、用戶定義、測(cè)試目標(biāo)、測(cè)試任務(wù)、測(cè)試原型、測(cè)試參與者、測(cè)試觀察、思考總結(jié),更多的也是發(fā)生在功能上線之前的推敲階段,它比較適合設(shè)計(jì)師在自測(cè)階段后的驗(yàn)證以及多版本Battle,幫助你Pick一套更加合適的方案。

但是整個(gè)過程相對(duì)正式可用性測(cè)試會(huì)更加簡(jiǎn)單易行,其中價(jià)值觀念與目的都是一致的,都是以用戶價(jià)值與用戶目標(biāo)來驅(qū)動(dòng)(使用動(dòng)機(jī))使用產(chǎn)品,并且觀察用戶的使用過程以獲取有效的反饋來改進(jìn)或決策。

不過呢,腳本會(huì)更加簡(jiǎn)易一些,原型材料也不用那樣精細(xì),主要能表達(dá)功能作用與信息流程為主,其中測(cè)試者更多的是尋求那些關(guān)心我們產(chǎn)品或有需求的用戶,另外也不會(huì)準(zhǔn)備那些知情書、協(xié)議、錄制設(shè)備、測(cè)試指標(biāo)啥的,更多的是尋求熟人或哪些有意向的用戶快速進(jìn)行測(cè)試并觀察,這樣不僅時(shí)間成本都節(jié)省了,難度降低了,也能拿到一定的有效測(cè)評(píng)結(jié)果。

基本上主要的實(shí)踐步驟就這五點(diǎn),還有一些布置會(huì)穿插在其中,后面代入案例講解一下。

2. 案例代入講解

便于直觀的了解和感受小型可用性測(cè)試,這里代入一個(gè)老案例講解一下,關(guān)于案例背景這里簡(jiǎn)單交代一下。

(1)背景

平臺(tái)服務(wù)于游戲相關(guān)的訂單交易、互動(dòng)娛樂,本次測(cè)試的內(nèi)容是新的游戲訂單定制服務(wù),通過推出一批專供用戶定制游戲服務(wù)的客服來完成溝通與定制下單,其價(jià)值在于幫助用戶快速了解平臺(tái)游戲服務(wù)以及快速定制服務(wù)并完成下單轉(zhuǎn)化,以溝通的方式減少用戶下單的操作流程與門檻。

(2)任務(wù)流程

設(shè)計(jì)服務(wù)入口與流量分發(fā)->用戶選擇心儀的小魚(專供客服的代稱)->進(jìn)入小魚的會(huì)話界面->溝通需求目標(biāo)->小魚制定用戶專屬服務(wù)訂單->用戶支付確認(rèn)->轉(zhuǎn)到訂單流程

為了加快講解和體現(xiàn)測(cè)試的價(jià)值與方法,這里就不跑全套流程了,就以小魚入口的設(shè)計(jì)與流量分發(fā)來代入講解,測(cè)試前提是聊天會(huì)話界面中已經(jīng)集成了“小魚”所受理的主要游戲業(yè)務(wù)介紹,以及快速下單的入口。

當(dāng)然一般都是在用戶向“小魚”傾述目標(biāo)需求后,由“小魚”進(jìn)行服務(wù)定制,并向用戶發(fā)起訂單等待用戶確認(rèn)支付,之后便是等待訂單完成到驗(yàn)收評(píng)價(jià),平臺(tái)轉(zhuǎn)交傭金。

(3)首先定義用戶與目標(biāo)

在這個(gè)測(cè)試任務(wù)開展前一定要知道開展目的是什么,然后就是這個(gè)過程中你的功能或產(chǎn)品是為什么樣的人服務(wù),能為他們帶來什么樣的價(jià)值,也就是前面一直提到的價(jià)值與目標(biāo)驅(qū)動(dòng)用戶的概念。

為此你可以建立一個(gè)簡(jiǎn)易的用戶原型來定義用戶的特征屬性,使得目標(biāo)群體再具體一些。

然后將小魚的服務(wù)價(jià)值寫出來,讓參與者能夠快速知道小魚功能有什么用:

(4)創(chuàng)建適用于目標(biāo)的測(cè)試任務(wù)

對(duì)于測(cè)試任務(wù)的創(chuàng)建,應(yīng)該是圍繞目標(biāo)的。

根據(jù)流程的多少或復(fù)雜程度,可以劃分為多個(gè)階段,這樣具有階段性會(huì)更好控制測(cè)試節(jié)奏或分段進(jìn)行,然后就是將多個(gè)任務(wù)按照流程順序或是操作難度排序,目的是使得任務(wù)流程正確或是用戶接受起來更容易。

當(dāng)你把任務(wù)清單羅列出來后還不算完,這套清單你可以放在腳本里,但是當(dāng)你描述給用戶時(shí),你應(yīng)該代入對(duì)方視角去描述并且?guī)в心繕?biāo)性,所以還需要進(jìn)行一次調(diào)整后應(yīng)用:

(5)找到合適的測(cè)試參與者

關(guān)于參與者我們會(huì)參考第一步中所設(shè)定的用戶原型,不需要全部中標(biāo),但至少這些人要看起來會(huì)用得上你的產(chǎn)品才行,通常這些人建議通過熟人關(guān)系去尋找,甚至可以是你的同事,只要他們對(duì)產(chǎn)品沒有額外的偏見,且不是相關(guān)設(shè)計(jì)者、營銷運(yùn)營者或技術(shù)研發(fā)人員,因?yàn)檫@些人對(duì)該領(lǐng)域的知識(shí)掌握甚多,有失真實(shí)性。

當(dāng)你找到這五六個(gè)接近真實(shí)用戶的參與者后,你只需要將起初寫下的“功能價(jià)值闡述”告訴他們,讓他們知道要做一個(gè)怎樣的服務(wù)測(cè)試,然后預(yù)約他們?cè)诓煌臅r(shí)間節(jié)點(diǎn)上花費(fèi)半個(gè)小時(shí)來做一個(gè)簡(jiǎn)單的功能測(cè)試即可。

(6)觀察參與者如何執(zhí)行任務(wù)

在這個(gè)階段,你需要保證已經(jīng)準(zhǔn)備好了測(cè)試原型,以及一份腳本,腳本中會(huì)規(guī)范以上的功能價(jià)值、測(cè)試任務(wù)、一些簡(jiǎn)易的指標(biāo)、關(guān)注要點(diǎn)、暖場(chǎng)介紹、流程順序等。

然后你要找一個(gè)相對(duì)安靜低調(diào)的測(cè)試場(chǎng)地,不一定是會(huì)議室,不用很大空間,一個(gè)桌子兩個(gè)椅子和一些必備的材料即可,但不要有一些產(chǎn)品相關(guān)或商業(yè)的痕跡,會(huì)形成干擾。

在測(cè)試開始前你需要將測(cè)試原型初始化,以確保每個(gè)參與者測(cè)試的一致性。

在暖場(chǎng)和任務(wù)布置完成后,就是測(cè)試者的Show Time了,主持者可以拿好自己的小本本或者錄音筆,認(rèn)真的觀察測(cè)試者的操作或口述反饋,當(dāng)測(cè)試者遇到一些問題不知所措時(shí),也不用著急指導(dǎo),告訴測(cè)試者先按照自己的認(rèn)知或想法去做就好。

如果測(cè)試者在一個(gè)地方卡了好幾分鐘,沒有一點(diǎn)頭緒甚至感到受挫那就讓測(cè)試者先跳過障礙,避免整個(gè)測(cè)試節(jié)奏失控。另外記得提醒測(cè)試者口述反饋,這很重要。

當(dāng)在計(jì)劃的時(shí)間段完成測(cè)試后,就為測(cè)試者送上準(zhǔn)備的獎(jiǎng)品,寒暄幾句后送測(cè)試者去休息或離開,然后對(duì)材料或記錄進(jìn)行簡(jiǎn)單整理后,準(zhǔn)備下一場(chǎng)測(cè)試。

(7)思考與總結(jié)

在完成一輪簡(jiǎn)單的小型可用性測(cè)試后,通常一定會(huì)拿到一些有用的反饋,可能有些零散還需要進(jìn)一步的整理,但這不影響最后的分析結(jié)果,為了方便驗(yàn)證和整理,我們會(huì)提前把一些重要的問題點(diǎn)羅列出來,然后根據(jù)測(cè)試者的反饋進(jìn)行記錄歸檔。

最終當(dāng)你完成了這些測(cè)試及反饋信息收集以后,產(chǎn)品方案中究竟哪里出了問題應(yīng)該就了解的差不多了,一些比較明顯的問題甚至?xí)粶y(cè)試者多次提及,或許是頁面信息不被理解、交互難懂、提供的內(nèi)容不受測(cè)試者喜愛,亦或是測(cè)試者都認(rèn)可、設(shè)計(jì)亮點(diǎn)被用戶親睞。

盡管會(huì)發(fā)現(xiàn)一些跟我們預(yù)期不大一樣的結(jié)果,但都是正常的,值得注意的是,我們應(yīng)該結(jié)合這些數(shù)據(jù)進(jìn)一步的反思,究竟這些反饋有何含義有何價(jià)值,哪里還能優(yōu)化,基于不用的產(chǎn)品服務(wù)或受眾,反思點(diǎn)可能會(huì)有些不同,這里我泛舉一些;

最終呢,我們也是通過測(cè)試取得一些有效的反饋,并根據(jù)反饋深思了更好的設(shè)計(jì)方案,我們對(duì)小魚卡片的信息進(jìn)行了豐富以保證可比較性,將每批三個(gè)小魚卡片擴(kuò)展到了8個(gè),用戶可以通過橫向滑動(dòng)查看更多,同時(shí)為了方便用戶更好的換到下一批,在最末尾給予了滑動(dòng)換批次的交互,使得用戶可以一指滑動(dòng)到底完成查看與換批次的交互銜接,在之后的驗(yàn)證測(cè)試中也是獲得了測(cè)試者的認(rèn)可與看好。

相信說到這里,怎么做好一輪小型可用性測(cè)試已經(jīng)了解了,當(dāng)你完成了這些測(cè)試任務(wù),一定記得不要忘了后續(xù)的反思與優(yōu)化迭代,甚至制定后續(xù)的研究計(jì)劃。

七、多版本方案如何可用性測(cè)試

有時(shí)候設(shè)計(jì)產(chǎn)生多個(gè)版本也是在所難免的,那么對(duì)于多方案是應(yīng)該將內(nèi)部推薦的拿出來測(cè)試,還是應(yīng)該直接兩個(gè)版本一起拿出來,兩個(gè)一起會(huì)不會(huì)因?yàn)椴杉窟^少不準(zhǔn)確呢?

這里我們?cè)僬f說有多個(gè)版本怎么做好測(cè)試計(jì)劃與分配,當(dāng)有多個(gè)版本準(zhǔn)備可用性測(cè)試時(shí),如何制定測(cè)試計(jì)劃還要看版本數(shù)量、版本差異化這兩大維度,力爭(zhēng)做好有效且不費(fèi)力。

如果說在設(shè)計(jì)過程中產(chǎn)生的多個(gè)版本差異不大,那么都進(jìn)行測(cè)試的必要性我認(rèn)為不大,通過在商業(yè)價(jià)值與用戶體驗(yàn)間做衡量,選擇一個(gè)更加符合產(chǎn)品階段的方案進(jìn)行可用性測(cè)試即可。

但是如果多個(gè)版本差異較大,難以決策且不確定性較大,那么第一件事就是經(jīng)過一輪決策將版本減少到兩個(gè)左右,然后再進(jìn)行可用性測(cè)試,對(duì)于此類情況基本上有兩種方法進(jìn)行分配測(cè)試;

1. 將版本分為兩組進(jìn)行測(cè)試

如果說直接分成兩組進(jìn)行可用性測(cè)試,那么需要數(shù)據(jù)樣本會(huì)更大,數(shù)據(jù)采集量過少確實(shí)會(huì)有不準(zhǔn)確的可能,因此直接分成倆組進(jìn)行測(cè)試的話,會(huì)需要招募更多測(cè)試者和測(cè)試準(zhǔn)備,但同時(shí)可能會(huì)有意外的驚喜。

往往我們以為的,可能會(huì)在測(cè)試者那里收獲意料之外的反饋,這將允許我們以真實(shí)用戶的視角去挖掘價(jià)值或決策,避免內(nèi)部短視而埋沒了好的設(shè)計(jì)。

2. 一組人員測(cè)試兩個(gè)版本

相比分多組測(cè)試,一組人員測(cè)試兩個(gè)版本在成本上會(huì)更有優(yōu)勢(shì),但同時(shí)會(huì)面臨兩個(gè)版本測(cè)試的前后順序影響,要知道第一個(gè)版本會(huì)對(duì)用戶形成更多印象,甚至產(chǎn)生一些偏好,所以為減小測(cè)試結(jié)果的偏差,我們會(huì)將測(cè)試者分為數(shù)量相同的兩組,并安排兩組不同的先后順序進(jìn)行測(cè)試來打破僵局。

八、測(cè)試結(jié)果的量化或匯報(bào)技巧

測(cè)試結(jié)果量化的目的在于更好的衡量可用性在怎樣的一個(gè)水準(zhǔn)線上,同時(shí)便于整理復(fù)盤整個(gè)測(cè)試過程,并將結(jié)果更加直觀的展現(xiàn)出來,便于同事們了解。對(duì)于測(cè)試結(jié)果量化有兩個(gè)方面;

一方面是將整個(gè)測(cè)試過程中收集到的各種問題反饋進(jìn)行分類整理,并用數(shù)據(jù)圖表現(xiàn)出來,這樣能夠很直觀的展現(xiàn)問題缺陷與突破口,同時(shí)能夠快速體現(xiàn)測(cè)試價(jià)值,或者說你進(jìn)行可用性測(cè)試為業(yè)務(wù)帶來的價(jià)值。

另一方面則是通過面向用戶的問卷調(diào)查獲取可用性測(cè)試量表,最常見的標(biāo)配問卷即ASQ(任務(wù)后評(píng)估問卷)與SUS(系統(tǒng)可用性問卷)。

除此之外還有專門面向網(wǎng)站產(chǎn)品的WAMMI(網(wǎng)站分析和測(cè)量表)、SUPR-Q(標(biāo)準(zhǔn)通用的百分等級(jí)量表,但是獲取有效的百分比數(shù)據(jù)需要購買服務(wù),所以不額外介紹了,有興趣的自己百度下),以及面向APP使用體驗(yàn)的SUPR-Qm(APP用戶體驗(yàn)量表),在說明這些量化表怎么使用和定義前,我需要額外說明一些量化表的概念,這很重要!

1. 可用性測(cè)試量表標(biāo)準(zhǔn)

作為一個(gè)合格的標(biāo)準(zhǔn)化量表至少需要保障以下幾點(diǎn):

(1)可信度

對(duì)同一對(duì)象測(cè)量得到的結(jié)果是否一致,這將直接決定問卷獲取的結(jié)果是否能可靠,可以通過重復(fù)測(cè)量信度和分半信度測(cè)量, 測(cè)量出的信度會(huì)在0~1之間,越是接近1的可信度越高,因?yàn)榱炕Y(jié)果會(huì)被直接引用,所以信度至少高于0.7才比較有意義,不然一個(gè)半信半疑的結(jié)果真的充滿風(fēng)險(xiǎn)。

同時(shí)以上我提到ASQ、SUS、WAMMI、SUPR-Qm這四個(gè)量化問卷也都是經(jīng)過業(yè)內(nèi)長(zhǎng)期試驗(yàn)與驗(yàn)證后信度較高的靠譜問卷模式。

(2)有效度

主要理念在于是否密切關(guān)注到了你所在意的問題點(diǎn),以及問卷問題是否與驗(yàn)證系統(tǒng)有關(guān)聯(lián)性,對(duì)于效度也有效標(biāo)效度(皮爾遜相關(guān)系數(shù))和內(nèi)容效度(因子分析) 兩種評(píng)估方法,不過并不一定要有很高的系數(shù)來證明很有效。

(3)靈敏度

指達(dá)到統(tǒng)計(jì)顯著性所需的最小樣本量,例如一個(gè)水果偏好二選一問卷,你問兩個(gè)人可能是答案A,但是你問完10個(gè)人后卻是B,當(dāng)采量過小沒能達(dá)到統(tǒng)計(jì)顯著性所需最小樣本量時(shí),可能會(huì)獲得不夠準(zhǔn)確的答案。

(4)客觀性

一份問卷應(yīng)該保持客觀性,不能攜帶編輯者的個(gè)人偏好或主觀意愿影響,這會(huì)讓問卷有失統(tǒng)一性。

(5)重復(fù)性

盡可能的使問卷框架結(jié)構(gòu)能夠復(fù)用,一方面便于更多人可以研究驗(yàn)證,另一方面可以使得問卷本身價(jià)值最大化。

(6)可量化

對(duì)于問題的答復(fù)最好進(jìn)行量化處理,而不是單純的是或否,目的在于可使用高效的統(tǒng)計(jì)學(xué)方法來理解結(jié)果,或進(jìn)行對(duì)比,亦或是數(shù)據(jù)可視化體現(xiàn)更加精密的差異。

所以說開發(fā)或調(diào)整一套標(biāo)準(zhǔn)可用的度量問卷也是一門富有學(xué)問的技術(shù)活,并非簡(jiǎn)單問幾個(gè)問題這么簡(jiǎn)單。

2. 任務(wù)后評(píng)估問卷(ASQ)

也叫場(chǎng)景后問卷,一般在可用性測(cè)試完畢后進(jìn)行,它可以直觀的在任務(wù)難度、完成效率和幫助信息上獲取到測(cè)試者的直接反饋,主要就固定三道題目,答案采用5分制或7分制,所得分除以總分即可得到一個(gè)均分,該分值至少要大于0.6才能合格,要獲得大部分人滿意或認(rèn)可,則要高于0.7。

3. 系統(tǒng)可用性問卷(SUS)

SUS總共10題,奇數(shù)項(xiàng)是正面描述題,偶數(shù)項(xiàng)是反面描述題,答題采用奇數(shù)的5分制。SUS益于它正反向問題結(jié)合,以及具有泛應(yīng)用的可用性與易用性題型,在業(yè)內(nèi)具有大量應(yīng)用數(shù)據(jù)為基礎(chǔ),不論是客觀性、靈敏度、可量化還是信度都具有較高的水準(zhǔn),這也是SUS能夠成為可用性測(cè)試后問卷最主流的原因。

(1)SUS量化分?jǐn)?shù)計(jì)算

在SUS的相關(guān)創(chuàng)建者經(jīng)過對(duì)大批數(shù)據(jù)的研究,其中可用性部分量表信度為0.91,易學(xué)性部分可行度為0.7,為使得整體量表得分兼容在0~100的范圍,最終需要對(duì)可用性量表總分乘以3.125,易學(xué)性量表總分乘以12.5。而經(jīng)過長(zhǎng)期的應(yīng)用迭代,最終分?jǐn)?shù)的計(jì)算方式進(jìn)行了定格:

  1. 步驟一:所有奇數(shù)編號(hào)題目得分減一后相加;
  2. 步驟二:所有偶數(shù)編號(hào)題目得分由五減去后相加;
  3. 步驟三:將奇數(shù)項(xiàng)最終得分+偶數(shù)項(xiàng)最終得分后 乘以2.5 即最終SUS得分。

(2)分?jǐn)?shù)值概念

在經(jīng)過創(chuàng)建者的研究與沉淀,最終構(gòu)成了5層不同級(jí)別的評(píng)級(jí),A即最優(yōu)評(píng)價(jià),并且對(duì)應(yīng)0~100分,有趣的是5個(gè)評(píng)級(jí)并非是將100分平分,為了解釋評(píng)級(jí)與得分的強(qiáng)關(guān)聯(lián)性,創(chuàng)建者新增了第11題進(jìn)行整體而言的數(shù)據(jù)收集與分析,最終得到了以下圖中所對(duì)應(yīng)的關(guān)系。

如果說結(jié)果是“Good(C)”,那么對(duì)應(yīng)的平均分值則是“71.4”,如果說你的得分高于85.5分,那你的評(píng)級(jí)則處于“Excellent(B)”,這可能已經(jīng)意味著你的產(chǎn)品優(yōu)于絕大部分產(chǎn)品了。

4. 網(wǎng)站分析和測(cè)量表(WAMMI)

WAMMI的建立是為了專門量化網(wǎng)站產(chǎn)品的,該問卷一共20道問題,采用5分制回答,整體信度高于0.9,但是吸引力、可控性、效率、幫助性、易學(xué)性多個(gè)因子測(cè)試信度只在0.63~0.74,因此該問卷對(duì)測(cè)試樣本要求不少于30個(gè)。

若該產(chǎn)品屬于學(xué)術(shù)或?qū)I(yè)性較強(qiáng)類型,則樣本量不少于100個(gè),平均分值為50分,總分100分,但是也受樣本量影響,WAMMI很難在可用性測(cè)試場(chǎng)景后使用,不過它的問題可以在小型可用性測(cè)試中進(jìn)行應(yīng)用或自檢。

WAMMI官網(wǎng):http://www.wammi.com/index.html

5. APP用戶體驗(yàn)量表(SUPR-Qm)

作為一個(gè)APP用戶體驗(yàn)量表,涵蓋了更多的體驗(yàn)度量面,而不僅僅是衡量了可用性(比如SUS),并且可以在可用性測(cè)試期間或可用性測(cè)試之外進(jìn)行,也可以與其他問題混合使用以便于測(cè)量某些特殊產(chǎn)品(如游戲)的用戶體驗(yàn),同時(shí)它的信度也高達(dá)0.94,SUPR-Qm一共16道問題,采用傳統(tǒng)的5分制李克特反應(yīng)選項(xiàng)。

SUPR-Qm的16道題原本來至23個(gè)其他相關(guān)文獻(xiàn)中的題目和4個(gè)開放性的問題,經(jīng)過不斷測(cè)試驗(yàn)證和減少冗余后,留下的16個(gè)具有單維的、可靠的、有效的、兼容強(qiáng)的問題。

SUPR-Qm原博客說明:https://uxpajournal.org/supr-qm-measure-mobile-ux/

6. 關(guān)于測(cè)試結(jié)果匯報(bào)

有些同學(xué)一直不清楚可用性測(cè)試報(bào)告要寫些什么,有無固定格式,其實(shí)報(bào)告沒有什么特別的地方,簡(jiǎn)言之就是將測(cè)試的目的、測(cè)試過程、測(cè)試結(jié)果進(jìn)行整理匯報(bào)并反饋優(yōu)化意見而已。

其中大部分內(nèi)容沒有硬性的格式要求,看起清晰易懂是重點(diǎn),你可以是文檔匯報(bào)也可以是PPT匯報(bào),另外記得測(cè)試匯報(bào)講究真實(shí)性,可以把測(cè)試過程中的照片或截圖等放進(jìn)去用于佐證。

另外就是測(cè)試結(jié)果的歸檔,我們通常會(huì)借助表格的形式來呈現(xiàn),這樣能夠更好的將信息整合。

但是考慮報(bào)告輸出,不是一味的反饋負(fù)面問題或解決方案,同樣也可以反饋被用戶認(rèn)可的設(shè)計(jì),這也是測(cè)試的一種價(jià)值作用,能夠?yàn)楹罄m(xù)的優(yōu)化設(shè)計(jì)提供一定的方向指引與團(tuán)隊(duì)信心,所以我們將常見的測(cè)試結(jié)論歸檔表進(jìn)行了一些輕微的調(diào)整,補(bǔ)充了反饋的正負(fù)趨向,最終呈現(xiàn)如下:

九、關(guān)于用戶反饋的思考

用戶反饋本身就是用戶在使用產(chǎn)品的過程中遇到了問題,然后通過找客服或反饋入口所給予的反饋。

如果一個(gè)應(yīng)用的用戶忠誠度不高,即使你在應(yīng)用內(nèi)發(fā)布問卷收集反饋,用戶的參與也會(huì)很有限,反而是因?yàn)橐恍﹩栴}讓用戶受阻了才會(huì)產(chǎn)生一些寶貴的反饋,而讓用戶準(zhǔn)備和提交截圖憑證更是困難。

所以這個(gè)時(shí)候讓用戶反饋的入口更好找,對(duì)問題類型提供細(xì)分選項(xiàng),甚至對(duì)截圖等動(dòng)作做出一些預(yù)判都是不錯(cuò)的選擇。

以支付寶的使用場(chǎng)景為例,我們有時(shí)候截完圖是不是就馬上會(huì)收到彈窗提示是否遇到什么問題了?

這便是對(duì)用戶反饋的一種重視,如果你確實(shí)要準(zhǔn)備進(jìn)行反饋,那么你后續(xù)的操作步驟會(huì)少很多,使你更容易達(dá)成而不會(huì)因?yàn)榉爆嵉牟襟E而產(chǎn)生放棄的念頭,并且截圖時(shí)詢問的窗口也是極力克制不會(huì)產(chǎn)生過分的干擾。

這么說來你是否對(duì)用戶反饋這個(gè)功能有了新的看法,并有了給自家產(chǎn)品優(yōu)化一下的想法呢?

寫著寫著就又沒剎住車,又成了所謂的萬字干貨了。

不管你是從事什么職位,都希望你能夠有所收獲,即使你腦子里一靈光有了新的想法或不同意見都?xì)g迎來找我交流。

最后也感謝那些不厭其煩與我交流的用研大佬們,下次有想法了還來煩你們哈哈。都看了這么久了,點(diǎn)個(gè)贊收藏一下吧~

 

本文由 @泡泡 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 好文 ,煤人看啊

    來自江蘇 回復(fù)