7個步驟,幫助設(shè)計師做好用戶測試
在產(chǎn)品開發(fā)之前,用戶測試必不可少,這能幫助設(shè)計師更早發(fā)現(xiàn)問題。而其中需要注意的細(xì)節(jié)也很多,文章針對用戶測試的一些流程以及相關(guān)的注意事項進(jìn)行了總結(jié)梳理,希望對大家有所幫助。
在開發(fā)前的設(shè)計階段就進(jìn)行用戶測試,能夠更早發(fā)現(xiàn)問題、降低開發(fā)試錯成本??蛇@一方法對于國內(nèi)的互聯(lián)網(wǎng)行業(yè)來說還比較陌生。
我之前整理過一套產(chǎn)品設(shè)計流程,在這個流程里,用戶測試就是相當(dāng)重要的一環(huán)。
雖然很多人對用戶測試比較陌生,害怕嘗試,但我認(rèn)為用戶測試不論是從可行性、實用性還是效率性上,都是很高的。唯一的缺點就是,它有一定的認(rèn)知和學(xué)習(xí)成本。然而一旦了解入門了,你會發(fā)現(xiàn)用戶測試是一種高效科學(xué)提升產(chǎn)品體驗的利器。
設(shè)計師做用戶測試有什么好處?
有人可能會質(zhì)疑,設(shè)計師學(xué)會利用設(shè)計理念出方案就好了,測試不是用研的專業(yè)領(lǐng)域嗎?
我覺得這樣的認(rèn)知是錯誤甚至危險的。
首先,依賴設(shè)計理念做設(shè)計是非常不靠譜的。因為很多設(shè)計理念沒有一個量化標(biāo)準(zhǔn),而且很有可能必須在某種特定的條件下才能生效。例如,“少即是多”要少到多少才合適沒有明確、“情感化設(shè)計”要有多少情感才行、“以人為本”的與商業(yè)化的平衡是什么……
這樣的設(shè)計方法,就好比共產(chǎn)主義的口號,在特定的時候看起來也許很美好,但是如果把握不好輕重,可能一邊把自己推入深淵還一邊自我感覺良好。
如果說團(tuán)隊里的用研能夠承擔(dān)用戶測試的職責(zé),那當(dāng)然好。但以我的了解,很多公司的用研主要為業(yè)務(wù)做調(diào)研,實際工作更像是市場調(diào)研。為老板做報告PPT已經(jīng)夠忙了,他們沒有時間精力顧也沒有理由顧及到產(chǎn)品體驗甚至是設(shè)計方案的優(yōu)化。
而設(shè)計師能直接利用測試結(jié)果,為設(shè)計方案增加實質(zhì)性的依據(jù),無論是面子上還是里子上,都是有利的。
尤其對于需要較多匯報和論證的ToB業(yè)務(wù)來說,用戶測試的效果更加顯著。我的實際經(jīng)驗告訴我,要搞定甲方領(lǐng)導(dǎo),用戶測試遠(yuǎn)比設(shè)計理念有效得多。因為哪怕是對互聯(lián)網(wǎng)和設(shè)計一竅不通的門外漢也知道,產(chǎn)品好用與否,用戶才是最有發(fā)言權(quán)的。
體驗評測流程
用戶測試是一個很寬泛的概念,涵蓋的方式方法非常多,很多我都有實踐或研究過。文章末尾我會告訴你哪里可以看到這些用戶測試。
例如:眼動實驗看似高大上實際上不但成本高而且很難讓用戶在自然的情景下做測試、 Think Aloud 雖然能夠發(fā)現(xiàn)很多細(xì)節(jié)問題但是用戶教育成本過高而且很難把握好平衡;Focusing Group 看似省時省力其實很難把聽到用戶的真實聲音;用戶參與設(shè)計耗時耗力還一不小心就被帶節(jié)奏走偏了…
也許是因為自己的理科底子,我對用戶數(shù)據(jù)說話的用戶測試很感興趣。這些年來大大小小做了十幾二十次,被我?guī)又黄饏⑴c進(jìn)來的設(shè)計師至少也有兩三百人。期間我也和小伙伴們輸出了一些體驗評測報告,文末我會告訴你在哪里可以看到。
每做一次我都會總結(jié)問題、優(yōu)化方法,直到現(xiàn)在終于整理出了一套適合產(chǎn)品設(shè)計者、較為通用、簡明高效的體驗評測方法:
1. 制定目標(biāo)
沒有什么事情能夠一蹴而就,用戶測試也是需要根據(jù)實際情況制定目標(biāo)范圍的。這個目標(biāo)范圍可以是一個功能列表,即評測產(chǎn)品的主要功能或本次迭代的主要功能等。
例如一款快餐外賣小程序的目標(biāo)范圍可能是:
- 瀏覽和搜索菜單
- 收藏和查看
- 優(yōu)惠券查看和使用
- 選擇地址
- 選擇口味
- 點餐和支付
除非做得很細(xì),否則不需要很復(fù)雜,就是圈一下幾個功能就好。
2. 編寫任務(wù)
你需要寫一個任務(wù)列表給測試用戶,讓他們看著這個任務(wù)列表使用產(chǎn)品,不需自由發(fā)揮和現(xiàn)場詢問,就能夠把目標(biāo)范圍里的功能統(tǒng)統(tǒng)使用一遍。
例如上面那個測試目標(biāo)的任務(wù)列表可能是:
- 在菜單中找到任意一款帶飲料的套餐并收藏
- 搜索米飯并添加到購物車
- 在收藏列表找到套餐
- 使用新人優(yōu)惠券購買收藏的套餐和米飯
- 送到現(xiàn)場,口味選擇不辣
- 支付
這個任務(wù)列表要簡短到讓用戶一眼看懂,明確到不需要用戶現(xiàn)場提問,但又覆蓋了目標(biāo)范圍內(nèi)所有的功能。
3. 編寫問卷
任何形式的用戶測試和訪談都最好附上一份問卷,一方面是記錄備案,另一方面也是從用戶那里獲取觀點想法的機(jī)會。
對于如何做問卷,誰也無法給出一個標(biāo)準(zhǔn)答案,因為這就是一個具體情況具體分析的東西。不過我這里有一個從HCI教授那里得來的框架,還比較通用:
- 基本信息:如:年齡、性別、職業(yè)…
- 行為:有沒有用過產(chǎn)品、使用頻率、相關(guān)日常行為和生活習(xí)慣。如:是否使用過評測產(chǎn)品、點外賣的頻率是多少、喜歡什么類型的快餐食物、能接受的價位是什么…
- 動力:是否愿意/不愿意使用評測產(chǎn)品、理由有哪些。如:愿意使用外賣平臺還是餐館小程序、怎樣的優(yōu)惠福利會有吸引力…
- 態(tài)度:對評測產(chǎn)品和相關(guān)事物的喜好和印象。如:對餐館的印象、對快餐的喜好…
- 技能:使用產(chǎn)品和設(shè)備的熟練程度。如:使用手機(jī)點餐頻率有多高…
- 資質(zhì):學(xué)習(xí)能力或?qū)W歷認(rèn)證。如:最高學(xué)歷是…
對于定量問題,為了方便統(tǒng)計,一般會固定分為五個/七個等級,例如:
- 特別不喜歡
- 不喜歡
- 一般
- 喜歡
- 特別喜歡
4. 招募用戶
很多公司不愿意做線下用戶測試是因為覺得需要的人太多,成本太高。其實體驗評測采用心理學(xué)研究方法,講究質(zhì)量和深度,并不像大數(shù)據(jù)那樣無法確保質(zhì)量只能靠數(shù)量來湊。
尼爾森在2000年經(jīng)過試驗表明,只需要5名用戶就能發(fā)現(xiàn)80%的可用性問題,而真正重要的問題通常已經(jīng)包含在這八成之內(nèi),剩下的二成問題一般都不會特別重要。這對于很多小版本迭代來說,已經(jīng)足夠了:
對于大部分輕量產(chǎn)品的小版本迭代來說,五名用戶已經(jīng)足夠。再復(fù)雜的,一般也不會超過十多二十個。
招募的用戶當(dāng)然最好是符合產(chǎn)品目標(biāo)人群的,尤其是對需要正式匯報的項目而言。畢竟精準(zhǔn)用戶的某些特別需求和認(rèn)知想法會不太一樣。
但是這并不代表隨便招攬用戶就不OK。像那種在街上隨機(jī)找人的走廊測試,也照樣能發(fā)現(xiàn)不少對設(shè)計有幫助的問題,因為很多可用性問題都是諸如找不到XX按鈕、缺少XX功能之類的“通俗”問題。
5. 進(jìn)行測試
招募到用戶后,你可以把他們約到同一天,一個一個單獨見面測試。測試至少需要一名記錄員全程引導(dǎo)和觀察,需要做的事情有:
- 引導(dǎo)用戶完成任務(wù)(可以錄屏/錄影)
- 記錄任務(wù)完成情況(成功/失?。?/li>
- 記錄下所有用戶發(fā)生的可用性問題
- 引導(dǎo)用戶完成問卷
可用性問題可能有人不太理解,這里給出一些范例:
- 找不到搜索功能
- 點擊收藏圖標(biāo)后沒有反應(yīng),不確定是否收藏成功
- 難以找到口味選項
- 默認(rèn)定位不準(zhǔn),必須手動搜索
- 加載速度太慢,用戶喪失耐心
- …
記錄問題的學(xué)問大了,很多細(xì)節(jié)需要實踐才知道,這里稍微給一些提醒:
- 記錄員避免與用戶交談,哪怕必須對話,也要避免給出任何引導(dǎo)性的指示。
- 不要漏掉關(guān)鍵信息,例如“沒找到入口”可以改成“沒找到優(yōu)惠券入口”。
- 記錄問題而不是給出修改建議,例如“說明顏色應(yīng)該深一些”可以改成“用戶沒看清說明文字,顏色太淺”。因為一個問題的解決方案非常多,記錄員應(yīng)該把問題如實寫下,后面可能和團(tuán)隊一起思考解決方案。
- 記錄事實結(jié)果而不是猜測原因,例如“菜單信息太過繁瑣”可以改成“難以理解菜單信息”。因為記錄員的猜測也未必準(zhǔn)確,很有可能對其它查看記錄的人造成誤導(dǎo)。
- 用戶在任務(wù)之外的使用過程中遇到問題也可以記錄下來
為了方便整理,可以使用統(tǒng)一的模板。下圖是我做的這個模板,在文末會有下載方式:
6. 統(tǒng)計分析
等測試完所有用戶后,需要把記錄寫入電子表格。
下面這個任務(wù)統(tǒng)計表是我的做的,在文末會有下載方式:
分類其實不是特別重要,從實用角度來,如果不是特別正式的報告看不做也OK。如果要做的話,可以使用已有的分類標(biāo)準(zhǔn)或者根據(jù)具體情況自創(chuàng)分類標(biāo)準(zhǔn)。已有的分類標(biāo)準(zhǔn)中,比較常用的是啟發(fā)式評估法:
- 系統(tǒng)狀狀態(tài)可見
- 系統(tǒng)與用戶現(xiàn)實世界的匹配
- 用戶控制與自由
- 一致性與標(biāo)準(zhǔn)化
- 錯誤預(yù)防
- 認(rèn)知而不是記憶
- 使用的靈活性與效率
- 美觀而精煉的設(shè)計
- 幫助用戶識別、診斷和修正錯誤
- 幫助和文檔
分級才是最關(guān)鍵的,因為它可以幫助我們梳理出產(chǎn)品的主要問題,為方案優(yōu)化和迭代改版提供數(shù)據(jù)依據(jù)。問題分級的標(biāo)準(zhǔn)有很多,你也可以指定自己的標(biāo)準(zhǔn)。我自己用的比較多的是 Jeff Rubin 可用性評級:
- 四級、無法使用產(chǎn)品的某一部分
- 三級、難以完整使用產(chǎn)品的某一部分
- 二級、大部分情況下能夠使用,但需要付出較大努力
- 一級、偶爾發(fā)生且容易解決,或者問題并不在產(chǎn)品的主要功能上
- 零級、不是可用性問題
可以有多個人一起來評級,取平均數(shù)作為最后的評分。不過也沒有必要太過糾結(jié),問題評級一定是一個有些主觀的東西,小爭議難免,但是真正的大問題通常不會變成小問題,真正的小問題也不會變成大問題。
用戶問卷的信息也是可以統(tǒng)計出來的做成圖表的。如果用問卷網(wǎng)站來做調(diào)查,這些都可以自動生成,就不是示范了。
7. 優(yōu)化設(shè)計
當(dāng)你把任務(wù)、問題和問卷三張統(tǒng)計表整理出來后,就可以進(jìn)入下一階段了。
- 任務(wù)統(tǒng)計表是用戶測試的硬指標(biāo),任務(wù)完成率低證明用戶體驗對業(yè)務(wù)轉(zhuǎn)化率造成了直接影響,解決相關(guān)問題迫在眉睫。
- 問題統(tǒng)計表是用戶測試的主要指標(biāo),可以通過問題評級或加權(quán)問題評級(評級×發(fā)生率)排序,來看看設(shè)計方案有哪些重要的體驗問題需要解決。
- 問卷統(tǒng)計表是用戶測試的基本參數(shù),例如通過分析問卷統(tǒng)計表,可能發(fā)現(xiàn)某些問題可能只有某類人群會發(fā)生,那么就可以綜合考慮是否需要投入成本為這類人群修改設(shè)計方案。
有了這些指標(biāo)和參數(shù),你也就對設(shè)計方案的用戶體驗心里有底了,接下來趕快去改稿子吧。
改了之后可以再測一下,不行再改,循環(huán)往復(fù)直到?jīng)]有大問題為止。
作者:Z Yuhan,一名前華為騰訊交互設(shè)計,在英國學(xué)習(xí)了人機(jī)交互,樂意帶你由淺入深了解產(chǎn)品體驗;更多的閱讀和資料,請關(guān)注我的公眾號:體驗進(jìn)階。
本文由 @Z Yuhan 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
學(xué)到了,很干貨
受教了!