解讀眼動的12個誤區
??????? 學術界和商界對眼球追蹤技術應用(以下簡稱眼動)的關注度,每隔一段時間便會出現一次高潮的討論。隨著技術的革新和推廣,越來越多的用戶研究行業人員開始在產品設計和研發過程中引入眼球追蹤技術,嘗試讀懂用戶眼中的產品和體驗。
但是由于對眼動技術認知的不足、信息的不對稱,導致對該研究方法的誤區不斷出現。本文將列舉一些用戶研究領域對眼動的誤區,并試圖解答正確的應用。
1? “先做個眼動,看看用戶在看什么?”
對眼動有所了解的人,通常會向研究員拋來這樣的問題。假如盲目地接下這樣的任務,不經過需求細分和策劃的眼動測試,最終所有人得到的也只是幾張漂亮的瀏覽軌跡圖和關注密度熱區圖。
試想當軟件界面需要做出大的調整時,用眼動來記錄“軟件的靜態設計稿”和“可點擊、有交互”的軟件demo稿時,用戶的關注點會有多大不同?在分析眼動結果時,不明確的測試目標會難以回答“應該這樣/可能是這樣”的問題。通常不明顯的結論,又要引發新一輪附加的測試任務。在理解和溝通測試前,就應該明確測試的目的、希望通過眼動配合數據解答的問題。
每個任務有明確的測試開始、完成節點,使結果易于分析和對比,才是眼動數據的意義所在。
2 “眼動就是熱區圖和軌跡圖?!?/h2>
Nielsen在06年發現人們瀏覽網頁時有字母“F”型的閱讀習慣。這個F型的熱區圖在很多場合都被引用,但很少有深究熱區是基于用戶的眼睛停留次數、停留時間,在什么時間范圍內生成的呢?用戶瀏覽習慣是否會因為網站結構和時間的變化,而不是呈現F型呢?通常閱讀報告中眼動數據的人,也常常會說“我要一張關于xxx的熱區圖”,而不去考慮背后的各種限制因素。同樣的不幸也會降臨在“軌跡圖”身上。
眼動熱區圖
按關注點次數???????????????????????????????????????????????????????? 按關注時間長度
這并不能怪讀報告的人,只因為通常為了更直觀的理解和展現結果,報告中常會出現這兩種圖。實際上,每一個項目都可以從不同的側面和角度來分析、闡述用戶的認知行為,而每一種角度和衡量指標都會帶來對用戶瀏覽和認知行為的理解。因此,配合恰當眼動指標的熱區圖/軌跡圖更容易讓讀者把握問題之所在。
3?“眼動的紅點就是人們看的確切位置?!?/h2>
無論是查看眼動視頻還是軌跡圖時,有人會以為紅點/十字點100%就是用戶看到的地方。實際情況并非全是這樣。
首先,目前常見的商用非接觸式眼動儀的數據采樣率并沒有我們想像的那么高,所以顯示出的注視點可能會與用戶實際看到的點有些偏差。而且,當用戶在測試過程中變換了相對屏幕的位置,記錄眼動數據的攝像頭就非常有可能“記偏了”用戶的眼動情況。當數據疊加在測試素材上時,就會發生眼動軌跡的“漂移”。
(眼動軌跡漂移:軌跡顯示讀者正在閱讀文字,但區域不符。)
其次,大體上人眼的視覺分為高清晰度的視覺區(中央窩視覺:foveal vision)和低清晰度視覺區(邊緣視覺:peripheral vision)。而對應在屏幕上的高清晰度區域,通常大于紅點顯示出來的關注點(fixation)。
例如,當我們看電腦屏幕的時,可見的高清區域差不多有兩個指甲蓋那么大。
人眼在看較熟悉或較大的物體時,依然可以注意到較為模糊的影像區域(parafoveal& peripheral vision)。
如下圖所示,盡管用戶沒有直接看廣告中的相機和皮包,但是用戶注意到相機和皮包的的可能性很高。
因此,我們不能說用戶人們沒有看到什么,而只能說他們沒有直接看到什么東西上去。
4? “眼動數據很容易解釋。”
“我想知道用戶會看什么地方”——經常聽到的這句話一般會成為研究目的。
說這句話的人好像心里十分清楚一個情況:假如我知道用戶在看什么,那我就知道這個東西怎么改了。實際上最終當我們把瀏覽順序、用戶看的熱區圖拿出來之后,有時候可能我們自己也懵住了。某些地方熱區圖很紅,就說明用戶很喜歡看這個地方嗎?還是說這個地方用戶根本沒有看懂是什么意思?
看到眼動結果后,對方可能會問:
“那又怎么樣呢?”
“基于眼動的結果,你有什么修改的建議?”
……
其實,眼動只能回答你“看了什么”,卻不能告訴“為什么看了”。
舉個例子:從一款App橫、豎版的眼動熱區圖分布來看,橫版設計中紅色的區域較多,用戶似乎更青睞橫版。僅憑眼動數據很難解釋清楚。測試內容的影響、用戶個人瀏覽習慣等因素,可能會導致用戶看橫版更多,也有可能是用戶在橫版中需要花費更多時間來提取信息。
單憑眼動的數據,很難作出合理和全面的解釋。
5? “所有的可用性測試都能從眼動中受益。”
一種對眼動的常見理解是:如果可用性測試加上眼動的話,效果和結果會更利于找出問題。但從每個項目所擁有的時間和人力資源上看,眼動測試在后期分析中會占用過多成本進行區域劃分、場景切片分析等工作,而最后得出的結論可能僅僅是瀏覽軌跡和關注度,更多的具體原因仍需要深度訪問才能得知。相比之下,傳統的可用性測試這種低成本-高效率的分析顯得更適宜。
在正式的可用性測試中,眼動數據帶來的結論在整體結論中的占比會較小。以網站測試為例,如果想知道網頁的某個功能入口用戶是否會注意,而進入更多的網站后用戶對網站的整體影響如何,指示性的文字是否容易理解。在這種情況下,眼動只能告訴你他/她看過,但具體的理解無法從眼動數據中解讀,這時眼動的價值就顯得較低。
相比之下,眼動更適合解答傳統可用性測試中無法解釋的具體疑問。(比如在確認在線支付前,用戶在這個頁面上糾結什么)倘若后臺數據顯示某些鏈接的點擊率和頁面跳出率很高,眼動可以告訴你用戶真正在找什么。
6? “學會操作就可以做眼動測試。”
目前市場上各類眼動儀在功能上大同小異,最終可供的分析數據也相差不大。看起來只要學會了眼動測試的操作,從大家都用的角度來分析就可以做眼動了。但是,會使用眼動儀并不意味著你就可以做眼動了。有效的眼動數據才是研究的前提,而這不僅僅是點兩下鼠標就能完成了。
大至人眼工作的模式、視覺認知和信息加工的過程、研究方法論、數據眼動的處理和統計等,小至項目的流程設計、分析的參數、甚至提示語的修改等都需要提前心中有數。等眼動項目結束后,才能從整體上看到熱區圖、軌跡圖以及看似毫無規律的眼動數據結合起來,發現用戶的瀏覽習慣和產品的問題。
7? “眼動就是等用戶看完后分析數據。”
通常在眼動研究項目過程中,用戶研究員在旁邊觀察、記錄,同時防止測試過程中各種風險(程序意外退出、電腦死機等)的出現。測試開始后,研究員的工作似乎就變成了看稀奇一樣查看用戶瀏覽時眼睛的關注點、移動軌跡等情況,直至測試順利結束。
用戶眼動的情況是實時展現給研究員/產品相關同事的,所以大家腦海中會隨時出現諸如此類的問題:
“哦,她/他原來是這樣看的??!”
“ 怪不得這里沒有去點擊……”。
若不及時進行有效地記錄,或根本不知道應該記些什么的話,則會錯失用戶的操作習慣和犯錯緣由。事后再看眼動數據時也無從解釋。
這類通過對用戶眼動軌跡的發現和疑惑,應當立即記錄下來,待測試結束后針對用戶瀏覽時的表現,詢問用戶的理解和操作行為。有需要時,播放眼動的軌跡錄像讓用戶重溫操作場景,借助有聲思維(think alound)反饋問題。這種方式通常會暴露問題的根源、挖掘到用戶的真實需求。
總而言之,不要讓用戶帶著疑問離開了你的眼動測試項目。
8 “眼動可以通過看軌跡視頻來分析。”
在提倡敏捷用研的節奏下,快速從測試中輸出結論是眼動價值所在。而最快的方法是在測試中實時觀看用戶的眼動軌跡,或測試后回放眼動軌跡的錄像。有人認為不需要做正式的分析,通過看視頻也可以得出眼動的結論,同時配上幾張熱區圖便能解釋用戶的瀏覽習慣。
然而,我們的眼球每秒進行多次的注視,每分鐘可以產生200-300個眼動的數據點。僅僅通過看眼動視頻,單憑我們的記憶是無法記住和處理這么大的數據量。就更不用說看眼動軌跡的視頻來分析用戶習慣(個體/人群)和眼動數據了。更糟糕的是,我們可能會帶著個人的偏好來看視頻。因為我們已經知道項目研究的目的,所以可能會過分強調用戶瀏覽的順序、在興趣區域上停留的時間等等。
注:視頻中反映了用戶眼動注視點的變化情況,但實際上產生的眼動數據會多于視頻中的注視點。
????????? ?
(眼動軌跡視頻)??????????????????????????????????? (眼動軌跡可視化數據)
眼動軌跡視頻適用于結論例證,而非數據分析。
9??“所有的眼動測試都可以通用一個樣本量。”
“30!30就夠了。”
我們常聽別人說眼動測試不需要很多人,30個樣本量就可以了。這似乎已成為眼動的標準樣本量。其實眼動的樣本量取決于測試的目的和實驗的設計,30并非全部適用于所有的測試。
在決定眼動測試的樣本量前,研究員心里應該清楚“我是要通過眼動來了解一個“總體情況”還是“比較不同設計之間的差異”。如果有不同的設計方案,希望通過眼動來生成一個“總體情況”的話:比較被試組內差異(within-subjects),30樣本就夠了;比較被試組間差異(between-subjects),這時眼動結果很容易受到個體差異的影響,30樣本很顯然已經不夠了。
假如想配合眼動找出產品可用性方面的問題,8-10個樣本已經可以發現70-80%的問題。而此時30個樣本的眼動數據足以說明可用性方面的問題了。
10??“眼動數據分析參數的適用于所有案例。”
常見的眼動報告中,總少不了用戶視線的瀏覽軌跡、停留時間等方面的比較,似乎眼動的價值在這里就畫上句號了。分析數據時,我們容易受到其他案例分析角度的影響,導致最終的分析更像是一份眼動數據報表。除了自己,沒人能從中讀懂用戶的瀏覽習慣和其中反映的問題。數據分析取決于你想透過哪些眼動相關的數據,來佐證可用性的問題、不同設計之間的瀏覽差異等。因此并非用了一些別人通用的分析參數,就可以有效地說明問題。
從常見的停留時間、視線訪問次數、視線軌跡等,到較少使用的瞳孔大小、眼球運動速度、掃視路徑等參數,豐富的眼動指標使得描述用戶瀏覽行為維度具有時空的立體性。配合定性和定量數據分析,會讓你的眼動結果更容易理解,也能更真實的還原用戶的認知和操作行為。
比如讓用戶完成“在訂票頁面上購買一張機票”的任務。
時間上: 訂票頁面的注意力的時間分布(注視時長、注視次數、首次注視時長等);
空間上: 最吸引用戶注意力的區域(興趣區域上的時間和空間分布、首次注視區域、視線訪問區域和次數等)、訂票過程中的瀏覽軌跡等;
信息檢索效率:總體的注視次數(次數越低,效率越高)
決策效率:首次注視到首次鼠標點擊的時耗
內容布局:訂票相關的信息和功能區之間眼跳次數、瀏覽順序
任務的成功率、完成率、完成時耗、滿意度等。
通過上面的一個小例子嘗試說明,沒有一套公式化的參數供所有的項目分析。
真正重要的是,你希望通過眼動數據向觀眾講述一個怎樣的故事,基于此來選擇合適的數據進行分析。
獨立存在的眼動數據不具有說服力。
11? “所有人的眼動數據都可以拿來分析?!?/h2>
通常在大樣本數據中需要清洗一部分不符合邏輯/數據缺失的樣本,而一般小樣本的眼動測試,人們容易忽視測試過程中眼動數據采集的質量。最常見的數據質量問題是由于個體差異導致的——測試時眼睛位置的偏差、攝像頭沒有很好的記錄眼動數據、個人原因導致看了很長時間等情況。個別用戶不正常的眼動數據(與其他用戶平均眼動數據有顯著差異)、眼動數據采樣率較低的數據也應考慮清洗掉。
如果僅僅從數字上,很難判斷這些“問題數據”的產生原因。也許是因為用戶的眼球運動沒有被捕捉到,也許只是用戶的個人習慣,還有可能是用戶在測試時忘記了當時的任務。配合眼動軌跡的回放錄像 ,我們可以確定這些數據是否應該從總體樣本中去除。在數據分析時,這些質量較差的數據會造成瀏覽行為的錯誤解讀。
12??“眼動結果的可視化結果是可靠的?!?/h2>
熱區圖/軌跡圖已成為眼動數據可視化的一種標準輸出形式,人們甚至會認為沒有看到這種圖的話,就不算是一個眼動分析。眼動數據的可視化使人們即使沒有相關知識,也能很快速地了解用戶關注點和瀏覽次序。
眼動軌跡圖
自由瀏覽網頁的眼動軌跡????????????????????????????????????????????????????? 在網頁上查找特定信息的眼動軌跡
通常我們看到這些可視化結果時,較少會考慮到這是什么情況下生成的圖片。同一個網頁,讓用戶自由瀏覽和找一個感興趣的新聞,最終得到的眼動結果會截然不同。在適當的情景下產生的數據和眼動結果才會有意義。
所以當下次看到熱區圖/其他形式的眼動可視化結論時,要記得問清楚是在什么時間范圍內、做什么事情時的眼動結果。
作者:騰訊CDC
- 目前還沒評論,等你發揮!