淺析用戶體驗數據化

0 評論 24674 瀏覽 130 收藏 14 分鐘

本文將介紹用戶體驗數據化的思路和方法,包含當前對于用戶體驗描述的兩種方式,用戶問卷的項目設計原則,及以實際例子——系統可用性量表(SUS)分析其設計邏輯和應用價值。

用戶體驗無疑是對當下以用戶為核心,產品設計重要組成,例如智能產品開發,服務設計等內容。但客觀上,用戶體驗是反映用戶主觀感受的內容。因此,產品經理等研究人員對其的判斷也多基于自我認識,無法重復驗證。產品設計也就變成了類似賭博式的投資,為了避免這種情況,全世界都在研究如何將用戶體驗數據化,客觀化的方法。作為產品抉擇者,深入了解這些最前沿的方法,思維是至關重要的。

一. 兩種描述用戶體驗的方式

進行用戶體驗度量的第一步無疑是“如何描述用戶體驗”,我們需要將用戶體驗的衡量轉化為具體的問題和語言。

例如“對于一個咖啡店的用戶體驗”,我們可以將其分解成幾個維度,例如:便捷感受,休息感受,咖啡感受等等。由此衍生的內容可以進行具體化,包括客觀的觀察和主觀的報告。比如可以同時測量用戶在購買一杯咖啡上所花費的時間和用戶主觀上認為的便捷程度,在比如在休息感受維度,可以客觀上的測量用戶在咖啡館里所待的時間,也可以進行主觀評測等等。一般的用戶體驗度量,由于其具有非常強烈的主觀性(本身研究的就是用戶的感受和想法),因此在測量時常常會采用客觀+主觀的方式進行收集。

需要注意,在很多時候,我們并不清楚有哪些體驗維度可以進行測試(如上述例子中的便捷感受,休息感受,咖啡品質的感受等)。

如何解決這個難關?就需要研究人員或者設計師對于這個行業有一個了解。同時也需要理解,這些預設的作用,是為了加強數據之間的關聯性從而讀懂數據。

在數據收集過程中,我們最最核心的是去客觀的描述用戶感受,甚至可以暫時將其維度,因果關系等已經存在我們腦海中的定式拋棄,來進行純粹的描述這些用戶行為(感知)。至于分析與界定的部分,我們留在數據挖掘與處理部分即可。

“預設”的好處在于,用戶體驗度量將會有一個明確的方向,容易暴露問題,迭代產品,因此常常被用于改進式的設計,例如App的迭代,空調的迭代等。相反的,沒有預設的,純粹描述行為的數據收集,則能夠很好的打破思維定式,從數據本身中獲得用戶期待和用戶行為等關鍵等,給產品開發,改革進行參考,比如第一輛純電動汽車,第一款智能手機等。再開展用戶體驗度量之前也需要明確整個項目目標是什么,從而決策合適的方法。

二. 用戶體驗問題設計原則

關于問題的設置有許多技巧,詳細的可以參考戴力農老師的《設計調研》。我在這里列出三個最主要的原則。

1. 避免答案誘導

例如問:“是否喜歡這款產品?”這樣子對于一般的無感覺用戶,這個問題常常會產生“喜歡”這種答案,而一般采用的方式是“您對這款產品的態度是?A.喜歡 B.一般 C.討厭”。需要考慮不同情況下,問題本身對于用戶的思考方式影響。這是度量客觀性的第一保證。

2. 完備性

依據問卷性質,可以進行問題的設計,從粗略到詳細,從ABC到百分比,從評級到打分。但不變得是,讓用戶的直覺反應能夠在提供的選項中得到安放之處,而盡量避免糾結。以我之見,應當首先滿足完全性,在再這個基礎上增加直觀性。例如在一般是否命題總,常常會采用三級“-1,0,1”表示“否,不知道,是”?!爸庇^性”的需求是非??简災芰Φ摹Q芯咳藛T需要預先設想盡量全面的用戶反映來進行措辭,又需要避免誘導。

3. 可數據化

最后一個原則是可以進行數據化,從而進行之后的數據運算。無論是客觀指標例如,溫度,濕度還是主觀評測,例如便捷感受,滿意感受等。都需要進行在數據上的轉換。雖然想本身就是數據的指標可以直接帶入計算,但這并不是越精確越好。承建上面咖啡館的例子,我們需要調查咖啡館溫度與體驗的關系。在獲得準確的溫度之后,由于人的溫度感受是非常模糊的,只有數個感受:“熱,較熱,舒適,較冷,冷”。依據人體感受區間直接進行轉化是可取的。一方面是減低之后數據處理的難度(降維),另一方面這些數據與主觀感受更為匹配,因此得到的結果更為準確。另一方面,對于開放性問題,例如?!敖ㄗh類”問題,就不適合作為用戶體驗測量的數據收集。

當然,不可否認,這些回答中包含著許多寶貴的信息,但這為之后的數據處理帶來了很大難度,當前對于這類問題僅有依賴研究者本身的素質,而無法進行重復性驗證,也就是不客觀的反饋。因此在這里被剝離。幸運的是,現階段隨著自然語言處理等機器學習技術的發展,通過“關鍵詞”“情感化”等方式給可充分的想象力,有興趣的同學可以研究一下。

在滿足以上三個原則之后,只能算是可以開展用戶研究了。落到更具體處,還需要考慮人員構成,區域因素等等。這里就不再過多闡述。

三. 體驗量表范例:系統可用性量表(SUS)

相比較介紹系統可用性量表而言,其設計思路和驗證為什么這個量表的可行性更為重要。在理解了其設計方式之后,或許就能夠突破原先的應用領域如“應用迭代,網頁迭代等”而進入到更為廣泛的領域。


SUS是在評估系統或產品感知可用性時最廣泛的工具之一。他最初是由John Brooke在1986年編制的,它包括10個陳述句,用戶需要對于他們同意這些句子的程度進行評分。其中一半的項目是正向敘述,另一半是負向敘述,每個句子都使用5點同意標度,并給出了一個方法把10個評分合成到一個總分上(之后我會詳細探討降維方法)。

SUS計算方法

首先需要把各個項目的分數加起來,每一個項目的得分在0到4之間。項目1,3,5,7,9(正向描述)的得分是x-1(x為用戶評分),項目2,4,6,8,10(負向描述)的得分是5-x(x為用戶評分)。然后把總分乘以 2.5(為什么是2.5?將在下面介紹) ,就得到一個總的SUS分數T,區間在0~100之間。T則表示在這項產品上100為完美的產品體驗,T為T%的產品體驗。

需要注意這是一個相對概念。分數高并不能說明你的產品在市場競爭中一定優秀。針對不同的領域T值分布不同。一般需要進行多種產品SUS分析才能確定其市場地位,也就是有效的。同時,兩者的SUS差并不能具有絕對價值,例如65與67的SUS,差值2是無意義的。但是閾之間的比較是有價值的看到網上某些文章將其當成了絕對概念,特此說明。但基于前輩們的大量研究-(Tullis,2008;Bangor,Kortum,Miller.2009)在調查了129個SUS研究,得到以下結論:

  • ?SUS < 50: 不可接受
  • 50~70:臨界值
  • >70:可接受

為什么是2.5?

我第一次接觸的SUS的時候就有一個問題,為什么是2.5?不能是其他數字?實際上,其他數字也完全可以,只要不是0。2.5是為了讓最高評分(10*4)轉化成100的百分比。表示最完美數值,這并不是關鍵,最差評分(10*0*2.5)轉化為0。理論上所有的產品分數將完全的在這一條0到100的軸上展現,從而進行產品之間的決策。如果是3,也沒有關系,只是說明完美值是120。這里是最簡單的降維思想,各個項目對于SUS分數的貢獻值是相等的,沒有層次之分。因此這也只能算是一種非常簡單的度量方法。之后,出現了多維度的度量方法,賦予不同項目已不同的貢獻值,從而進行更準確的度量。

e.g :SUS1=65 與 SUS2=70 之間的關系是非常曖昧的,我們不能夠決斷SUS1產品就比SUS2產品劣。但是對于40和80的產品基本誰好誰壞是馬上能夠判斷的

為什么采用正向敘述與反向敘述?

這個設計的初衷是為了保證數據客觀性。多數人認為是為了能夠使參加這“保持警覺”。但是也有聲音表示,這樣的混雜描述會讓用戶產生困惑,導致錯誤回答比例增加。后來有學者對于全正向描述,和原先方式進行比較27份數據集,得到有編寫錯誤(制作人員)的SUS數據占比11%,用戶填錯的SUS數據占13%,但兩者的差異性不大。因此,比較建議使用全正向的描述方式。由此可見,項目的語句設計是多么難做。這類的趣事在實際的用戶體驗領域舉不勝舉。大家自己去找吧。

SUS拓展

在后來的研究中,人們發現SUS實際上有兩個因子(維度)可用性因子項目1,2,3,6,7,8,9;與易學性因子(維度)-項目4,10。進行某一維度上進行類似的處理,例如可用性指標上乘以3.125得到了可用性比例,在易學性上乘以12.5就得到了易學性比例,就可以比較簡單的畫出雷達圖來進行多因子之間的比較。

后記

除了SUS之外,還有許多量表,例如likert量表等等,這類資源很多,但是也只停留在比較粗淺的層面上,如果需要更深入的研究下去,比如,有哪些維度可以進行比較?如何賦予差值意義?等等這些問題,就需要更高級的數據處理方法,而這些內容無疑是對與當下智能產品開發,服務設計等等,以用戶為核心產品設計的巨大支持。我也將在之后幾篇文章中介紹一些數據處理算法。

 

本文由 @kieran?原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pexels,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!