如何創建用戶模型:問卷調查與數據分析
很想寫一些東西來總結總結自己的工作,可惜工作太忙一直也沒顧得上來寫。最近閑來想和大家討論討論關于創建用戶模型的事情。
一、用戶模型的建立與問卷數據的采集
Persona:(Persona是用戶模型的的簡稱)是虛構出的一個用戶用來代表一個用戶群。一個persona可以比任何一個真實的個體都更有代表性。
首先,用戶模型是對用戶的一種劃分,是將一個類的概念轉化成為一個角色。這里舉一個簡單的例子:電影里有很多角色,但是生活中有和電影中一模一樣的角色么?顯然是很少的,除非遇到極品。電影中人物的角色是集合了廣大角色的共性而產生的角色代表,代表的是一類人或是一個群體。
用戶是大量混雜的,我們需要將用戶按照角色分開來確定不同角色的偏好與場景的結合,這才是建立persona體系的主要目的。
下面具體講講建立Persona體系的步驟。
談起建立Persona體系高手頗多,我這個菜鳥可不敢班門弄斧,我個人比較推崇Dr.Lene Nielsen的10步建立Persona方法。
- Finding the users 發現用戶
- Building a hypothesis建立假設
- Verifications調研
- Finding patterns發現共同模式
- Constructing personas構造虛構角色
- Defining situations定義場景目標
- Validation and buy-in復核與買進
- Dissemination of knowledge知識的散布
- Creating scenarios創建劇情
- On-going development持續的發展
按照Dr.Lene Nielsen的方法可以建立起一套完整的用戶模型體系(雖然有幾條我也不是太會用),不過對于大多數產品這個方法還是有點高深莫測。我剛接觸這個玩意的時候看了一下午還是不太明白這玩意怎么用。所以只能基于這個高深玩意,自己總結了一套能夠切實可行的Persona模型構造方法準備在下面簡單說說,我本屬菜鳥,大家多多提意見哦!
第一步:確定用戶,做出假設
首先,要明確用戶群體,這個在大多數應用開發之前就應該明確了。連用戶群都不知道還開發個毛產品。其次,做出用戶角色假設。這個時候大家就要問了,我本來就是要確定用戶角色模型,這不是本末倒置了么??我要說明一點,在用戶角色分析之前,我們要有個對用戶劃分的方向。比如對于一個游戲,我們要劃分用戶模型,其實有很多種分的方法。用戶可以分為,初級玩家、中級玩家;還可以分為,戰略性玩家、視覺性玩家、裝備性玩家。任何一個用戶群體都有多種分類方式,首先要確定我們到底怎么來分類用戶。確定了分類方式之后,再來一個一個分類來研究。
下面以一個我從事的互聯網醫療產品作為一個簡單的例子,來對這一點進行說明。這里只是簡單舉例,真正的用戶模型假設分類遠比例子復雜的多。
首先簡單定義用戶群:身體出現非緊急病癥的人群。
如果是急癥或是嚴重的病癥一般會直接前往醫院,并不會打開手機應用來咨詢醫生或者詢問用藥指導。所以我們的適用人群是身體出現異樣且非緊急的人群。
做出假設,為了舉例方便,我們簡單的把用戶角色分為:細心護理型、粗放型。細心護理型:主要是指非常注意自己的健康狀況,不放過一點一滴的問題。粗放型:只需要知道個大概有事沒事,不太關心自己的健康狀態。我們先簡單將用戶角色分為這兩種,繼續第二步發分析。
第二步:確定用戶興趣點(提取變量)
對于這一步,可以通過少量用戶訪談來完成,其實就是找到所有用戶關注的點,我們將這些用戶關注的點稱為變量。
比如對于醫療產品,經過對用戶的訪談,我們簡略總結用戶關注度為:醫生的真實可靠性、醫生的負責程度、能否找本地醫生掛號、產品視覺、產品交互。為了舉例方便,我們簡單總結用戶關注的這5個特點。從而可知,我們得到5個變量,下面將設計問卷分析出對不同角色用戶對這5個變量的差異性。
第三步:設計問卷(最關鍵的一步)
問卷是針對我們產品真實用戶群的調查,所以題目的設計必須非常具有針對性,并且通過結果能夠達到我們預期的效果。
首先,要先將問卷問題分成三個區:甄別性問題區、變量問題區、建議性問題區。估計有人要問這都是些神馬???其實這些很簡單。甄別性問題,是用來甄別出用戶屬于哪個角色;比如我設置了10個問題,符合1,3,5條問題的用戶屬于角色A,符合2,4,6條問題的用戶屬于角色B。
甄別性問題:
以剛才的例子,我們簡單設置3個甄別性問題:
Z1.您一般在線咨詢病情的時間是多久?
A.<5min ???B.5-10min ???C.10-20min? ??D.>20min
Z2.您是否需要隨時的咨詢醫生?
A.需要???? B.不需要???? C.看情況
Z3.如果手上被劃了一個小口子,并不是非常嚴重,您會?
A.立刻消毒包扎???? B.清洗干凈后該干嘛干嘛???? C.壓根不管
我們定義甄別規則如下:
為了舉例方便,我們簡單給甄別角色設置了上述規則。這里說明幾點,第一,規則是人設定的,可以更改,只有更好的規則,規則沒有對錯;第二,問題1、問題2、問題3之間是“與”的關系,問題內選項是“或”的關系。
有個問題,如果用戶的答案都不滿足于上面的規則,那如何分配用戶角色呢???答案很簡單:要么真正研究規則并修改規則;要么作為數據清洗將用戶清洗掉(說明該用戶沒有認真答題,或是用戶屬于極小類群)。當然這個地方還有很多可以優化,具體參考數據挖掘資料。
變量性問題:
變量性問題其實是指針對用戶關注的點進行問題設置。我們剛才舉例總結出的關注點為:醫生的真實可靠性、醫生的負責程度、能否找本地醫生掛號、產品視覺、產品交互,5個方面,針對每個方面可以設置1-n問題。(為了簡便,每個變量僅列出一個問題)
下面在列舉出一個變量舉出多個問題的例子:
產品交互:
- 您對頁面扭轉時的流暢性要求如何?請用1-100分給出(1代表不在意,100代表非常在意)
- 您對手機應用的操作頻率如何?請用1-100分給出(1代表不經常,100代表經常操作)
- 您喜愛扁平化的交互設計還是深度立體的交互設計?請用1-100分給出(1代表喜歡扁平化的交互設計,100代表喜歡深度立體的交互設計)
…
總之,在設計變量性問題的時候,最好得到可量化的數字,這樣方便于對以后的多元回歸統計工作。
建議性問題:
建議性問題是不用用戶角色給我們提出的要求,他們可能提出一些非全局的變量問題。比如,對于老年用戶,可能會提出應用設計中存在放大鏡功能,但這個功能明顯不適合年輕人。建議性問題的很多可以設置成開放性問題,不用角色的用戶可以將自己的想法寫出來,如果大家都需要,那就變成了新需求,也就是產品功能的發展方向。
按照我們剛才的例子,給出2個建議性問題:
J1. 您作為用戶還希望我們的應用添加什么樣的功能?
- 語音服務功能
- 24小時服務電話
- 中英文
- 其他_______
J2. 您希望我們用什么方式和您聯系?
- 電話
- 寫信(哈哈,這里來個復古的方式)
- 直接上門
- 其他_______
到這里,我們的一套問卷就搭建完成了。
最后再說一句,在問卷的最后,要給出一個綜合評價性的問題哦!?。?!
綜合滿意度:
您對我們的應用滿意度是什么?請用1-100分給出(1代表很不滿意求,100代表非常滿意)好啦,大功告成,這就是一套完整persona問卷。
上圖描述了這一過程,其中每個顏色的小人,代表通過甄別問題后,區分出的用戶角色。
最后用上面的問卷對10個用戶進行訪問,得到數據如下:
說明:
- P1、P2、P3…P10代表10個用戶;
- Z1、Z2、Z3代表3個甄別性問題;
- B1、B2、B3…B5代表5個變量性問題;
- J1、J2代表2個建議性問題
甄別性問題結果:
按甄別問題對用戶分類如下:
- 細心護理型:P1、P2、P4、P5、P10
- 粗放型:P6、P7、P9
- 數據異常問卷:P3、P8
異常數據的產生通常是由2個原因造成的,第一個是甄別邏輯設置不完善,比如我們這個例子甄別性問題少,很多情況都沒有考慮清楚,所以在設計甄別問題時,盡量將所有情況思考清楚,以免出現過多無效數據;第二個是被調查用戶填寫不認真,這也是個很常見的問題,在設置問題時,盡量減少繁瑣問題,使被調查用戶能夠比較準確的完成所有問題。
變量性問題結果:
用戶的調查結果以數表的形式展示出來,這樣有利于進行多元回歸分析。
建議性問題結果:
綜合滿意度:
二、數據處理
數據的常規處理
對于剛才得到的數據,可以進行常規的處理。即求出平均值或者份額進行相應比較分析,所得到的結果如下。
對于樣本量為10的上述調查結果經計算,細心護理型占50%,粗放型30%,異常數據20%。
變量性問題平均值:
對于各個角色均值數據如下:
從上述數據結論可知,對呀B1-B4問題,兩個用戶角色觀點相差不大。但是對于B5(產品交互)問題粗放型用戶比細心護理型用戶更為重視。
經過對建議性問題分析結果可以得到如下圖表:
由此可得出結論,細心護理型用戶對email的要求較為強烈;粗放型的用戶傾向于寫信的方式。對于添加的服務項,這兩種角色均有需求。
綜上所述,我們只是舉了一個非常非常2b又簡單的例子來說明構建用戶模型的方法,實驗的樣本量也很小。這個簡單的例子可以說明基本方法,要真正應用到自己的case中,還需要認真研究分析。
多元回歸方法分析用戶模型
對于數學好的童鞋,可以給出一種多元回歸統計的方法來分析我們得到的數據。這里寫的并不詳細,也沒聽提供假設檢驗,望高手多多指點交流。我們僅用多元回歸方法來分析變量性問題的結果。
我們的例子提出了5個變量性問題,所以要回歸的線性方程具有5個變量,形式如下:
Y=b0+b1x1+b2x2+b3x3+b4x4+b5x5
我們的目的就是要對b0、b1、b2…b5計算出估計量。
寫成矩陣的形式為Y=BX
其中Y為綜合滿意度數據
使用MATLAB中的regress(y,x)可以對B進行多元回歸,結果如下:
(這里沒有進行假設檢驗等,大家可以自行完善)
>> y=load(‘C:\Users\ydbj0017\Desktop\y.txt’)
y =
90
85
77
81
70
78
89
91
90
80
>> x=load(‘C:\Users\ydbj0017\Desktop\x.txt’)
x =
1??? 80??? 95??? 79??? 78??? 67
1??? 87??? 66??? 60??? 89??? 78
1??? 97??? 77??? 87??? 69??? 90
1??? 88??? 98??? 65??? 75??? 68
1??? 78??? 83??? 63??? 73??? 76
1??? 73??? 75??? 88??? 80??? 95
1??? 78??? 98??? 63??? 66??? 97
1??? 77??? 74??? 87??? 66??? 69
1??? 90??? 88??? 67??? 87??? 78
1??? 88??? 78??? 67??? 79??? 60
>> regress(y,x)
ans =??????????? %這個就是估計矩陣B
51.4213?????? %b0
-0.0868??????? %b1
0.2210?????? %b2
0.1407?????? %b3
0.2041?????? %b4
-0.0671?????? %b5
b0為常數,對變量沒有影響,剩余對應相應的變量問題。由此可見B2問題是全部用戶對整體評價中權重最大的因素。
Gery@北京海淀,醫療方向產品經理。還望同僚多多指點,共同進步。
本文系起點學院北京1503期優秀學員@Gery 原創獨家授權發布,未經本站許可,禁止轉載。謝謝合作。
優秀
優秀!后面的多元回歸分析,讓我想起了線性代數和任課老師,最后期末預習的樣子···
可以再寫一篇matlab的教程嗎
謝謝作者的分享,前面寫的也很好,不過關于最后的回歸分析想請假加作者,在回歸分析中,你的因變量設置的是綜合滿意度,自變量設置的是各種需求偏好,因變量相當于是用戶對于目前應用的看法,自變量是用戶的期望,時間維度上就不同,所以這樣設置因變量和自變量是不是在邏輯上就有問題呀?
還有些變量可能有自相關。。。
有女友嗎
。。。
開個玩笑- – 后面的矩陣 看不懂了,不過前面的很受用!蟹蟹!
不蟹哈哈
牛b,同時吐槽下woshipm的收藏功能,好難找
+1
學習了。最近在做用戶調研,希望還可以多分享些用戶調研方面的干貨呢 ?? ??
感覺很受用,請問能發一份當時更詳細的訪談報告還有問卷供學習使用嘛?用研新手上路還有很多地方需要學習借鑒
寫的挺好的 大大 是否能說出知乎上的昵稱是啥呢? 想繼續學大大的東西
你好,我一般不太愛寫東西,木有時間呀~~只是最近想整理整理我的一些思路來分析一下,希望以后多多交流,247964275是我的qq號,以后相互學習。
總結得不錯,學習 非常感謝分享
前面很仔細地一點一點看了,然后看到多元回歸方法這部分就快速過了 ??
“您喜愛扁平化的交互設計還是深度立體的交互設計?請用1-100分給出(1代表喜歡扁平化的交互設計,100代表喜歡深度立體的交互設計)”——您確定這是給普通用戶看的問卷嗎?他們真的懂什么是扁平化、什么是深度立體?
一個例子而已,不必太認真與例子本身
問題是,面對一百萬潛在用戶群的項目,你調研多少用戶才合理?花多少成本?如何保證代表性,真實性?
你好,我是這樣理解的。每個用戶是獨立的個體,所以應該認為各自樣本是一個有效數據,但是在甄別性問題的時候需要認真設計甄別條件,這一點很重要,用來保證數據的有效性。調研用戶在選擇上是無偏好的,自然是越多越好,但是要在數量得在數量和成本之間找到均衡點,成本的問題真的需要你們好好分析。歡迎以后我們多討論。
你用的是sas還是什么,數學厲害的產品經理也是奇跡般的存在啊
我習慣性用Matlab,也想學習學習SAS和R ??
看到數學腦袋疼了
同
學習了,干貨大大的
整體寫的很好啊,有很多可以借鑒的地方。有個小疑問,在問卷設計中,量化評分一般都是1-10分,如果選擇1-100分的話,不同的人會有不同的標準,做回歸的時候是需要標準化的。
hi你好,對與回歸用只要給定標準評分量度即可,1-10分可以減少用戶主觀的標準偏差,1-100分可以細化不同人的不同因素的偏好。以后咱們還可以多討論,嘿嘿
1-100分 用戶的感知和區分度更差吧,很難選起來。
哈,舉個例子,我們可以做1-10的選擇,也可以做1-100的選擇,不影響回歸哦
所以結論是不影響回歸的情況下, 用1-10作為選擇更合適?
用戶模型的基礎是一個好的前期調研
恩,沒錯,這里就是談談調研做用戶分析的方法
啊,不錯,都是干貨
回歸分析用來確定優先級咯?