3分鐘,看懂用戶偏好分析
編輯導語:一提到用戶畫像,很多人都會直觀地想到:通過用戶畫像來分析用戶偏好。但是有些同學可能不懂得用戶偏好該如何分析,作者整理了一份用戶偏好分析攻略,與你分享,希望對你有所幫助。
大家好,我是愛學習的小xiong熊妹。
一提到用戶畫像,很多人直觀地會想到:通過用戶畫像分析出用戶偏好。到底用戶偏好該如何做分析,今天簡單分享下,給大家一個懶人攻略。
一、如何量化用戶偏好
直觀上看,用戶偏好,就是:
- A用戶喜歡產品甲
- B用戶喜歡產品乙
問題是:如何通過數據的形式,把這個關系表達出來。
最簡單的方法是:
- 把用戶分類標注出來(如上邊的A用戶、B用戶)
- 把產品標準出來(比如甲產品、乙產品)
- 設定“喜歡”的標準,比如一周內購買2次以上
- 計算每個用戶,符合“喜歡”產品的人數
如下圖,A、B用戶各抽100人,觀察其對甲乙產品“喜歡”的人數,這樣就能簡單的把“喜歡”表達出來了。
二、如何評價用戶偏好
如果真如上邊例子的話,用戶的喜好是很明顯的。把人數換算成比例,可以清晰看到:抽出的100名A用戶,90%都喜歡甲產品,抽出的100名B用戶,90%都喜歡乙產品。那肯定兩類用戶喜好不同。
但實際情況會很糾結,比如下圖這種情況。理論上,年輕人喜歡喝汽水,中年喜歡喝茶,老年喜歡喝牛奶。但是在數據上看,其比例差異也就不到20%。很多時候會讓人糾結:到底年齡和飲料之間有沒有關系呀?
這時候可以用統計學中獨立性檢驗,一定程度減少糾結。
三、什么是獨立性檢驗
(大家可以直接略過這一段)獨立性檢驗是一種基礎方法。所謂獨立性檢驗,指的是其利用了“兩個互獨立的事件同時發(fā)生的概率,等于兩件事單獨發(fā)生的概率的乘積”的原理進行檢驗。
獨立性檢驗的原假設是兩個變量獨立。大家知道,原假設就是要被懟翻的,所以如果假設檢驗不通過(P值小于0.05),就能拒絕原假設,認為兩個變量有關系。
四、如何做獨立性檢驗
具體的統計學原理稍顯復雜,既然是懶人攻略,那么就直接給操作步驟:
第一步:根據題目,給出觀察數據
第二步:計算期望頻數數據
第三步:使用公式計算卡方檢驗結果
大家直接看P值就好了,小于0.05,推翻原假設,年齡和飲料選擇之間不獨立,可認為差異是真實存在的。
五、背后的問題
上邊雖然給了很多方法,但是一定要注意:用戶喜好并不是固定不變的,過去的數據參考意義會很有限。
- 比如把“偏好”定義為購買。那么購買很可能受到價格、品牌、口碑等多方面影響。
- 比如把“偏好”定義為瀏覽頁面。那么瀏覽行為很可能受到標題黨、蹭熱點等影響。
可能一個促銷活動,一個蹭熱點的標題,就把前邊發(fā)現的結論推翻了。
總之,通過簡單的數據定義出來的“偏好”,可能不是真正的偏好,其中夾雜了大量的其他原因。需要更多方法來剔除這些原因。
作者:碼工小熊,微信公眾號:碼工小熊
本文由 @碼工小熊 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
亮點在于,遇到數值相近 難以判斷偏好時候,用獨立性檢驗。但獨立性檢驗,只能告訴我們是否有關系,它并能不說明一個變量是另一個變量的原因。
此文很有實戰(zhàn)性。值得推薦
分析的真的很棒,把表格也給整的這么的清晰,我相信再做用戶偏好分析的時候,這篇文章真的能起到很大的作用。