聚類分析在用戶分類中的應(yīng)用

0 評論 18275 瀏覽 21 收藏 5 分鐘

什么是聚類分析?
聚類分析屬于探索性的數(shù)據(jù)分析方法。通常,我們利用聚類分析將看似無序的對象進(jìn)行分組、歸類,以達(dá)到更好地理解研究對象的目的。聚類結(jié)果要求組內(nèi)對象相似性較,組間對象相似性較。在用戶研究中,很多問題可以借助聚類分析來解決,比如,網(wǎng)站的信息分類問題、網(wǎng)頁的點(diǎn)擊行為關(guān)聯(lián)性問題以及用戶分類問題等等。其中,用戶分類是最常見的情況。
聚類分析的基本過程是怎樣的?

  • 選擇聚類變量
  • 聚類分析
  • 找出各類用戶的重要特征
  • 聚類解釋&命名

?

|| ?選擇聚類變量

在設(shè)計(jì)問卷的時(shí)候,我們會根據(jù)一定的假設(shè),盡可能選取對產(chǎn)品使用行為有影響的變量,這些變量一般包含與產(chǎn)品密切相關(guān)的用戶態(tài)度、觀點(diǎn)、行為。但是,聚類分析過程對用于聚類的變量還有一定的要求:

  • 這些變量在不同研究對象上的值具有明顯差異;
  • 這些變量之間不能存在高度相關(guān)。

因?yàn)?,首先,用于聚類的變量?shù)目不是越多越好,沒有明顯差異的變量對聚類沒有起到實(shí)質(zhì)意義,而且可能使結(jié)果產(chǎn)生偏差;其次,高度相關(guān)的變量相當(dāng)于給這些變量進(jìn)行了加權(quán),等于放大了某方面因素對用戶分類的作用。

識別合適的聚類變量的方法:

  • 對變量做聚類分析,從聚得的各類中挑選出一個有代表性的變量;
  • 做主成份分析或因子分析,產(chǎn)生新的變量作為聚類變量。

|| 聚類分析

相對于聚類前的準(zhǔn)備工作,真正的執(zhí)行過程顯得異常簡單。數(shù)據(jù)準(zhǔn)備好后,丟到統(tǒng)計(jì)軟件(通常是spss)里面跑一下,結(jié)果就出來了。

這里面遇到的一個問題是,把用戶分成多少類合適?通常,可以結(jié)合幾個標(biāo)準(zhǔn)綜合判斷:

  • 看拐點(diǎn)(層次聚類會出來聚合系數(shù)圖,如右圖,一般選擇拐點(diǎn)附近的幾個類別)
  • 憑經(jīng)驗(yàn)或產(chǎn)品特性判斷(不同產(chǎn)品的用戶差異性也不同)
  • 在邏輯上能夠清楚地解釋

|| 找出各類用戶的重要特征

確定一種分類方案之后,接下來,我們需要返回觀察各類別用戶在各個變量上的表現(xiàn)。根據(jù)差異檢驗(yàn)的結(jié)果,我們以顏色區(qū)分出不同類用戶在這項(xiàng)指標(biāo)上的水 平高低。如下圖,紅色代表“遠(yuǎn)遠(yuǎn)高于平均水平”,黃色代表“平均水平”,藍(lán)色代表“遠(yuǎn)遠(yuǎn)低于平均水平”。其他變量以此類推。最后,我們會發(fā)現(xiàn)不同類別用戶 有別于其他類別用戶的重要特征。

|| 聚類解釋&命名

在理解和解釋用戶分類時(shí),最好可以結(jié)合更多的數(shù)據(jù),例如,人口統(tǒng)計(jì)學(xué)數(shù)據(jù)、功能偏好數(shù)據(jù)等等(如下圖)……最后,選取每一類別最明顯的幾個特征為其命名,就大功告成啦!

參考資料:

http://www.redshiftresearch.co.uk/ImageLibrary/Cluster%20Analysis.pdf

《社會統(tǒng)計(jì)分析方法——spss軟件應(yīng)用》

 

原文來自:網(wǎng)易UED

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!