聚類分析在用戶分類中的應(yīng)用
- 選擇聚類變量
- 聚類分析
- 找出各類用戶的重要特征
- 聚類解釋&命名
?
|| ?選擇聚類變量
在設(shè)計(jì)問卷的時(shí)候,我們會根據(jù)一定的假設(shè),盡可能選取對產(chǎn)品使用行為有影響的變量,這些變量一般包含與產(chǎn)品密切相關(guān)的用戶態(tài)度、觀點(diǎn)、行為。但是,聚類分析過程對用于聚類的變量還有一定的要求:
- 這些變量在不同研究對象上的值具有明顯差異;
- 這些變量之間不能存在高度相關(guān)。
因?yàn)?,首先,用于聚類的變量?shù)目不是越多越好,沒有明顯差異的變量對聚類沒有起到實(shí)質(zhì)意義,而且可能使結(jié)果產(chǎn)生偏差;其次,高度相關(guān)的變量相當(dāng)于給這些變量進(jìn)行了加權(quán),等于放大了某方面因素對用戶分類的作用。
識別合適的聚類變量的方法:
- 對變量做聚類分析,從聚得的各類中挑選出一個有代表性的變量;
- 做主成份分析或因子分析,產(chǎn)生新的變量作為聚類變量。
|| 聚類分析
相對于聚類前的準(zhǔn)備工作,真正的執(zhí)行過程顯得異常簡單。數(shù)據(jù)準(zhǔn)備好后,丟到統(tǒng)計(jì)軟件(通常是spss)里面跑一下,結(jié)果就出來了。
這里面遇到的一個問題是,把用戶分成多少類合適?通常,可以結(jié)合幾個標(biāo)準(zhǔn)綜合判斷:
- 看拐點(diǎn)(層次聚類會出來聚合系數(shù)圖,如右圖,一般選擇拐點(diǎn)附近的幾個類別)
- 憑經(jīng)驗(yàn)或產(chǎn)品特性判斷(不同產(chǎn)品的用戶差異性也不同)
- 在邏輯上能夠清楚地解釋
|| 找出各類用戶的重要特征
確定一種分類方案之后,接下來,我們需要返回觀察各類別用戶在各個變量上的表現(xiàn)。根據(jù)差異檢驗(yàn)的結(jié)果,我們以顏色區(qū)分出不同類用戶在這項(xiàng)指標(biāo)上的水 平高低。如下圖,紅色代表“遠(yuǎn)遠(yuǎn)高于平均水平”,黃色代表“平均水平”,藍(lán)色代表“遠(yuǎn)遠(yuǎn)低于平均水平”。其他變量以此類推。最后,我們會發(fā)現(xiàn)不同類別用戶 有別于其他類別用戶的重要特征。
|| 聚類解釋&命名
在理解和解釋用戶分類時(shí),最好可以結(jié)合更多的數(shù)據(jù),例如,人口統(tǒng)計(jì)學(xué)數(shù)據(jù)、功能偏好數(shù)據(jù)等等(如下圖)……最后,選取每一類別最明顯的幾個特征為其命名,就大功告成啦!
參考資料:
http://www.redshiftresearch.co.uk/ImageLibrary/Cluster%20Analysis.pdf
《社會統(tǒng)計(jì)分析方法——spss軟件應(yīng)用》
原文來自:網(wǎng)易UED
- 目前還沒評論,等你發(fā)揮!