99精品国产福久久久久久,99精品视频免费热播在线观看 ,日本成人三区

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

聚類分析在用戶分類中的應(yīng)用

yoyo

2013-10-16

0 評論 18275 瀏覽 21 收藏

5 分鐘

什么是聚類分析？
聚類分析屬于探索性的數(shù)據(jù)分析方法。通常，我們利用聚類分析將看似無序的對象進(jìn)行分組、歸類，以達(dá)到更好地理解研究對象的目的。聚類結(jié)果要求組內(nèi)對象相似性較高，組間對象相似性較低。在用戶研究中，很多問題可以借助聚類分析來解決，比如，網(wǎng)站的信息分類問題、網(wǎng)頁的點(diǎn)擊行為關(guān)聯(lián)性問題以及用戶分類問題等等。其中，用戶分類是最常見的情況。
聚類分析的基本過程是怎樣的？

選擇聚類變量
聚類分析
找出各類用戶的重要特征
聚類解釋&命名

|| ?選擇聚類變量

在設(shè)計(jì)問卷的時(shí)候，我們會根據(jù)一定的假設(shè)，盡可能選取對產(chǎn)品使用行為有影響的變量，這些變量一般包含與產(chǎn)品密切相關(guān)的用戶態(tài)度、觀點(diǎn)、行為。但是，聚類分析過程對用于聚類的變量還有一定的要求：

這些變量在不同研究對象上的值具有明顯差異；
這些變量之間不能存在高度相關(guān)。

因?yàn)?，首先，用于聚類的變量?shù)目不是越多越好，沒有明顯差異的變量對聚類沒有起到實(shí)質(zhì)意義，而且可能使結(jié)果產(chǎn)生偏差；其次，高度相關(guān)的變量相當(dāng)于給這些變量進(jìn)行了加權(quán)，等于放大了某方面因素對用戶分類的作用。

識別合適的聚類變量的方法：

對變量做聚類分析，從聚得的各類中挑選出一個有代表性的變量；
做主成份分析或因子分析，產(chǎn)生新的變量作為聚類變量。

|| 聚類分析

相對于聚類前的準(zhǔn)備工作，真正的執(zhí)行過程顯得異常簡單。數(shù)據(jù)準(zhǔn)備好后，丟到統(tǒng)計(jì)軟件（通常是spss）里面跑一下，結(jié)果就出來了。

這里面遇到的一個問題是，把用戶分成多少類合適？通常，可以結(jié)合幾個標(biāo)準(zhǔn)綜合判斷：

看拐點(diǎn)（層次聚類會出來聚合系數(shù)圖，如右圖，一般選擇拐點(diǎn)附近的幾個類別）
憑經(jīng)驗(yàn)或產(chǎn)品特性判斷（不同產(chǎn)品的用戶差異性也不同）
在邏輯上能夠清楚地解釋

|| 找出各類用戶的重要特征

確定一種分類方案之后，接下來，我們需要返回觀察各類別用戶在各個變量上的表現(xiàn)。根據(jù)差異檢驗(yàn)的結(jié)果，我們以顏色區(qū)分出不同類用戶在這項(xiàng)指標(biāo)上的水平高低。如下圖，紅色代表“遠(yuǎn)遠(yuǎn)高于平均水平”，黃色代表“平均水平”，藍(lán)色代表“遠(yuǎn)遠(yuǎn)低于平均水平”。其他變量以此類推。最后，我們會發(fā)現(xiàn)不同類別用戶有別于其他類別用戶的重要特征。