實案分析:如何用一道多選題給用戶畫像?

1 評論 28717 瀏覽 68 收藏 17 分鐘

本例僅僅是基于調研目的靈活處理的一個例子,適合短平快的項目;如果需要系統了解用戶,深入挖掘用戶需求,更大的樣本量和更扎實的定性研究依然是必不可少的。

現代商業離不開對用戶的理解,任何業務的決策者都不會希望在認識用戶上存在盲區,因此在用研的日常工作中,“做一個用戶畫像”是經常收到的需求。但同樣的需求背后,往往對應著不同的目標和問題,搞清楚了解用戶能幫助業務方解決什么問題,才能更有效地制定研究方案。大而全的數據平臺,不一定可以和粒度很細的調研目標精確匹配;傳統市場調研或設計調研的方法又會增加周期和成本,不適合短平快的項目。那么是否可以使用簡單的測量-統計方法,較敏捷地得到一個需求方期望的“用戶畫像”呢?本文來分享這樣一個案例。

(一)背景-為什么想做一個“用戶畫像”

在接手話題版塊改版方向調研的過程中,其中一項調研目標比較有意思:運營同學發現,網易新聞客戶端話題版塊中,一些女性相關話題活躍度格外高,這與對目標用戶的預期有一些偏差。依照大家的印象,新聞客戶端中壯年男性比例偏高,典型用戶是一個體制內老劉的形象-時政、社會、歷史、軍事版塊的重度讀者-因此在話題運營上也更偏向了此類內容。然而偶爾為之的母嬰、情感類的話題,無論從參與熱度還是質量來考量,效果都不錯。運營同學陷入思考之中,懷疑話題版塊活躍著一些假的網易新聞用戶。

那么話題社區的活躍用戶真的與客戶端整體不同嗎?運營同學由此提出了調研需求,希望了解話題活躍用戶的“性別、年齡、婚姻狀況。。”等等的一攬子人口學變量描述,簡言之-“做一個話題版塊的用戶畫像”。

不管如何做,先梳理一下需求,把目標拆解成回答以下兩個問題:

  1. 網易新聞客戶端的用戶可以分為哪幾類?
  2. 這幾類用戶中,哪些是話題版塊可以發力的核心用戶?

(二)以什么標準區分用戶-一個簡單的題目設計

大家可能注意到,需求方在提需求的時候,順帶提了一下自己對用戶區分維度的界定“性別、年齡、婚姻狀況。?!薄U\然,人口學變量用來區分用戶很經典,但并不適用于所有研究目標,比如在本例中的效果就未必好。原因有二。首先,人口學變量并不直接能落地到業務,還需要基于業務理解進行二次推演,不夠直觀;而好的分類標準應該能直接與現有資源結合來指導業務;二是完全無預設的情況下,事前很難確定各個人口學變量的影響權重,那么如果需要進行探索性分析,需要在問題中納入足夠多的變量。這樣短短問卷難以承載,也會讓分析頭緒無端變多。

所以研究用了另一個解決方案,直接用內容偏好特征來區分用戶。這樣做的好處是,作為內容分發平臺,直接以內容偏好為標簽的用戶畫像天然具有可落地的屬性,而不必再通過人口學特征去推斷。另外,對內容的需求偏好往往反映了一個人當前的綜合狀態-社會經濟地位、文化傾向、人口學特征-可以預期是一個很有效的探測點。

相關的問題設計很簡單,只是在問卷結尾處加一道內容偏好的多選,備選項參考了主流新聞app的版塊分類。

您平時使用網易新聞客戶端時,喜歡看哪些內容?(多選)

  • 科技互聯網、數碼IT
  • 體育賽事、運動健身
  • 財經金融、投資理財
  • 時事要聞
  • 母嬰親子
  • 情感兩性
  • 時尚美妝
  • 娛樂明星
  • 動物萌圖
  • 游戲動漫、二次元
  • 影視音樂、攝影旅行
  • 健康醫療、營養養生
  • 社會民生、房產資訊
  • 汽車知識
  • 國際政治局勢
  • 歷史掌故、軍事動態
  • 神跟貼、幽默段子
  • 星座命理
  • 其他(請注明)

這里有個問題簡單說明一下-為什么要把選項切到這么碎,而不加以合并。這種處理方式實際是基于以下兩點考慮。

  1. 希望基于用戶認知形成分類-當然可以根據對業務的理解,對選項內容進行合并和抽象,但預設的歸類方式與用戶會采用的未必吻合。如果希望降低預設對用戶選擇的影響,完全通過用戶反應情況來建立項目間的關聯,那不妨呈現具體細致的選項。這好比景觀規劃時,直接在行人足跡最深的地方鋪路。
  2. 準確性和易答性-抽象度越高的描述,包含的信息越多,不同人腦中的典型代表差異會越大,也越可能包括的矛盾案例?;卮稹笆遣皇窍矚g狗”時,更有可能陷入“我有點喜歡松獅但是又有點討厭泰迪到底選不選喜歡呢”的糾結中,而問“是不是喜歡泰迪”就會更加容易回答。另外,抽象度高的選項,往往需要詳細描述并給出具體例子,進一步增加閱讀難度;而答題者處理短而多的選項時,未必需要比長而少的選項花費更多認知資源。

因此,問題選項呈現采用了具體細分的列舉,而細分項的合并化簡,則將在問卷回收后,根據用戶的實際反應來處理。

(三)讓分析過程更簡明-數據降維

問卷投出去一段時間后,樣本池漸漸上漲,內容偏好的數據餅圖五彩斑斕地分布起來。這時就發現問卷選項細碎的不方便之處-同時考慮18個選項遠遠超出了人類工作記憶的負荷,讓分析過程頗有些尾大不掉。當然這是意料之中的。如前所述,之所以把選項粒度做得很小,是希望通過用戶的實際選擇模式來找到相關聯的內容。因此,首先要使用一下因子分析的方法,把數據進行濃縮。

岔開幾句簡單說說因子分析的用途。所謂因子分析,是處理多變量數據的一種常用的預處理方法,使用場景是當實際用于測量的變量較多且相關時,可以將比較瑣碎繁多的變量,用幾個易于解釋的因子表達出來,從而更清晰地展示數據的結構和規律。拿這個項目來說,我們得到的多選題數據是用多重二分法表示的-每一個選項作為一個單獨變量-題目反應數據共包括18個變量(如下圖)。顯然這些變量之間是存在相關關系的,存在歸納的可能,這正符合因子分析的使用場景。

因子分析使用SPSS完成,操作過程略去不表,分類結果如下圖所示,將18個選項濃縮為5類因子。根據每個選項在各因子上的載荷(也就是原始選項和因子之間的相關系數),可以看出該因子大概代表了哪一類內容。為了便于理解,分別給它們起了一個比較直觀的名字。如下圖所示。

5個因子作為新的變量保存下來(如下圖,注意保留下來的變量已經標準化為Z分數),留作后續進行用戶聚類的依據。每個用戶對某個因子分數越高,就意味著對該因子對應內容的偏好程度更強。例如第2個用戶,就明顯是“女性生活”因子相關內容的重度瀏覽者。

(四)為用戶打內容偏好標簽-聚類分析

完成了數據化簡,接下來根據用戶在五個內容偏哈因子上的得分,對用戶進行聚類分析。由于因子本身為Z分數,不用再進行標準化處理,直接分析即可。

這里再岔開幾句簡單說說聚類分析的原理。聚類算法的原理是通過計算各個案例點在變量空間中的距離遠近(SPSS中計算距離的方法有30多種,大多數情況只選擇默認設置的歐式距離就好),來把它們分簇處理的。變量空間名字聽起來挺厲害,其實就是把n個變量當作n個坐標軸,參照三個維度構成三維“空間”的說法,將n個變量的情境稱為n維空間。每個case在這n個變量上的取值,構成了一個n維坐標,根據坐標可以計算case間的距離,根據距離遠近形成不同的分類簇。例如,上圖表格中每一行都是一個五維坐標向量,描述了該行對應用戶在“內容偏好空間”的位置,不同用戶位置間的距離越近,就越可能被歸為一類。

聚類分析仍使用SPSS完成,結果如下表所示。表格中數字代表每類用戶對特定內容的偏好程度,數字越大偏好程度越高。根據幾類用戶的內容偏好模式分別起一個鮮明易記的名字,例如,給更偏好“女性生活”與“宅文化”內容的用戶打上“時尚麗人”的標簽。

現在每一位樣本中的用戶都有了一個內容偏好標簽,這個標簽也保存為一個新的變量(如下圖),留待與其它題目進行交叉分析。

 

首先就可以用內容標簽與人口學變量來交叉分析一下,驗證一下偏好某類內容的用戶是否具有比較特殊的人口學屬性。結果如下圖所示(具體數據略)。可以看到,盡管由于樣本中男性比例偏大造成一些bias,相對趨勢的比較還是驗證了很多印象:例如“時尚麗人”中年輕女性的比例顯著偏高,“財經科技控”高學歷高收入比例顯著高等等。

納入與人口學變量的交叉分析結果,最終得到的用戶分類如下表所示。從樣本占比推斷,“隨意用戶”和“時政歷史迷”最有可能是客戶端主流人群,這與業務經驗得到的印象是一致的。

(五)哪類用戶是話題版塊的核心用戶

現在關鍵的問題來了,畫像的幾類人群,哪類是話題版塊的核心用戶、需要重點發力運營呢?

首先看看活躍用戶中各類用戶的占比(活躍度根據問卷中覺知情況和使用頻次的問題答案來判斷)。由下圖可以看到,活躍用戶的類別分布和整體差異并不大-“隨意用戶”和“時政歷史迷”占了最大的部分。這也符合預期,畢竟話題版塊的流量從客戶端整體滲透過來,各類用戶體量上不應該有太大的差異

那么哪種用戶的增量潛力比較大呢?這個問題反過來看比較清晰-我們可以這樣假設,如果某類人群中活躍用戶比例越大,滿意度越高,那么這類用戶更可能是話題版塊的目標用戶。

首先將活躍度與內容偏好進行交叉分析??梢钥吹剑皶r尚麗人”中話題使用活躍者占比最高(42%),無覺知者占比則最低(29%)-年輕女性用戶看起來天然對話題討論很敏感。

再看一下滿意度的差異。年輕女性用戶對話題社區各方面的滿意度都高于其他用戶,她們在話題社區玩得更開心。

所以,給出結論&建議-年輕女性用戶雖然在話題版塊的體量不大,但她們的活躍度和滿意度更高,討論質量更好,對促進話題社區良性發展有很大幫助,可以從相關內容版塊進行重點引流。而反過來,如果話題社區這種形式對“時尚麗人”獨具吸引力,也可以將話題版塊與時尚、母嬰、情感等垂直頻道打通,通過話題運營進行流量反哺。

最后,本例僅僅是基于調研目的靈活處理的一個例子,適合短平快的項目;如果需要系統了解用戶,深入挖掘用戶需求,更大的樣本量和更扎實的定性研究依然是必不可少的。不過在日常工作中,有意識地以經濟敏捷的方式擴展關于用戶的基礎知識,也不失為一種很好的積累沉淀吧。

(本案例數據和結論僅作為例子展示,不涉及真實情況)

 

作者:驢爺

來源:公眾號:ME網易移動設計

版權:人人都是產品經理遵循行業規范,任何轉載的稿件都會明確標注作者和來源,若標注有誤,請聯系主編QQ:419297645

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 不知道能否 在有空的時候把中間略去不表的 SPSS分析過程寫一下呢

    來自浙江 回復