如何破解“千人千面”,深度解讀用戶畫像
用戶畫像的概念大熱,眾多企業都希望通過“用戶畫像”驅動產品智能,但什么才是用戶畫像呢?
通過這篇文章,我們介紹我們理解的兩種用戶畫像(User Persona 和 User Profile),以及如何構建用戶畫像(User Profile)的標簽體系并驅動產品智能。
User Persona
第一種用戶畫像(User Persona)是產品設計、運營人員從用戶群體中抽象出來的典型用戶:
- 在用戶調研階段,產品經理經過調查問卷、客戶訪談了解用戶的共性與差異,匯總成不同的虛擬用戶;
- 在產品原型設計、開發階段,產品經理圍繞這些虛擬用戶的需求、場景,研究設計產品用戶體驗與使用流程;
- 當產品設計出現分歧時,產品經理能夠借助用戶畫像,跳出離散的需求,聚焦到目標用戶,不再討論這個功能要不要保留,而是討論用戶可能需要這個功能,可能如何使用這個功能等等。
例如某招聘類產品在調研階段構建的用戶畫像(User Persona):
(圖片引用自?https://www.clearvoice.com)
所以,這類用戶畫像(UserPersona),本質是一個用以描述用戶需求的工具,它幫助不同角色在產品研發過程中,站在用戶的角度思考問題。
在產品設計階段和原型開發階段,產品經理會較多地借助用戶畫像(User Persona)理解用戶的需求,想象用戶使用的場景。隨著產品上線后不斷迭代,積累真實用戶,僅通過用戶畫像(User Persona)難以量化地評估用戶需求,也很難通過數據證偽,不確定用戶畫像(User Persona)虛構的人物是不是真的目標群體。
同時,真實用戶群體也隨時間推移變化,在設計階段虛構的用戶畫像(User Persona)需要重新調研、設想。
User Profile
與此同時,我們也希望通過產品積累的用戶行為數據,為產品運營提供更好的支撐,例如根據用戶瀏覽記錄向用戶提供個性化服務。這就是本文著重介紹的第二種用戶畫像(User Profile)——根據每個人在產品中的用戶行為數據,產出描述用戶的標簽的集合。
例如猜他是男是女,生活工作所在地,乃至喜歡哪個明星,要買什么東西等。
隨著“千人千面”等理念深入人心,在與許多企業客戶的溝通中,我們希望客戶更加清楚兩種用戶畫像的差異。與第一種用戶畫像(User Persona)不同的是,用戶畫像(User Profile)的建設更加關注:
是否反應受眾的真實需求:
用戶畫像(User Profile)這個詞的字面意義,是關注人口屬性、生活狀態等靜態信息,但這些信息并不一定直接反應用戶興趣。產品更關注的往往是某用戶“最近喜歡看哪類視頻”、“準備買多少錢的手機”這樣能幫助產品運營的動態信息;
時效性:
用戶的興趣偏好隨時都在發生變化,需要及時更新用戶標簽;
覆蓋度:
用戶畫像(User Profile)既要勾勒出用戶感興趣的內容,也要記錄用戶不感興趣的信息,盡量多地滿足產品運營的需要。但同時,除了人口屬性等明確的屬性外,大多數用戶畫像的正確與否是沒有意義的。
如“最近喜歡看搞笑視頻”這個標簽,并不表示用戶下一次一定觀看搞笑視頻,因此執著于提升標簽的準確度,不如設計出多更清晰描述受眾需求的標簽,更多時候我們注重提升用戶畫像的覆蓋度,同時提供更細粒度的畫像。
設計用戶畫像的標簽體系
用戶畫像(以下均指 User Profile)一般通過標簽體系落地,簡單說就是你把用戶分到多少個類里面去,當然,每個用戶是可以分到多個類上的。這些類都是什么,彼此之間有何聯系,就構成了標簽體系。通常有兩種思路設計用戶畫像的標簽體系。
一是結構化的標簽體系,這類標簽可以直接從人口屬性、物品信息等基本信息中直接得到,有明確的層級關系,如性別、省市、視頻分類、商品分類等。
(圖片源自?http://www.amazon.cn)
結構化的標簽體系通常較為簡單,一般可以直接通過用戶的行為映射得到,例如根據用戶的購買記錄,為用戶構建物品對應的結構化標簽。
但結構化標簽往往粒度較粗,無法充分衡量用戶的興趣。
例如新聞類 App 中用戶閱讀了一條關于某明星的娛樂類新聞,其實無法推斷出他對所有娛樂類新聞感興趣,也不一定只對該明星情有獨鐘。
一種是非結構化標簽體系,就是各個標簽各自反應各自的用戶興趣,彼此之間并無層級關系。典型的非結構化的標簽,如搜索廣告系統中的關鍵詞,或者閱讀類產品中的文檔主題模型(Topic Model),或者向量化的用戶、物品?Embedding。
標簽體系的建設一要便于使用,二要區分度明顯。結合具體產品而言:在不同的場景下,對這兩點的要求重點是不同的;最終在產品中選擇哪些標簽并沒有明確的依據,還是需要充分了解到底是什么驅動用戶使用產品。
有效的標簽體系,要能反應用戶決定買什么、不買什么的邏輯與依據。
例如電商產品中,以新聞頻道的方法,為用戶構建“財經、體育、旅游、…”這樣的標簽,雖然并不難,但也沒多大意義。
用戶畫像行業實踐
神策數據與國內某知名視頻聚合網站共同建設視頻推薦服務。該網站每天聚合全網的視頻,向用戶提供熱門視頻、視頻檢索等服務。網站已經積累了大量的用戶和行為數據,圍繞新、老用戶的運營模型在發生著變化。
另與傳統的視頻站點不同,短視頻的運營特點有:
- 播放隨意性強:短視頻播放雖然是個高頻、周期性強的娛樂應用,但單次觀影時間短,用戶選擇隨意性大;
- 熱點輪換迅速:平臺中不斷加入新視頻,每天的熱門內容不斷變化,網站需要發現用戶潛在的興趣點,向用戶推薦新鮮內容;
- 場景驅動:場景是特定的時間、地點和人物的組合下的特定的消費意圖。不同的時間、地點,不同類型的用戶的消費意圖會有差異。例如白領乘地鐵上班,會關注當日的新聞熱點;周末晚上在家,用戶更喜歡點擊娛樂搞笑視頻。場景辨識越細致,越能了解用戶的消費意圖,推薦滿意度也就越高。
隨著視頻資源的不斷豐富和用戶需求的多樣化,如何準確向客戶推薦視頻,是該產品用戶畫像的一個基本目標。我們十分看重推薦系統中,推薦結果的可解釋性,即讓用戶能感覺到每一條推薦視頻的推薦理由。因此,我們構建用戶畫像也以觀看場景和觀看興趣為主。
我們考慮新用戶和老用戶兩大類群體:新用戶第一次進入 App,在這一階段的運營目標以留存為主,主要向用戶推薦近期熱門視頻。除了常規的設備信息、地理信息外,我們對用戶了解甚少,可以通過猜測下列問題:
- 用戶在哪里?
- 這個時段可能處于什么場景?
構建用戶畫像,進行場景推薦。這兩種標簽的獲取較為直接,通過用戶手機的地理位置信息和當前時段就可以得到。不同場景下,我們向新用戶推薦不同的視頻,例如:
- 工作日,7:00-10:00: 用戶可能搭乘公共交通工具前往公司,乘車時使用 3G/4G 流量上網,時間較為碎片化,并且容易受到打擾而中斷觀看。通常,這個時段用戶希望了解當天的時事、新聞。因此我們推薦短小精悍的熱點新聞;
- 工作日,12:30-14:00:用戶可能在公司午休,我們推薦娛樂、搞笑類的視頻,目的性較弱,隨意尋找符合自己口味的內容,但有可能因為午睡或工作,觀影時間碎片化。因此,我們推薦視頻時長較短,娛樂、搞笑類的視頻,如?X?奇藝的“笑?X?來了”等;
- 周末,19:00-23:00:用戶可能在家中休息,觀看時間較為充足;使用?Wifi,速度穩定;這個時段用戶目的性通常較強,例如看看 ”XX?歌手”、“XX?男” 等綜藝節目的熱門片段更新沒有。因此我們可以推薦綜藝節目、電影片花等,滿足用戶長時間放松的需求。
通過場景推薦的方式,我們在不了解用戶興趣的情況下,針對不同場景標簽下的新用戶推薦不同熱門視頻,滿足用戶需求。
而對于老用戶,運營目標是提升用戶體驗,向用戶推薦感興趣的內容,能提高觀影時長;結合場景推薦用戶可能感興趣的新鮮內容,能提高用戶留存率。除常規信息、場景信息外,構建老用戶的用戶畫像還會考慮:
- 用戶在不同時段的興趣點
- 用戶是否喜歡探索新鮮視頻
- 用戶召回需求
對于第一類“用戶興趣標簽”,可以通過視頻本身的分類信息構建結構化的興趣標簽。
我們在實際處理中,將每個用戶最近觀看記錄作為一個觀影序列,通過Item2Vec(《Item2Vec: NeuralItem Embedding for Collaborative Filtering》,?https://arxiv.org/pdf/1603.04259v2.pdf)產出視頻的?Embedding?矩陣,并用Bag of Words 的思想以每個用戶的最近觀看記錄描述用戶興趣,得到用戶 Embedding,作為用戶興趣標簽。
通過用戶興趣標簽,我們可以將用戶興趣融入前文描述的場景推薦中,例如在工作日的 7:00-10:00,我們根據用戶興趣,從熱點新聞中篩選用戶感興趣的軍事、財經等品類;在周末的19:00-23:00,我們根據用戶上周的觀影記錄,重復推薦相同的新一期的綜藝類節目。
對于第二類“用戶新鮮度需求標簽”,我們通過衡量用戶觀影記錄中,各影片之間的相似度得到。影片分類覆蓋越多,或影片之間的向量距離越遠,說明用戶越喜歡探索新內容。
對于喜歡探索不同類型的視頻的用戶,我們會更傾向于從用戶未觀看過的分類中,抽取新鮮熱門視頻加入推薦排序結果中。
現在互聯網產品的獲客成本很高,神策分析可以通過多維分析的方式尋找用戶流失的原因,同時我們也通過統計方法預測用戶流失風險。
對于視頻網站的老用戶,觀影習慣和場景通常較為固定,當用戶最近一段時間內的觀看頻次顯著低于過往,甚至沒有打開 App 時,我們判定用戶有流失風險,可以通過推送感興趣的視頻等手段,召回用戶。
小結
短視頻是一個高頻、隨意性強的產品,用戶的觀看行為受時間、場地等場景因素影響較大,需要對用戶在不同場景下的觀看行為做深入了解,歸納不同場景下用戶個體需求、群體需求的差異,針對不同場景制定相應的推薦策略,這也是我們選擇場景作為短視頻產品用戶畫像的突破口的原因。
同時我們在構建視頻推薦的用戶畫像時還面臨如下挑戰:
- 數據稀疏性:個人的觀看記錄相對整體的覆蓋度是十分低的,不同的個體間重合度也很低。我們需要從這些稀疏的數據中得到個體、群體的興趣標簽。
- 用戶興趣變化快:用戶的興趣點隨時間、熱點變化,用戶觀看了幾次關于某明星的短視頻,并不代表第二天或未來用戶會對他感興趣。我們需要分別構建用戶短期、長期的興趣標簽。
- 場景識別難:目前我們的場景識別以時間段為主,未加入地理位置信息,而后者能顯著提高細粒度場景識別的準確度。
總結
最后,總結一下文中提到的兩種用戶畫像。User Persona 可以幫助我們形象的了解目標用戶的行為特征,作為我們判斷用戶需求的依據;User Profile 從用戶行為中構建各種標簽,在用戶生命周期中不斷刻畫用戶意圖,輔助產品運營。
畫像標簽體系的建設是不斷迭代的過程,例如視頻產品中,新的視頻、新的熱門話題不斷產生,不斷地研究和調整也就必不可少。只有根據產品運營的目標,靈活調整標簽體系,才能取得最好的效果。
最后,告訴大家一個好消息:
為了幫助在運營進階路上,執著前進的伙伴們能夠更快速的提升,我們聯合了騰訊、百度等擁有10年以上經驗沉淀的實戰派導師,推出了【運營總監修煉之道】,至今已幫助5000多名運營管理者和進階者,掌握了更加系統全面的運營專業知識和管理思路,在處理類似運營戰略規劃、不同渠道運營策略和流量變現、品牌營銷玩法、數據分析等實際問題時有更清晰的解決方向!
掃描二維碼添加小助手了解詳情,還可以回復“筆記”領取【運營總監課程學習筆記】哦!
再猶豫,機會就沒啦~
作者:鄒雨晗,微信公眾號:神策數據
本文由 神策數據資深算法工程師 @鄒雨晗 原創發布于人人都是產品經理,未經許可,禁止轉載。
想跟著BAT大咖老師學習更多進階運營知識體系嗎?
在【運營總監修煉之道】,四位來自騰訊、百度等擁有10年以上經驗沉淀的實戰派導師,將和你面對面分享高階運營的系統知識,幫你掌握更加系統全面的運營專業體系和高效管理思路…….
想了解更多詳情?立即聯系Leo咨詢哦~微信/TEL:13028897966
PS:除了咨詢問題,還可以領取【運營總監課程學習筆記】! ??