構建推薦系統(tǒng):產品經(jīng)理需要做些什么
假如你是一家電商公司的產品經(jīng)理,你會怎么搭建好一個推薦系統(tǒng)?這篇文章里,作者就嘗試做了解答,并從需求定義、數(shù)據(jù)準備、技術實現(xiàn)和評價標準這四個方面做了梳理,一起來看看吧。
引言:當我們?yōu)g覽購物平臺時,我們總會發(fā)現(xiàn)平臺會根據(jù)我們?yōu)g覽軌跡或購買過的物品進行相關商品的推薦,以便我們更好的查看和進行下單。這智能的背后,離不開推薦算法的加持。下面站在產品經(jīng)理的視角,讓我們一起理解搭建推薦系統(tǒng)的全過程吧。
首先,作為產品經(jīng)理我們要清晰推薦系統(tǒng)的核心是推薦算法的應用。因此,在我們開始構建推薦功能之前,我們先了解一下常用的推薦算法都有哪些。其實,推薦算法在機器學習還沒有興起的時后就有需求和應用了。概括來講,大致可以分為以下3類:
類型1:基于內容的推薦
這一類推薦算法一般依賴于自然語言處理NLP的一些知識, 大致邏輯是通過挖掘文本的TF-IDF特征向量,來得到用戶的偏好,其基本思路是根據(jù)用戶已經(jīng)喜歡的內容,推薦類似的內容給用戶。
這種推薦算法的優(yōu)勢是不需要用戶歷史數(shù)據(jù),只需要對物品(如文章、電影等)進行描述即可。但這種算法只考慮物品的屬性,而沒有考慮用戶的交互行為,可能會出現(xiàn)無法推薦用戶感興趣但是沒有被描述到的物品的情況。并且某些物品的屬性難以獲取或者需要人工標注,因此建立物品描述需要投入大量的時間和人力成本。
類型2:基于規(guī)則的推薦
這類算法常見的比如:基于最多用戶點擊,最多用戶瀏覽等,屬于大眾型的推薦方法,在目前的大數(shù)據(jù)時代并不主流,多為人為干預,大都應用于平臺初創(chuàng)階段。
類型3:協(xié)同過濾推薦
協(xié)同過濾是推薦算法中目前最主流的種類,大致邏輯是基于用戶的歷史行為和與其他用戶的相似性來推薦物品。一般來講,協(xié)同過濾分為3種類型:
- user-based(基于用戶的協(xié)同過濾)
- item-based(基于物品的協(xié)同過濾)
- model-based(基于模型的協(xié)同過濾)
其中,基于用戶的協(xié)同過濾主要考慮的是用戶和用戶之間的相似度。比如:只要找出相似用戶喜歡的物品,并預測目標用戶對對應物品的評分,就可以找到評分最高的若干個物品推薦給用戶。
而基于物品的協(xié)同過濾和基于用戶的協(xié)同過濾類似,只不過轉向找到物品和物品之間的相似度,只有找到了目標用戶對某些物品的評分,那么就可以對相似度高的類似物品進行預測,將評分最高的若干個相似物品推薦給用戶。比如你在網(wǎng)上買了一本機器學習相關的書,網(wǎng)站馬上會推薦一堆機器學習,大數(shù)據(jù)相關的書給你。
那有意思的問題來了:在我們現(xiàn)實場景中,針對m個物品,m個用戶的數(shù)據(jù),只有部分用戶和部分數(shù)據(jù)之間是有評分數(shù)據(jù)的,其它部分評分都是空白。但此時需要我們用已有的部分稀疏數(shù)據(jù)來預測那些空白的物品和數(shù)據(jù)之間的評分關系,找到最高評分的物品推薦給用戶。怎么辦?
這就不得不用到機器學習的思想來建模解決了,也就是是基于模型的協(xié)同過濾算法,目前主流的比如:用到關聯(lián)規(guī)則算法、聚類算法、分類算法、回歸算法等。因這些算法涉獵點較多,筆者就不占用篇幅在這里展開了,大家后續(xù)可以查閱資料進行了解。
好了,基于上述筆者對常用推薦算法的介紹,假如你是一家電商公司的產品經(jīng)理,公司經(jīng)過一年多的用戶運營和供應鏈的打造,業(yè)務已進入高速增長階段,但平臺無法體現(xiàn)用戶給對于商品的偏好情況,也無法滿足供應商的曝光度。公司領導希望你牽頭打造一個mvp推薦系統(tǒng),那么你接下來需要做些什么呢?
筆者大致總結了4點,分別是需求定義、數(shù)據(jù)準備、技術實現(xiàn)和評價標準。下面我們一起來看看吧。
一、需求定義
需求定義,這個不用過多解釋,它是產品經(jīng)理的必備技能。在需求定義階段,常規(guī)闡述邏輯氛圍三個部分:需求背景、邏輯交互和預期目標。
1. 需求背景
我們以此次推薦系統(tǒng)為例,公司電商平臺“千人一面”的人工干預邏輯已無法響應公司業(yè)務的高速發(fā)展,無法滿足用戶對商品偏好的評估。為此,公司需要搭建一套推薦系統(tǒng),滿足“千人千面”需求。
2. 邏輯交互
邏輯交互,在需求定義階段,是非常關鍵的環(huán)節(jié)。這個階段描述的清晰與否直接影響后續(xù)的結果。
在這個階段,產品經(jīng)理要對推薦系統(tǒng)進行詳盡的描述,包括:用戶流程、模型訴求、現(xiàn)有數(shù)據(jù)等。比如:新/老用戶推薦策略、對所采用模型準確率、召回率、覆蓋率等詳細要求等??傊?,這個環(huán)節(jié)產品經(jīng)理主打一個詳細,避免后期被算法工程師懟的啞口無言。
3. 預期目標
有句話說的非常好,需求的背后是KPI。這個世界上沒有無中生有的事情。因此,作為產品經(jīng)理在需求定義階段,需要將預期目標定義清楚,不能模棱兩可。在這個環(huán)節(jié)上,產品經(jīng)理需要對平臺所處階段、平臺往期數(shù)據(jù)和未來公司投入進行詳盡的分析,從而根據(jù)公司業(yè)務的實際情況指定相應的指標。如對應的CTR、CVR等。
二、數(shù)據(jù)準備
數(shù)據(jù)對于推薦系統(tǒng)是非常重要的。作為產品經(jīng)理,我們在搭建推薦系統(tǒng)之前,我們要完成大量的數(shù)據(jù)收集和整理工作。并且要形成清晰的數(shù)據(jù)分類。如電商平臺的業(yè)務數(shù)據(jù)有哪些、埋點日志以及廣告渠道商能提供的數(shù)據(jù)等。
其實,在數(shù)據(jù)準備環(huán)節(jié)特別考驗產品人員的全局能力。優(yōu)秀的產品經(jīng)理在電商平臺建設初期對未來需要哪些數(shù)據(jù)、如何進行數(shù)據(jù)埋點早已進行了設定。一般不會出現(xiàn)沒有數(shù)據(jù)在臨時抱佛腳的尷尬局面。
有了平臺所需的數(shù)據(jù)之后,產品經(jīng)理只需告訴算法工程師數(shù)據(jù)源在哪里即可,后續(xù)算法同學會自行抽數(shù)。然后就是后面模型構建的環(huán)節(jié)了。
三、技術實現(xiàn)
從項目管控上來看,在推薦系統(tǒng)的項目建設過程中會涉及兩波技術團隊,分別是算法團隊和應用研發(fā)團隊,并且兩個團隊是并行進行的。 因此作為產品經(jīng)理,我們除了要關注算法工程師的模型構建,同時也要關注推薦系統(tǒng)工程的整體設計。
具體來說,對于系統(tǒng)工程的整體設計,產品經(jīng)理要關注推薦系統(tǒng)進行一次完整推薦會涉及哪些系統(tǒng)模塊,它們和算法模型是怎么交互的,數(shù)據(jù)流向什么樣,產品的關鍵邏輯是在哪個模塊中實現(xiàn)的。整體來講,如果在需求定義和數(shù)據(jù)準備環(huán)節(jié)下足功夫,項目進度問題不大。反之,這個環(huán)節(jié)極容易“失控”
四、評價標準
最后,也是公司最為關注的,那就是如何評價推薦系統(tǒng)給業(yè)務提升了多少效果。其實,評估方法并不難,也是我們經(jīng)常用的AB測試,但對于推薦系統(tǒng)要想做 AB 測試,我們注意以下幾點:
- 不要同事運行太多測試,要確定測試的優(yōu)先級。避免因同時做太多測試導致效果區(qū)分不明顯。
- 實驗流量不要太小,流量太小不容易讓人信服。
- 測試時間不能太短。
在評價標準環(huán)節(jié),AB測試并不是最關鍵的,關鍵點是產品經(jīng)理需要產品經(jīng)理對指標的分析過程,以及最終給出的迭代計劃。
總之,在整個推薦系統(tǒng)搭建過程,作為一名產品經(jīng)理,我們不僅能夠清晰的設計需求,還要能夠理解數(shù)據(jù)、整理數(shù)據(jù),并對測試評估結果給與持續(xù)的迭代計劃。至于技術實現(xiàn)環(huán)節(jié),理解就好,無需過多深入。
本文由 @王振永 原創(chuàng)發(fā)布于人人都是產品經(jīng)理。未經(jīng)許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!