產品如何做到差異化?試試個性化推薦和數據挖掘

2 評論 15669 瀏覽 64 收藏 16 分鐘

本文寫給想了解AI如何助力推薦系統的朋友,并對一些常見的推薦方式進行梳理。

我們以往都強調需求,隨著過往移動互聯網時代已經極大豐富了各種需求,您還能找到哪種大的需求場景沒被滿足的嗎?幾乎沒有這樣的需求空白機會。

所以新年里產品唯一的機會點是做到跟競品有差異化,怎么能做到差異化呢?即要比競品更懂用戶,給用戶更精準的推薦,就是挖掘數據應用數據來推薦。

本文寫給想了解AI如何助力推薦系統的朋友,并對一些常見的推薦方式進行梳理。

4種主流的推薦方式

市場迄今為止,對推薦系統的分類并沒有統一的標準,但根據對淘寶產品的了解其推薦方法基本包括如下幾種:基于內容的推薦方式、協同過濾的方式、基于知識推薦、組合推薦。

下面對4種推薦方式進行介紹。

第一種:基于內容的推薦方式

基于內容的推薦(Content-Based Recommendation)系統是建立在用戶以前的行為模式基礎上的。以前的行為就是標簽值,推薦算法將產品分解為一系列標簽,并根據用戶對產品的行為(例如:購買、瀏覽)將用戶屬性也描述為一系列標簽。

如下圖:

該方式下的推薦系統為用戶提供包括用戶記錄中顯示偏好的一些信息,產品推薦并不是將用戶本身的喜好作為基礎,而是以產品本身的信息作為基礎的。比如說:如果一個用戶對智能音箱比較感興趣,過去常常搜索和智能音箱相關的信息,那么該自動推薦系統會將與智能音箱相關的其他音箱直接推薦給他。

用戶的偏好通常作為一組文本標簽,用于表示用戶喜好類型的個人資料。

淘寶搜索框就是一種應用于表現和研究用戶喜好的技術。這種方法可以將未分級的產品優先推薦給具有獨特興趣的用戶。并且以列表的功能將推薦的商品展現出來,還會對推薦的結果進行解釋,這樣會無形中增加用戶對系統推薦商品的信心。

第二種:協同過濾的推薦方式

協同過濾推薦(Collaborative Filtering Recommendation)系統是根據其他用戶的選擇然后將一個商品推薦給用戶。但是商品的內容不會被考慮到,也就是說,該方式下通過人對那個商品的判斷來進行過濾。

對協同過濾最直白的說法是就是用戶不知道怎么選擇,大家來幫他選擇。

協同過濾對應的算法分類是基于用戶的協同過濾算法和基于物品的協同過濾算法,基于用戶的協同過濾算法的關鍵是找到相同偏好的用戶。

第三種:基于知識的推薦方式

基于知識的推薦方式(Knowledge-Based ?Recommendation)可以被看做是一種推理(inference)技術。

它并不是建立在用戶偏好和需要的基礎上進行的推薦,而是通過對特定領域定義規則的基礎上來進行基于規則以及實例的推理(case-based reasoning)。

例如:通過對飯店的菜品方式的效用知識的推理,將飯店推薦給顧客。我們將某個對象如何去滿足某一特定用戶的知識稱為效用知識(function knowledge),所以它能夠解釋推薦和需求的關系,可以被用于推薦系統。效用知識必須以機器可讀的方式存在(ontology ?本體知識庫)于推薦系統中。

基于知識的推薦模型如下圖:

第四種:組合推薦的方式

組合推薦(Hybrid Recommendation)有一個重要原則,即它要求通過組合后能彌補和避免各種推薦技術所存在的缺點。

目前應用最多的是協同過濾推薦和內容推薦的組合,一般,盡管推薦組合的方法有很多種,然而不同的應用場景需要不同的組合思路。

筆者根據淘寶的經驗具體的對產品運營或者算法人員給出的組合思路大致的可以分為如下 3 類:

  1. 后融合:將大于等于兩種以上的推薦系統各自所產生的推薦結果進行融合。比如:通過使用基于協同過濾的方法以及內容的方法而得到推薦列表,對列表的結果進行融合從而決定最后所推薦的對象。
  2. 中融合:將一種推薦方法作為框架,并融合另外的一種推薦方法。比如將協同過濾的方法作為框架,融合基于內容的方法;或者將基于內容的方法作為框架,融合協同過濾的方法。
  3. 前融合:直接對各種推薦方法進行融合,如將基于協同過濾和基于內容的方法整合到一個統一的框架模型下。

今天,新的年度里,寫滿了「數據」的字樣。單純流量的價值開始褪色,化作更加不言自明的基礎設施,而如何發掘數據價值、增強數據應用,則成為了產品運營的主色調——這也成為了產品運營人員要想當團隊的領導角色必須懂數據挖掘的一般知識流程。

另外比競爭對手更懂用戶需要數據挖掘,在做推薦系統之前,也需要數據挖掘,下面我們介紹數據挖掘方面產品運營應該懂的點。

數據挖掘的過程是AI應用的過程。因為數據挖掘的過程是知識發現的過程,而知識發現是人工智能的一種典型應用。

數據挖掘的方法:

數據挖掘的方法也就是從數據庫或其他數額特別巨大的海量信息儲存中提取出用戶感興趣的文本標簽。

產品運營人員不妨偶爾從技術角度方面來看一下數據挖掘,因為它結合了采集數據和登記分類數據,接著,類規則的知識將從大量數據中被生成。

數據挖掘領域包括許多技術,如:機器學習、統計、模式識別、模型庫、數據庫、可視化等技術。產品運營懂這些技術的話一方面能夠從更多角度設計出差異化競品的產品方案,另外一方面能夠更方便的跟算法、代碼、模型、數據倉庫工程師等技術人員進行交流。

通常情況下,數據挖掘的步驟如下圖所示:

產品運營人員從知道數據挖掘的步驟流程以后,您在跟進產品進度和實現數據提供的業務支撐上能夠做到更加有信心使產品差異化競品!

上面講了數據挖掘的步驟,那么我們在從數據庫特點的角度出發,幫我們的產品運營人員介紹 8 個需要在數據挖掘過程中完成的任務。

任務一:產品運營定義好分類(Classification)

分類是最常見的數據挖掘任務。

這個任務由兩部分組成:

  • 第一部分是研究新近對象的特點;
  • 第二部分是,將它分配給一組預定義的類。

與此同時,分類有兩個主要的特點:

  • 特點一要求,要有一個定義明確的類;
  • 特點二是,要有一個包括分類例子的訓練集。

另外,還要構建某種模型,用于將未分類的數據進行分類。

第一步先將那些已經分好類的訓練集從數據中選出來,然后在該訓練集上建立分類模型,該模型的建立需要運用數據挖掘分類的技術,對那些還未進行分類的數據進行分類。

例如:

  1. ?通常將信用卡申請者,分類為高、中、低風險,
  2. ?然后用戶會被分配到預先定義好的用戶分片中。

注意:類的個數是預先定義好的并且是確定的。

任務二:出估值(Estimation)

估值是一種用來處理具有連續性預估結果的任務。 采用估值的目的是,基于一些輸入的數據,為一些連續的、未知的變量,提供一個值。比如收入、信用卡節余、身高等等。

估值和分類比較接近,所不同的是,分類是對離散型變量的輸出的描述,但是估值卻用于對連續值的輸出的處理;分類的類別數目是確定的,估值的量是不確定的。

比如:

  1. ?通過購買行為,來評估一個家庭有多少個孩子;
  2. ?通過購買行為,來評估一個家庭的收入有多少;
  3. ?估計 real estate 的價值。

任務三:給出預測(Prediction)

通常情況下,預測是通過估值或分類起作用的,即通過估值或分類得出模型,然后該模型將被應用于對未知變量來進行預測。

預測的目的是對未來未知變量進行預測,然而這種預測必須通過時間來進行驗證,也就是說必須等待一定的時間后,才能夠得出預測的準確性是多少。

任務四:相關性分組或關聯分析(Affinity grouping or association rules)

關聯的任務是用來確定哪些產品應該一起處理或者哪些事情將一起發生。

例如:假設某客戶在逛盒馬鮮生時,當該客戶在購買澳龍時,與此同時也會購買多寶魚,即 A => B(關聯規則)。

除此之外,我們產品運營人員應該懂,它對產品運營還有更深的用途,它可以應用于鑒別交叉銷售機會和設計有吸引力的產品和服務的包裝或組合。 例如:下次可以計算出澳龍與波士頓龍蝦的文本相似度,然后當波士頓龍蝦庫存較多時可以組合波士頓龍蝦與多寶魚組合起來賣。

任務五:序列模式(Sequential pattern)

序列化模式檢測事務之間的模式,在事務數據庫中,一段時間內一組項目是跟在另一組項目的后面而存在的。

例如逛盒馬鮮生的時候,用戶在購買澳龍后,隔一段時間,會購買牛排。這有點類似于關聯,但是,主要的不同點是序列模式展現出了不同產品之間在特定時間段內的重要關系, 知道序列模式后的產品運營可以合理安排供應鏈資源。

任務六:聚類(Clustering)

聚類可以對一個多樣化的群體進行分割,從而形成一些更具有相似性的群體。

聚集通過對記錄進行分組,從而將那些相似的記錄分割在一個聚集里。這些記錄之所以能夠被組織在一起,是因為他們本身就存在某種相似性。聚集同分類的不同點是聚集不會對預先定義好的類進行依賴,同時也不需要訓練集。

任務七:優化(Optimization)

優化指的是優化APP展現的設計和在線銷售的設計。

一般來說,這需要花很多的時間來考慮最優的解決方案。遺傳算法(GA)常常是用于處理優化技術的,如用于尋找解決方案的遺傳選擇、交叉和變異的優化技術。例如:遺傳算法可以為APP的頁面創建數以千種的設置和組合。

任務八:描述和可視化(Description and Visualization)

是對數據挖掘結果的表示方式。

數據挖掘的目的之一是支撐業務發展。另外可視化技術可以將隱藏在表格或文本中的聚類和聯系直觀且迅速地展示在人們面前。

數據挖掘可以用來描述一個廣泛的運營活動。

例如:一家4S銷售公司可以利用這項技術,來挖掘用戶反饋的歷史數據,建立許多預測模型,并做出相應的對策,比如:用一條短信,或者打一個電話,來對客戶進行游說。

時下常常能看到「后移動互聯網」、「未來十年最好的一年」等聳人聽聞又模棱兩可的話語,告別了流量就是一切的時代,我們產品運營對于數據為基礎,AI算法為突破的學習與思考從未像今天這樣急需和尖銳。

由于移動互聯網的普及和個性化的社會趨勢,數據挖掘技術將會被普遍用來分析用戶購買的產品服務的行為。這是為了找出用戶的偏好,并為用戶提供相關產品信息,以增加銷售額和銷售價格。

那么先知道數據挖掘流程先挖掘出來用戶的喜好的產品運營團隊再配合推薦算法,這樣就可以在產品運營上領先競品一步。

如果你想系統化入門AI產品經理,掌握AI產品經理的落地工作方法,戳這里>http://996.pm/7bjab

#專欄作家#

連詩路,公眾號:LineLian。人人都是產品經理專欄作家,《產品進化論:AI+時代產品經理的思維方法》一書作者,前阿里產品專家,希望與創業者多多交流。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 把數據做好去挖掘客戶需求

    回復
  2. 數據挖掘工程師的重要性

    回復