搜廣推策略產品:灰盒“look alike”策略在微信看一看上的應用(下篇)

1 評論 2838 瀏覽 7 收藏 9 分鐘

如何通過RALM模型框架實現種子人群擴展的思想,達成“準而全”的營銷投放述求呢?本文作者通過微信看一看廣告資源位場景下的實例,對“Look alike”策略進行了分析,一起來看一下吧。

上篇講完“look alike”常見的機器學習&深度學習策略,我們今天找個具體在微信看一看廣告資源位場景下的實例,更加深切感受一下look alike的策略,如何通過RALM模型框架實現種子人群擴展的思想,如何達成“準而全”的營銷投放訴求。

一、RALM模型框架在微信看一看中的應用

RALM模型框架說明

大體的過程主要分成三個模塊,分別是最下層的離線訓練、到在線異步處理,再到在線服務。

1. 離線訓練

離線訓練架構圖

離線訓練,主要包含representation learning(用戶表示學習)和look alike learning(用戶相似性學習),進行完 look alike learning 之后,可以把 user 經過全連接層的 user 表達 Eu緩存起來。全量用戶,有10多億,可以 catch 到 KV 中??梢蕴峁┙o在線服務做緩存,線上不用做實時全量傳播。

1)representation learning(用戶表示學習)

用戶表示學習

這個模型有點類似經典的Youtube 的 DNN雙塔模型,左側下班部分是用戶的各種Feature,通過embeding lookup 然后再pooling,最后把所有的特征做融合,過一個全連接層就輸出了User emedding;右邊則是感興趣的item,也會做embedding生成。最后要預測內容:用戶在點擊了這么多 item 之后,下一個要點擊的 item,最后要預測的就是表達用戶興趣的 embedding。(每個域表示一個行為分布,例如電商下單行為、公眾號閱讀行為)

2)Look-alike learning(用戶相似性學習)

用戶相似性學習

一個種子用戶需要包含的信息,可以先做假設,種子用戶的表達= 共性信息+個性信息。

  • 每個用戶都有自己的興趣,但對整個群體的人群信息存在不同的貢獻度,我們稱為群體的共性信息:global info。共性信息和目標用戶無關,只和用戶群體自身有關。
  • 種子用戶群體的個性信息。種子群體中一定存在一小部分用戶和 target 用戶興趣相似,這時,當 target 人群變化時,信息會變化,稱為 local info。

獲取global info的用戶的embedding,首先用 global attention,只和 user 相關,和 attention merge 的方法類似,也是一個 self-attention。作用是把種子用戶乘以矩陣轉換,再乘以種子用戶自己,所做的就是捕捉用戶群體自身內部的興趣分布。

local info呢,它的公式是把種子用戶的矩陣乘以 w,再乘以 target user 的 embedding,再做一層 softmax,再乘以種子用戶自己,這是一個典型的乘法 attention。它的作用是提取種子用戶群體中和 target user 相關的部分,捕獲種子用戶的 local info。是一個用公式得到的這兩種 local & global embedding 之后,進行加權和,這就是種子用戶群體的全部信息。

2. 在線異步處理

在線異步處理架構圖

離線訓練結束后,是在線異步處理,主要作用是某些可以離線且和線上請求無關的計算,可以先計算完,如更新種子用戶。每個 item 候選集都會對應一個種子用戶列表,更新種子用戶列表,可以每一分鐘更新一次,這和訪問用戶無關,只和候選集的 item 有關??梢詫崟r拉取用戶的點擊日志,更新點擊某個候選集的種子列表,保證種子用戶實時性。

  • 可以把 global embedding 預計算 ( gl 只和種子用戶有關,是 self-attenion,可在線做異步處理,如每隔一分鐘算一次 )。
  • 計算 k-means 聚類中心,也是只和種子用戶有關,可以提前計算好,如推到推薦系統內存中。
  • 所有的東西都是定時更新,不需要線上實時計算。

3. 在線服務

在線服務說明

線上把聚類中心、global embedding 和所有用戶的 embedding 都已緩存好,只需要拉取 user embedding,和候選集的 global embedding 和聚類中心。線上只需要計算 local embedding,是 target user 到種子用戶的 attention,這需要根據線上請求的 urn 來實時計算。再計算一次 cosine,就可以得到相似度,這個計算量很小。

4. 最后實驗結果

在微信看一看上的實驗結果

算出 look alike 相似度之后,相似度的分數,可直接給到排序服務,做曝光依據。這是當時原文作者寫論文之前做的在線計劃 AB testing結果,對比的是用戶畫像匹配推送的策略,上線之后,在擴大曝光規模的前提下,CTR 基本正向穩定+1.09%(說明獲取到了更多相關性的流量),種類豐富性+8.435%,標簽豐富多樣性+15.938%,說明在擴展過程中同時也獲得了更多多樣性展開的流量。

二、關于look-alike定向策略總結與思考

Look-alike策略RALM模型的在微信看一看策略大體如上,整體上的思路從用戶興趣特征出發,去探究用戶的個性興趣和人群共性興趣去探索種子人群的邊界,并且在上線實驗中也取得了明顯的收益效果,通過離線+在線計算的方式保證了種子人群的實時性和效果。

業界還有非常多關于Look alike的論文,我在這里就不一一枚舉了,像是阿里媽媽目標人群擴展策略、網易云音樂種子人群擴展策略等等。

和大家一起在策略產品道路上“日拱一卒,功不唐捐”,幫助你成為極具職場壁壘的策略產品,如果有幫助到大家歡迎點贊、收藏以及評論一下。

作者:策略產品Arthur,5年大廠策略產品專家。

本文由 @策略產品Arthur 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 關注作者介紹 了解更多策略產品知識

    來自北京 回復