為什么你的 App 知道你想買(mǎi)什么?
你有沒(méi)有感到疑惑過(guò),當(dāng)你想買(mǎi)某件東西的時(shí)候,它會(huì)出現(xiàn)在你的推薦頁(yè)首頁(yè)。
數(shù)字生活讓人疑神疑鬼。
你剛在微信上和朋友說(shuō)要去日本玩,就在朋友圈看到了機(jī)票廣告,你老婆剛給你打電話讓你買(mǎi)奶粉,你就在淘寶看到了奶粉推薦。
這些廣告都是怎么來(lái)的?為什么這些 APP 都知道你想買(mǎi)什么?
淘寶當(dāng)然不會(huì)竊聽(tīng)你的電話,是你的行為數(shù)據(jù)讓淘寶意識(shí)到了你需要嬰兒奶粉。
注冊(cè)一個(gè)賬號(hào),你需要輸入自己的名字,手機(jī)號(hào),有時(shí)候還會(huì)補(bǔ)充性別,所在地。但這只是微不足道基礎(chǔ)數(shù)據(jù)。
更重要的,是你的消費(fèi)記錄,打車(chē)頻率,關(guān)注的公眾號(hào),玩過(guò)的游戲,理財(cái)習(xí)慣,有沒(méi)有車(chē)貸房貸買(mǎi)過(guò)保險(xiǎn),發(fā)過(guò)的紅包,這些行為最后會(huì)變成幾千個(gè)事實(shí)標(biāo)簽,成為你行為數(shù)據(jù)的一部分。
采集事實(shí)標(biāo)簽并不難,難的是建立模型,從雜亂的標(biāo)簽中找到你真正的興趣,進(jìn)而構(gòu)建用戶畫(huà)像。
舉個(gè)例子,你打開(kāi)一篇內(nèi)容標(biāo)簽為美女的文章,并不意味著你真的愛(ài)看美女,可能只是不小心點(diǎn)到。這時(shí),就需要通過(guò)你更多的行為來(lái)判斷這篇文章對(duì)你的吸引力。
這是一個(gè)非常初級(jí)的內(nèi)容標(biāo)簽權(quán)重算法:
興趣標(biāo)簽(美女)權(quán)重 = 行為權(quán)重 x 訪問(wèn)時(shí)長(zhǎng) x 衰減因子
- 行為權(quán)重:什么都不干1分,評(píng)論+0.5,點(diǎn)贊+0.5,轉(zhuǎn)發(fā)+2,收藏+1
- 時(shí)長(zhǎng)權(quán)重:10S以內(nèi)權(quán)重為0.5,10S-60S為1,60S以上為2
- 衰減因子:0-3天內(nèi)權(quán)重為1,3-7天權(quán)重為0.85,7-15天權(quán)重為0.7,15-30天權(quán)重為0.5,30天以上權(quán)重為0.1
行為權(quán)重對(duì)應(yīng)你是否有評(píng)論、點(diǎn)贊、轉(zhuǎn)發(fā)、收藏等操作,不同操作有不同的數(shù)值,累加成行為權(quán)重。
停留時(shí)間越長(zhǎng),時(shí)間權(quán)重也越高。最后,短期行為也無(wú)法代表長(zhǎng)期興趣,單次閱讀行為的權(quán)重會(huì)隨著時(shí)間流逝不斷衰減。
于是,你每次打開(kāi)美女類內(nèi)容都會(huì)生成一個(gè)興趣權(quán)重,把一段時(shí)間內(nèi)你所有的美女類興趣權(quán)重進(jìn)行累加,再用 S 形函數(shù)標(biāo)準(zhǔn)化,就能得到一個(gè)「0—10」區(qū)間的興趣標(biāo)簽值。
數(shù)值越高,你對(duì)美女就越感興趣。
除了內(nèi)容興趣,這種算法思路可以在消費(fèi)能力,消費(fèi)興趣,社交習(xí)慣等多個(gè)維度建立模型,計(jì)算你的偏好。
之后,這些偏好會(huì)被轉(zhuǎn)換為特征向量。假設(shè)你的美女興趣標(biāo)簽值是8,消費(fèi)能力是5,社交偏好是2,就可以用向量表示為 r (8,5,2)。
我們可以把特征向量理解成多維空間上的一個(gè)坐標(biāo),通過(guò)把每一個(gè)用戶的向量坐標(biāo)帶入余弦公式或距離公式中,就能計(jì)算出和你相似的人,進(jìn)而把用戶分類。
但行為數(shù)據(jù)只能計(jì)算偏好,無(wú)法判斷你的性別、學(xué)歷等個(gè)人屬性。
這就需要把已知性別和學(xué)歷的用戶作為樣本,一部分用來(lái)訓(xùn)練模型,一部分測(cè)試準(zhǔn)確度。今天各大平臺(tái)對(duì)于用戶性別的預(yù)測(cè)準(zhǔn)確度已經(jīng)可以達(dá)到90%以上。
最后,微信淘寶們就能得到一個(gè)這樣的用戶畫(huà)像:
這樣,廣告主就可以找到他們想要的消費(fèi)者了。
這是騰訊廣告投放平臺(tái)的后臺(tái)。廣告主可以自由組合包含消費(fèi)水平、婚戀情況、內(nèi)容興趣,消費(fèi)行為在內(nèi)的上千個(gè)定向標(biāo)簽供,最后選定廣告位和投放時(shí)間,根據(jù)系統(tǒng)計(jì)算的 1.5 元每千次曝光的建議出價(jià),就完成了一次精準(zhǔn)投放。
之后,一個(gè)住在北京朝陽(yáng)有過(guò)奶粉消費(fèi)記錄的已婚男青年在即將刷到廣告位的那一瞬間,廣告平臺(tái)會(huì)發(fā)起競(jìng)價(jià)請(qǐng)求,最后,價(jià)高的廣告將出現(xiàn)在你的眼前。
如果你對(duì)這個(gè)話題感興趣,可以在騰訊廣告平臺(tái)的開(kāi)發(fā)者文檔,進(jìn)一步了解你的行為數(shù)據(jù)被處理到了什么樣的程度,比如篩選出“ 2017.7.1 至 2017.7.15 去過(guò)上海機(jī)場(chǎng) 3 次以上的人”。
另外,通過(guò)行為推薦商品的效果往往不如通過(guò)同類推薦商品。找到和你一樣的人,把他們的的瀏覽和消費(fèi)記錄推薦給你,往往比直接猜你喜歡什么效果更好。
需要說(shuō)明的是,微信淘寶們采集的行為數(shù)據(jù)不僅只對(duì)應(yīng)你的賬號(hào),更與你的手機(jī)唯一識(shí)別碼綁定在一起。
*安卓手機(jī)上可以采集到的的唯一設(shè)備編碼叫 IMEI,在 iPhone 上叫 IDFA
這意味著, 你就算不注冊(cè)不登錄,你的行為數(shù)據(jù)一樣會(huì)被采集。
同時(shí),廣告平臺(tái)也可以根據(jù)你的手機(jī)識(shí)別碼在其他 App 上為你投放廣告,這樣,你刷抖音的時(shí)候也能看到淘寶的奶粉廣告了。
別太緊張,根據(jù)《個(gè)人信息安全規(guī)范》,商業(yè)廣告平臺(tái)的所有標(biāo)簽都應(yīng)該避免精確定位到個(gè)人,以保護(hù)你的隱私安全 。
如果你是 iPhone 用戶,還可以通過(guò)在設(shè)置中關(guān)閉 IDFA 碼限制 App 們對(duì)你的數(shù)據(jù)采集。
作者: 吳松磊,公眾號(hào):回形針PaperClip(ID:papercliptv)
來(lái)源:https://mp.weixin.qq.com/s/0Mn2DBGq6JLvMjPQdDIAvQ
本文由 @回形針PaperClip 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
《個(gè)人信息安全規(guī)范》是個(gè)好東西 感謝作者
非常棒 自己的產(chǎn)品正需要往這方面走 期待更多內(nèi)容 辛苦
你在做什么產(chǎn)品呢?
淘寶只推薦我曾經(jīng)買(mǎi)過(guò)的東西。異常雞肋。
本文章圖片來(lái)自于回形針。
我是錘子手機(jī)怎么辦
太嚇人了
天天推同樣的東西,推送越來(lái)越窄
我也感覺(jué)這種推薦有兩面性啊,難道客戶不常買(mǎi)的東西就沒(méi)需求了?
為什么淘寶總會(huì)推薦我已經(jīng)買(mǎi)過(guò)的商品?
因?yàn)橛X(jué)得你會(huì)繼續(xù)買(mǎi)??
寫(xiě)的好,動(dòng)圖也好,贊!
棒
一個(gè)字一個(gè)字仔仔細(xì)細(xì)反復(fù)的讀完,漲姿勢(shì)了,解鎖了新大陸
漲知識(shí)了,漲知識(shí)了
然而并不知道,淘寶都是我買(mǎi)完了還一個(gè)勁推,要告訴我買(mǎi)貴了嗎?幫客戶做設(shè)計(jì),搜了一些狗糧給我推了好久狗糧。
很棒~~
終于了解 我刷一個(gè)淘寶的商品 頭條就推薦了這個(gè)產(chǎn)品的廣告鏈接了
寫(xiě)的挺好的,不知道什么時(shí)候可以再出高級(jí)的權(quán)重算法? ??
大佬,安卓機(jī)怎么關(guān)閉?