以微信為例,聊聊在內(nèi)容推薦上AI的一些應用實踐
編輯導語:AI與產(chǎn)品的融合早已經(jīng)不是什么新鮮事,微信作為內(nèi)容產(chǎn)品服務的一大提供者,自然也離不開內(nèi)容推薦。而內(nèi)容推薦與AI的結(jié)合,對微信來說是一大機遇和挑戰(zhàn)。本文作者以微信為例,和我們聊一聊在內(nèi)容推薦上,AI都有哪些應用實踐。
內(nèi)容推薦一直是流量分發(fā)中十分常見的應用方向,如頭條的資訊、抖音的短視頻、網(wǎng)易云音樂等等。而微信也從去年開始逐漸推出更多內(nèi)容產(chǎn)品服務,包括視頻號、直播、看一看等等,對于微信而言既是機會也是挑戰(zhàn)。
機會意味微信已經(jīng)開始探索出屬于自己的內(nèi)容成長方向,挑戰(zhàn)則是在如何在龐大的流量上,管好內(nèi)容的質(zhì)量輸出、推薦服務體驗。
而本文也將基于微信當前的內(nèi)容產(chǎn)品服務,聊一聊微信將在多個場景服務上,都可能會進行哪些AI能力實踐(值得說明一下的是,本文無意從技術(shù)角度探究AI原理,更多從應用場景出發(fā)了解當前的實踐情況)。
1. 到底什么是內(nèi)容推薦?
在當下娛樂高度消費的社會,每個人幾乎每天都在接觸不同的內(nèi)容產(chǎn)品服務。尤其是現(xiàn)在推薦算法越發(fā)成熟,對用戶和內(nèi)容的理解越發(fā)深刻。
諸如頭條的資訊、抖音的短視頻或網(wǎng)易云音樂等等,但這些都是只是用戶能接觸最表層的“事物”,要想提供這樣的服務,背后有著一套成熟的體系。所以在這里也先簡單科普下,什么叫內(nèi)容推薦服務。
以上就是一套典型的內(nèi)容推薦服務體系,具體可以劃分3部分:基礎服務>內(nèi)容識別+用戶畫像>推薦引擎。
1.1 基礎服務
所謂基礎服務,即搭建整個系統(tǒng)服務所需的一些基礎能力。基于內(nèi)容、用戶及推薦引擎環(huán)節(jié),這樣的基礎服務需要涉及內(nèi)容源、工程、數(shù)據(jù)等方面的能力支撐。
- 內(nèi)容源:主要包含內(nèi)容的引入存儲、處理管理,把眾多非結(jié)構(gòu)化的數(shù)據(jù),或者不同形態(tài)格式的內(nèi)容數(shù)據(jù),以統(tǒng)一結(jié)構(gòu)化的形式管理,便于為后續(xù)內(nèi)容識別提供統(tǒng)一的方案;
- 工程:對于這樣的能力,需要工程端給予性能優(yōu)、高可用的研發(fā)能力支撐,對服務的計算效能、算法模型的推理服務等都需要較強的支撐;
- 數(shù)據(jù):在整套服務中,數(shù)據(jù)是不可或缺的,對于內(nèi)容的數(shù)據(jù)、用戶的數(shù)據(jù)等等,都構(gòu)筑了以“用戶”維度的畫像特征,本質(zhì)上推薦服務把合適的內(nèi)容分發(fā)給合適的用戶,那么從數(shù)據(jù)維度識別用戶,就必不可少,而關鍵的數(shù)據(jù)就包含用戶信息數(shù)據(jù)(頭像、昵稱、身份信息等)、行為數(shù)據(jù)(如當前位置、操作偏好等等)。
1.2 內(nèi)容識別
這是本文的重點探討內(nèi)容,在推薦服務中,我們要把“內(nèi)容”這一具體物品給到用戶手上,在此前提上是要對內(nèi)容進行恰當?shù)睦斫庾R別,來支撐更好的推薦。
而這道工序就涉及內(nèi)容安全、內(nèi)容質(zhì)量及內(nèi)容體驗等關鍵應用場景,而這部分就涉及大量AI能力的輸出。下文也將重點探索微信是如何在這一環(huán)節(jié)進行AI能力實踐,這里也簡單介紹幾個關鍵的算法技術(shù)方向:
- NLP:Natural Language Processing,即自然語言處理,通俗來講就是研究計算機如何理解人類語言并能進行相關的意圖思考。而時下文本識別、關鍵詞抽取等能力輸出,主要就是立足于這一技術(shù);
- CV:Computer Vision,即計算機視覺,任何關于圖片、視頻等形式,都主要應用這一技術(shù)能力;
- ASR:Automatic Speech Recognition,即自動語言識別技術(shù),是一種將人的語音轉(zhuǎn)換為文本的技術(shù),例如把視頻中的音頻轉(zhuǎn)譯為文本,從而通過文本識別方式進行處理。而這一技術(shù)難度主要在于環(huán)境干擾程度、語言種類及詞匯表豐富性等等。
1.3 用戶畫像
前面也提到,對內(nèi)容識別的同時,也需要對“用戶”進行刻畫識別,只有對兩方面都進行充分識別,那么推薦引擎?zhèn)炔拍苓M行更好的分發(fā)。
而用戶畫像本質(zhì)上也是對用戶打標簽,至于需要打什么標簽,就依賴推薦策略的制定,但基本的身份信息、生理特征、興趣偏好等等都是需要具備的。
1.4 推薦引擎
一個推薦模型的部署,依賴標簽數(shù)據(jù)、推薦策略等形式的組合,其中標簽數(shù)據(jù)即來源于對內(nèi)容、對用戶的識別數(shù)據(jù),而推薦策略則基于業(yè)務目標等方式制定,比如基于內(nèi)容排序推薦、基于協(xié)同過濾排序推薦、基于用戶行為偏好等等。
以上就是一套完整的內(nèi)容推薦服務,其中本文重點探討的就是“內(nèi)容識別”這一環(huán)節(jié)。
2.?微信的內(nèi)容產(chǎn)品矩陣
此前微信的內(nèi)容產(chǎn)品更多的是提供多入口的流量曝光,而在推出視頻號和直播之后,都開始嘗試以“推薦”為形式的內(nèi)容分發(fā)。
而這樣的推薦,已經(jīng)不僅僅是社交好友間的推薦,更多需要“平臺”去介入。但是由于推出了較多內(nèi)容產(chǎn)品,不同的內(nèi)容服務其內(nèi)容源是不一樣的,這就意味著微信需要更多去理解它們當前的“內(nèi)容畫像”。
從上圖可以看出,搭建目前已有的內(nèi)容產(chǎn)品服務涉及3個關鍵環(huán)節(jié):
2.1 基礎平臺
搭建這樣的內(nèi)容生態(tài)服務,少不了底層服務支撐相應的“內(nèi)容消費品”,像微信公眾號提供內(nèi)容推文,微信廣告管理廣告素材的上傳、審核及投放,又或者微信應用本身可以發(fā)布相應的長短視頻、社交信息(文本、圖片、視頻、語音等)。
2.2 內(nèi)容信息
通過基礎平臺所提供的能力,支撐了當前大家所熟知的各類內(nèi)容形態(tài)的生產(chǎn)。如文本方面,社交聊天的文字信息、廣告素材的標題文案、公眾號的推文等等。
而這些將積累成為微信一大價值資源,即原創(chuàng)內(nèi)容源,而微信也可以借助巨大的流量再結(jié)合這些內(nèi)容資源,打造相應的內(nèi)容服務。
2.3 內(nèi)容產(chǎn)品
對于大眾用戶而言,最終能夠接觸和消費體驗的內(nèi)容服務,就是應用表層。而微信在相繼推出完視頻號和直播后,已經(jīng)基本形成內(nèi)容產(chǎn)品的應用雛形。
即推薦、廣告及搜索于一體的內(nèi)容產(chǎn)品服務,如推薦中的公眾號推文、視頻號、直播等等,廣告中的朋友圈廣告、公眾號廣告?;旧弦呀?jīng)延伸了大眾用戶日常場景中所能觸達的地方。
3. 一些常見的算法評估指標
為方便理解,這里也簡單介紹下AI算法能力的常見評估指標:準確率、精確率、召回率、漏報率、誤報率。
假設當前有100個視頻樣本集(已去重),其中是電影類視頻(正樣本)的為70個,非電影類視頻(負樣本)的為30個。而針對這一批樣本集,算法識別為電影類的視頻為80個,非電影類20個。
其中人工驗證發(fā)現(xiàn)算法識別為電影類80個中實際正確為65個(正樣例),剩下15個實際為非電影類(負樣例)。識別為非電影類20個中實際正確為15個(負樣例),剩下5個為電影類樣本(正樣例)。
3.1 準確率
即算法準確識別正樣本為正樣例和負樣本為負樣例的總個數(shù),在所有樣本的占比,公式為:
準確率=(算法預測正確的正負樣本內(nèi)容/所有樣本內(nèi)容)*100%
假設算法識別100個視頻中為電影類視頻有80個,其中65個是正確的電影類內(nèi)容(正樣例),剩余20個非電影類視頻中15個正確的非電影類內(nèi)容(負樣例),則為:(65+15)/100*100%=80.00%。
3.2 精確率
即算法正確識別正樣本為正樣例的對象,在所有識別對象(包含負樣例錯誤認為正樣例)的占比,公式為:
精確率=(算法預測正確的內(nèi)容/算法預測的所有內(nèi)容)*100%
假設算法識別100個視頻中為電影類視頻有80個,其中在數(shù)據(jù)驗證中發(fā)現(xiàn)80個里面有65個是正確的,則為:65/80*100%=81.25%。
3.3 召回率
即算法正確識別正樣本為正樣例的對象,在所有內(nèi)容池中實際正樣本的占比,公式為:
召回率=(算法預測正確的內(nèi)容/所有正確的內(nèi)容)*100%
假設算法識別100個視頻中為電影類視頻有80個,其中在數(shù)據(jù)驗證中發(fā)現(xiàn)80個里面有65個是正確的,而100個視頻中真正為電影類的70個,則為:65/70*100%=92.85%。
3.4 漏報率
即算法識別為正樣例但實際為負樣例的對象,在所有內(nèi)容池中正樣本的占比,公式為:
漏殺率=(算法預測錯誤的正確內(nèi)容數(shù)/所有實際的正確內(nèi)容數(shù))*100%
假設算法識別100個視頻中為電影類視頻有80個,即認為剩下20個為非電影類,而在數(shù)據(jù)驗證下發(fā)現(xiàn)20個中有5個實際是正確的(即算法未識別到),則為:5/70*100%=7.14%。
3.5 錯報率
即算法識別為負樣例但實際為正樣例的對象,在所有內(nèi)容池中負樣本的占比,公式為:
錯報率=(算法預測正確的錯誤內(nèi)容數(shù)/所有實際的錯誤內(nèi)容數(shù))*100%
假設算法識別100個視頻中為電影類視頻有80個,其中在數(shù)據(jù)驗證中發(fā)現(xiàn)80個里面有15個實際是錯誤的,而100個視頻中實際為非電影類的有30個,則為:15/30*100%=50.00%。
以上就是算法常規(guī)的效果驗證指標,而通常精確率、召回越高即代表效果越好。
但是不同的業(yè)務場景不同,標準是不一樣的,有些可能要求高精確低召回,也可能是高精確高召回,所以指標效果基準看業(yè)務需求而定。但整體重要性依次為:準確率>精確率>召回率。
4.?內(nèi)容推薦上的一些AI實踐
大家所接觸被”推薦“的內(nèi)容,其實是被加工處理過,是一個近乎合適正確的內(nèi)容給到用戶手上。但是要做到這個地步,就需要不少的“潛在”工作。在內(nèi)容推薦服務中,其實還具備“內(nèi)容安全”、“內(nèi)容質(zhì)量”和“內(nèi)容體驗”等3個環(huán)節(jié)的場景需求。
而在斯洛五層次需求里,對應的便是“生理安全需求”及“尊重需求”。那么接下來,將進一步研究在這3個環(huán)節(jié)上,微信是如何發(fā)揮AI技術(shù)能力的價值輸出。
4.1 內(nèi)容安全
上圖是微信公眾號平臺官方規(guī)范,包含了諸多方面。實際上內(nèi)容安全是內(nèi)容推薦中的第一步,也是最基礎的一步。
而這里的安全指所推薦的內(nèi)容服務符合國家、行業(yè)、平臺及用戶自身等權(quán)利義務和法律法規(guī)要求的規(guī)則。廣義上包括了平臺內(nèi)外的“合規(guī)安全”,平臺外指國家規(guī)定、行業(yè)法律等,平臺內(nèi)則指平臺規(guī)則、權(quán)利義務等。
具體來說:
- 平臺外:國家層面是否涉恐、涉政、黃賭毒等,行業(yè)層面是否侵犯版權(quán)(原創(chuàng)聲明)、是否冒認等;
- 平臺內(nèi):基于平臺的產(chǎn)品服務和特性,進行平臺產(chǎn)品的使用規(guī)范,如禁止辱罵、廣告、低俗、灌水等。
針對以上的敏感內(nèi)容,作為一個內(nèi)容平臺是要對其進行安全審核。這里的審核通常是機器審核和人工審核并行,而AI就是做的機器審核。
4.1.1 場景價值
安全是產(chǎn)品是否能持久發(fā)展的生命線,如果一旦觸碰底線,對網(wǎng)絡公共環(huán)境、文化傳播都有較大的負面影響。一旦平臺出現(xiàn)觸碰底線的內(nèi)容,輕則舉報投訴或下線整改,重則可能直接被關停。
大家可以留意為什么會經(jīng)常有”談話“,以及為什么時不時會有些“產(chǎn)品”被點名并要求各應用商店下架,其中一部分原因就是產(chǎn)品服務在傳播有損公共利益,造成不良影響的內(nèi)容。所以不管是哪家公司產(chǎn)品,這都是需要十分關注的。
4.1.2 能力輸出
當前行業(yè)內(nèi),對內(nèi)容安全審核這一環(huán)都有各自成熟的產(chǎn)品能力輸出。譬如百度、騰訊、阿里和網(wǎng)易(易盾)等。通常對于這塊的AI能力輸出,對于微信而言,存在以下的應用實踐:
4.1.2.1 能力類型
由于微信的內(nèi)容形式較多,但有些是單一的內(nèi)容形態(tài),如純文本的聊天信息、朋友圈動態(tài)等等。但也有多形態(tài)集合的內(nèi)容服務,譬如公眾號推文、視頻號的視頻內(nèi)容等等。
不同的形態(tài),所采用的AI能力也是有差異的(在算法規(guī)則上):
- 單一內(nèi)容服務:單一的內(nèi)容形式,只要做采用直接對應的AI算法能力即可。比如文字則依據(jù)NLP能力進行文本檢測審核,圖片則用CV中的圖片檢測審核。
- 多內(nèi)容服務:多個形態(tài)集合的內(nèi)容服務,舉個例子像公眾號推文就涉及標題文本(30個字符內(nèi))、圖片、視頻、摘要、正文(字符不限)。由于這里涉及較多形態(tài),這里的算法能力輸出會更為復雜。
a. 文本檢測審核
主要采用NLP方向的算法能力,針對文本進行安全規(guī)則審核。
而這些規(guī)則d主要結(jié)合國家法律法規(guī)、平臺規(guī)范等方面而開發(fā)相應的算法模型。譬如可以識別辱罵、廣告、涉政等內(nèi)容。而這里的文本檢測除了考驗詞庫數(shù)據(jù)豐富性,還有考驗不同語言的復雜性。
b. 圖像檢測審核
主要采用CV方向的算法能力,這里的圖像檢測包含純圖片及視頻內(nèi)容的審核,實際上視頻是由多張圖片(即一幀幀)組合而成,所以本質(zhì)上兩者都歸屬在圖像檢測審核。
但是由于視頻較長,基于技術(shù)限制不可能把每一幀都進行檢測,通常會基于一定策略(隨機、按比例抽取等)進行截幀檢測。同時圖像的檢測會混合多種技術(shù)進行支撐,譬如OCR檢測識別文本內(nèi)容、NER實體識別具體內(nèi)容(如人物、商品)。
c. 語音檢測審核
語音檢測從另外一種方式,就是把語音轉(zhuǎn)譯成文本,既而采用文本的方式進行檢測審核。所以可以把其當作另一種文本檢測方式,但這里關鍵在于保證語音變成文本后的準確性。
- 難點1:多個形態(tài)及形態(tài)不一的算法能力檢測,對算法的技術(shù)指標有更高要求。比如標題文本字符有限,檢測對象的難度較低,但推文的正文卻是字符數(shù)不確定,詞句之間也有更復雜的語言變化,那么同樣做文本審核就更為困難;
- 難點2:多內(nèi)容之間存在語義關聯(lián)(即多模態(tài)分析)。再譬如視頻號的視頻從標題、封面、摘要都沒有問題,都含有某一政治人物,但是在視頻中出現(xiàn)了一個文字特效,這個文本內(nèi)容同樣表達辱罵性質(zhì)的,那么這樣關聯(lián)起來也是有問題的。
4.1.2.2 審核范圍
大體而言,兩種主要的審核類型,以上為其支持檢測范圍內(nèi)。那么基于這些情況,微信會基于不同的產(chǎn)品服務進行相應的安全檢測。直觀地看,其實可以從下圖可以看出。
- 圖中左側(cè)的2張圖,是典型的文本檢測審核案例,從這里可以看出這是不同文本做出了是否正常及問題點的安全檢測;
- 圖中右側(cè)的2張圖,尤其是“已停止訪問該網(wǎng)頁”圖,這是大家常見微信的一種的異常處理方式,顯然這是一個垃圾廣告營銷性質(zhì)的推文而被封禁。而最后一張圖則是正常的一篇推文,對標題、視頻中的文本、水印等其實也會進行相關檢測,完成安全審核。
4.1.2.3 小結(jié)
大家日常在微信所能看到的內(nèi)容,其實是做了一定內(nèi)容安全而審核過濾的。
但是通常平臺不會百分比交給AI來實現(xiàn),因為有些識別存在邊界模糊的情況,而這些內(nèi)容本身存在極高敏感性。所以通常在內(nèi)容安全場景,都會進行“機審“和”人審“的結(jié)合,最大程度保證安全。
所以在安全審核場景下所涉及的AI算法,諸如文本圖片的高敏、低俗等,會相對關注“漏報率”和“誤報率”,簡單來說,對于平臺而言審核錯了,重新開放即可。
但是一旦安全審核漏了,最終呈現(xiàn)給用戶,如果內(nèi)容惡劣程度十分之高,那么將會造成極大的負面影響。所以這兩個指標也是該場景的各類算法尤其關注。
4.2 內(nèi)容質(zhì)量
內(nèi)容質(zhì)量是內(nèi)容推薦過程中是否高優(yōu)推薦的一個標準。而所謂內(nèi)容質(zhì)量,除了內(nèi)容合規(guī)、社交好友推薦以外,單看這一內(nèi)容本身是否為原創(chuàng)、篇幅(視頻時長)長度、內(nèi)容結(jié)構(gòu)是否清晰簡潔(標題黨、圖文不符)、視頻圖片是否清晰等等。
但由于這一類型內(nèi)容本身有著復雜的語義關系,如果要通過AI完全判斷是否高質(zhì)量其實是很難的,因為本身沒有一個常規(guī)的標準。但是一些基礎的判斷是可以做到的,譬如圖片質(zhì)量、文章質(zhì)量等等。
4.2.1 場景價值
對于很多內(nèi)容創(chuàng)作者而言,可能也都清楚當內(nèi)容的“質(zhì)量”達到一定水平,一般官方平臺都會加大推薦力度。
因為假如內(nèi)容作品質(zhì)量欠佳,過多推薦一是影響平臺的調(diào)性,二是消耗用戶的興趣度,長期以往只會造成更大的損失的。因為好的內(nèi)容,才能真正挽留及打動用戶。
4.2.2 能力輸出
從上圖可以看出,左1顯示微信直播游戲垂類下,動物封面和品類風格推薦不一致的情況。而右側(cè)的2張圖,則是高清晰和模糊畫質(zhì)視頻的對比。而這些都是內(nèi)容推薦上,常遇到的質(zhì)量問題。
那么針對在質(zhì)量檢測上,同樣有諸多場景將可以值得探索。而在微信內(nèi),主要可以有2大維度“內(nèi)容結(jié)構(gòu)、素材質(zhì)量”進行實踐。
4.2.1.1 內(nèi)容結(jié)構(gòu)
常見包括標題黨、圖文不符(即文中插圖、封面插圖與內(nèi)容無關)、聲畫不符(即視頻內(nèi)容和音頻內(nèi)容不一致)等場景。
4.2.1.2 素材質(zhì)量
包括清晰度(圖片、視頻等)、音頻質(zhì)量(如卡頓、無聲、噪音等)、聲畫不同步(如延遲)等場景。
- 清晰度:有時候視頻或者圖片的清晰度,會影響用戶感官感受。清晰度的識別也是當前內(nèi)容分發(fā)中常見的應用場景。而這一能力主要能夠識別當前圖片或圖像是正?;蚴悄:辱b別,那么這里就依賴多個技術(shù)集合,如人臉檢測(人物主體是否清晰)、分辨率識別(圖片截幀識別分辨率或像素)、OCR等等;
- 音頻質(zhì)量:如果是視頻內(nèi)容或者是音樂內(nèi)容,那么就需要注意當前分發(fā)的音頻是否出現(xiàn)卡頓、無聲或噪音等等,如果能從AI上進行這樣的支撐,則能在分發(fā)時就規(guī)避這些低質(zhì)量內(nèi)容;
- 聲畫不同步:實際這也是存在的場景之一,即視頻在播放過程中,音頻會出現(xiàn)延遲或提早,與視頻當前播放內(nèi)容出現(xiàn)不一致,其實這樣也會影響體驗效果。
4.2.1.3 技術(shù)支撐
針對以上的場景,輸出相應的AI能力前提也是需要依賴更多的技術(shù)手段作為支撐。
其中有幾個有些比較抽象,無法理解。那么這里舉個例子,來介紹一下。假設需要判斷圖中中間的視頻內(nèi)容,確實與主題內(nèi)容相關,需要分別進行哪些能力支撐。
- OCR檢測:因為是視頻,需要通過OCR來識別其中的文本,如彈幕、水印等,來收集數(shù)據(jù);
- 關鍵詞抽?。和ㄟ^OCR識別的文本,視頻本身的標題等,進行一系列的“關鍵詞”抽取,可以識別出諸如“電影”、“海報”、“愛樂之城”、“高司令”等關鍵詞。但是這些關鍵詞都是獨立個體數(shù)據(jù),沒有關系,那么接下來就需要知識圖譜及NER來進行進一步的“聯(lián)結(jié)”;
- 知識圖譜:結(jié)合NER實體識別以及上述的關鍵詞,基于知識圖譜關系來梳理出“電影-愛樂之城-男主角高司令”等這一系列有序的數(shù)據(jù);
內(nèi)容分類:實質(zhì)為分類標簽,即對內(nèi)容打標進行各級分類,從以上的數(shù)據(jù)可以看出它是屬于電影類(一級分類)-歐美電影(二級分類)這樣的關系。分類的全面性及細粒度體驗當前平臺的分類標簽能力。如果平臺足夠儲備這樣的分類數(shù)據(jù),結(jié)合以上的數(shù)據(jù),就可以快速識別該內(nèi)容是一致的,可以進行推薦池基于推薦規(guī)則進行分發(fā)。
4.3 內(nèi)容體驗
在做了內(nèi)容安全、內(nèi)容質(zhì)量的環(huán)節(jié)后,內(nèi)容在推薦過程中已經(jīng)得到了一定的分發(fā)。但是此前都是針對單一內(nèi)容作品進行AI能力支撐,而在推薦過程中,以及多內(nèi)容分發(fā)時,遇到的又是另一重問題。
而內(nèi)容體驗指的是內(nèi)容在推薦過程中,所給用戶帶來的體驗感受。基于這樣服務場景,AI同樣可以進行一些能力輸出探索。
4.3.1 場景價值
大家在體驗信息流推薦時,譬如抖音或者當前微信視頻號的推薦頻道,大多基于用戶偏好、行為偏好等方面進行策略推薦,這樣就有一系列體驗問題:
- 假設作為消費型用戶,我喜歡體育及科比球星,那么是否推薦都給我推薦科比的視頻?
- 假設作為內(nèi)容生產(chǎn)型用戶,大家都創(chuàng)作了科比的視頻,你一個我一個都這樣推薦給用戶,看著對內(nèi)容生產(chǎn)者有利益,但對于普通用戶而言是否就有幫助?
- 假設作為內(nèi)容生產(chǎn)型用戶,我手上有幾個視頻號自媒體矩陣(以及都有較高的粉絲量),但是這幾個賬號里面有些作品內(nèi)容是幾乎重復的。那么作為平臺方,該如何規(guī)避這些不同賬號但旗下內(nèi)容重復的分發(fā)?
- 假設有一個地域性的新聞視頻,所報道的內(nèi)容是跟深圳本地強相關的,但是在沒有做分類及位置信息的前提下,怎么最大化地把這個內(nèi)容合適推薦給本地信息流里面去?
- 單看某一條內(nèi)容從安全、質(zhì)量兩個層面來看都是ok的,但是僅僅考慮這兩點是完全不夠的,關注用戶在內(nèi)容推薦中的體驗情況,并持續(xù)優(yōu)化,最終反哺平臺發(fā)展(譬如因為體驗更好增加停留時長、互動次數(shù)頻繁等等)。
4.3.2 能力輸出
在已經(jīng)完成了安全和質(zhì)量檢測后,內(nèi)容已經(jīng)具備一定的可觀賞性。
那么想要進一步改善用戶體驗,主要在于推薦的內(nèi)容是否準確和契合用戶喜好,而這部分更多是推薦策略的工作。那么剩下的就是使用體驗上盡可能得到提升。那么在此環(huán)節(jié),算法所能服務的應用場景主要涉及3個方向。
4.3.1.1 內(nèi)容重復
這類問題場景,是時下內(nèi)容推薦業(yè)務最常見的問題。
一個原因在于創(chuàng)作者本身是多媒體矩陣,可能不同的賬號會進行同內(nèi)容的發(fā)布。其二是內(nèi)容平臺本身也會從第三方平臺引入內(nèi)容,本身內(nèi)容的來源歸屬就不可控,所以也不可避免引入的內(nèi)容會和其他第三方平臺內(nèi)容存在重復。
包括短視頻推薦、新聞資訊推薦、直播推薦等等,大家可能在日常中都會偶然刷到重復內(nèi)容,這里重復的情況主要分為2種:
- 純內(nèi)容重復:即內(nèi)容完全或接近一致。這種可能存在同一賬戶下多條內(nèi)容重合,或不同賬戶下同一條相似內(nèi)容重合。從上圖中的左側(cè)1、2可以看出,這是同一時段內(nèi)(23點34-35分間),同一條相似內(nèi)容在不同的賬戶下發(fā)生重復現(xiàn)象。明顯微信在這方面其實還沒做到精細化的管理,但是AI能力上,其實是可以進行“重復”判斷及置信度的反饋,獲取這樣的算法標簽時,在內(nèi)容推薦分發(fā)上就可以一定程度上規(guī)避這樣的情況。即假設用戶已在頭一條成功曝光和觀看內(nèi)容,則在相似的下一條基于已有重復標簽,在去重時間窗口內(nèi)(如3個月內(nèi))進行過濾分發(fā)。
- 主題性重復:即在內(nèi)容推薦過程中,主題分類或話題性十分相似。譬如前面提到科比視頻,如果在視頻推薦中前10條中7條都是科比的(盡管具體內(nèi)容不同),但是基于偏好不能直接分發(fā)給用戶,因為這樣看似迎合了用戶喜好,但實際反而造成用戶觀賞疲勞,相似性內(nèi)容太多缺乏好奇性和新鮮性,最終影響對平臺的感官感受。這里的支撐,依賴于主題分類的規(guī)則制定。
4.3.1.2 內(nèi)容分類
垂直分類是內(nèi)容推薦的一個重要支撐點,因為用戶本身有對某些特定的領域會有強偏好表現(xiàn),那么在推薦上就要有所側(cè)重。但是用戶主動選擇主題分類發(fā)布本身是一個不確定性行為,甚至有些還選不正確(有邊界模糊)。
所以這時候AI算法就可以協(xié)同進行“分類打標”,但是技術(shù)側(cè)能把海量的視頻進行準確分類打標,也是行業(yè)常見的一個困難點。
并且分類不僅僅是一級分類,還要盡可能做到更細粒度的分類,即多級分類,如電影、電影_紀錄片、電影_紀錄片_人物傳記。分類是否科學、標簽是否準確,都極具考驗。
舉個例子,仍舊以科比視頻而言:左側(cè)為科技的紀錄片視頻,右側(cè)是關于科比體育比賽視頻,本身都帶有體育、科比、競技性質(zhì)內(nèi)容,但兩者卻屬于不同的視頻類別,這對AI而言,需要建立全面和準確的分類標簽體系,這就需要大量的AI技術(shù)做支撐。
4.3.1.3 地域識別
基于地理位置增加內(nèi)容分發(fā)曝光的機率,是當前各大內(nèi)容產(chǎn)品基本都會采用手段。從微信的視頻發(fā)布及直播中支持“添加位置”以及同城視頻分發(fā)的功能,就可見其重要性。
那么假如當前內(nèi)容沒有標記地理位置信息,又該如何去識別內(nèi)容對應的地域?qū)傩??不同的?nèi)容形態(tài),采用不同的方式。
像圖文資訊(類似公眾號推文),則可從文本中切割關鍵詞進行地域信息提取,以及加工處理組合成結(jié)構(gòu)化的地域?qū)傩?。而視頻內(nèi)容也是類似,只是因為圖片算法檢測,需先通過OCR識別或各類物品識別提取文本數(shù)據(jù),繼而進行相應的地域?qū)傩宰R別。
5.?總結(jié)
以上就是結(jié)合當前內(nèi)容推薦業(yè)務和微信的內(nèi)容生態(tài)狀況,作出了AI所能應用實踐的探索研究。但文中提及的應用實踐也許只是冰山一角,畢竟整個生態(tài)服務十分之龐大,能夠做到各類的精細化服務是長期的工作。
此外,關于微信在這方面的內(nèi)容推薦實踐上,未來仍舊還有不少工作需要落地:
- 微信的內(nèi)容推薦業(yè)務還處于起步階段,尤其是視頻推薦,未來的質(zhì)量和效果體驗將會有較大的提升,而AI在其中的實踐也將有較大的空間進行發(fā)揮;
- 整體而言,微信已經(jīng)搭建了基本的內(nèi)容推薦服務產(chǎn)品體系,但是在功能完備上,當前還是比較克制。尤其是新推出的視頻號、直播,對比同類型競品,所能實現(xiàn)的能力還是偏少。但個人認為微信更多在探索屬于自己特性的內(nèi)容發(fā)展方向,無意成為另一個常規(guī)的推薦系統(tǒng)、直播系統(tǒng);
- 當前微信的內(nèi)容推薦業(yè)務更多的只是發(fā)揮流量分發(fā)作用,即引入外部內(nèi)容源到微信生態(tài)中進行消費,實際還缺少了標準統(tǒng)一的“內(nèi)容生產(chǎn)”環(huán)節(jié)。一個內(nèi)容產(chǎn)品服務除了推薦側(cè)做得足夠好,在內(nèi)容源也是至關重要,所以在構(gòu)建自身的內(nèi)容庫方面,微信還有很長的路要走;
- 內(nèi)容本質(zhì)上依賴創(chuàng)作者的輸出,即PGC和UGC的共生,但是基于內(nèi)容賬戶體系的建立,尚未形成集合賬號、內(nèi)容于一體的賬戶等級服務體系。同時“原創(chuàng)”作品在一個平臺的價值是十分大的,參考當前各大內(nèi)容廠商,都在推出創(chuàng)作者計劃并扶持各自優(yōu)質(zhì)的內(nèi)容創(chuàng)作者。
最后,如果大家想要對AI技術(shù)有進一步的了解,不妨多關注騰訊云、阿里云、百度大腦及網(wǎng)易等多個平臺,在人工智能領域的一些技術(shù)探索。
#專欄作家#
A.D,公眾號:吾某,人人都是產(chǎn)品經(jīng)理專欄作家。大數(shù)據(jù)分析產(chǎn)品經(jīng)理,專注數(shù)據(jù)挖掘工作。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自圖蟲
- 目前還沒評論,等你發(fā)揮!