關于UGC內容社區新熱推薦的一些思考記錄
編輯導讀:內容推薦是將用戶喜歡的,同時符合平臺意志的內容按照一定順序展現給用戶。熱點新聞、新鮮事物這些是最吸引眼球的,是留住用戶最有用的手段之一,這也是內容平臺都在追熱點的原因。本文作者對此進行了一些思考,與你分享。
一、前言
本篇文章不會涉及過多背景介紹與基礎信息的講解,默認大家都對于推薦本身,對于推薦為何要追求新熱有一定認知。
一句話而言:內容推薦是將用戶喜歡的,同時符合平臺意志的內容按照一定順序展現給用戶,而熱點事件是最吸引眼球的,對于新熱內容,如果能更快更及時地展現給用戶,就能夠將用戶的注意力牢牢地抓在平臺手中。
基于策略PM視角,內容社區應該從以下幾個方面去服務滿足用戶獲取新熱內容的需求:
熱點獲取、熱點內容挖掘、熱點內容推薦、熱點感知提升&評估體系搭建。
下面我也會從這幾個維度來聊聊新熱推薦在內容社區的實施,包含一些可能存在的坑,以及一些需要注意的關鍵點。
二、新熱推薦的社區應用
2.1 熱點獲取
熱點事件分為兩種,一種是全網熱點事件,比如前段時間的吳亦凡被捕、東航墜機事件、最近的上海疫情進展,第二種是原生熱點事件,基于社區文化,在內部產生,具備一定破圈能力的事件,這方面的案例最典型的是古早的“賈君鵬,你媽媽喊你回家吃飯”、最近的“蔡徐坤周杰倫超話打榜”。
全網熱點事件是全民關注的,其特征是發酵非常迅速,能吸引大多數人的目光,通常不具備過高的理解門檻,但足夠重要或者足夠勁爆。當事件發生時,人工往往會比機器有更強的先驗判斷能力,比如吳亦凡事件,當被捕的消息剛發布微博的時候,機器可能需要計算同時段爆發的相關討論情況才能判斷事件等級,但人工就很容易判斷其一定是一個全網熱點事件。
原生熱點則一般是社區內部先小范圍發酵,是社區用戶一段時間最關心熱議的話題,初期一般具備具備鮮明的領域屬性,或者存在一定理解門檻。但當討論議題足夠具備爭議性,且衍生出了一些不需要了解事情完整情況也能get到的梗的時候,原生熱點也完成了進階,具備了拓圈,成為全網熱點事件的可能。
扯了一大堆終于到了正題,作為平臺方,我們應該如何更快更準確的獲取到熱點信號呢?
同樣需要分熱點類型來看,對于全網熱點事件,著重看三方面信號:競品push內容(微博、頭條、百度等)、頭部媒體號發布內容(人民日報、共青團中央等)、競品熱榜內容。
其中push通常是最快的,熱榜是最準的,頭部媒體號發布的通常是最具價值的。
這三類信號都存在雜音,比如push還包括很多非新熱向的個性化push,熱榜也通常有平臺意志強加的內容,策略在這步中需要做好的是信號的獲取與處理,接入更豐富的信號源,做好信號處理,包括事件聚合(同一事件在不同平臺存在不同表述)、事件交叉驗證(同時間出現在多個競品熱榜高位的大概率是全網熱點事件)。
不可或缺的還是運營的介入,提供一個人工的判斷界定,可能更快的熱點事件發現、修正策略對事件重要性的判斷結果,這方面需要策略團隊與運營的通力協作,通常還需要設置一些中間指標,來衡量策略和運營在熱點發現這一環節的表現,這塊可以自行設置,就不再展開。
而對于原生熱點事件,就更讓人頭疼了,對于頭部社區來說,如微博,由于用戶形成了較強的#話題感知,通過計算一段時間內話題的熱點躥升情況,是能夠很好發現熱點的,而對于其他ugc內容社區,熱度躥升的德爾塔值同樣具備很強的參考價值,因為具備討論的熱點一定會在短時間具備強虹吸效應,將附近的注意力與流量聚集起來,這就會帶來一些置信的熱點判斷信號,包括用戶層面的集群、內容層面的集群。
策略團隊通過與數據團隊協作,定義獲取熱點置信信號,定義熱點爆發度信號(用于計算熱點內容的爆發擴散能力)、來挖掘可能的原生熱點事件。
2.2 熱點內容挖掘
這部分尤其針對全網熱點,從外站獲取到了熱點事件,通常以一串文字的形式呈現,比如#鄧倫偷稅1.06億,這就是策略用以內容挖掘的主要抓手,而在ugc內容社區,用戶發布的內容并不具備很強的結構化,很多時候標題就是“xdm,出大事了”,然后截圖的熱點事件的外站截圖,這就給策略做內容匹配出了一道大難題。
要平衡準確性和召回能力,怎么解呢?
傳統的做法是通過切詞匹配&事件聚合策略,匹配的主體分別是熱點事件名的切詞結果和社區內容標題,這種做法的優點是匹配的準確性較好,但缺點是沒法匹配到上一段我們所說的那種內容,而這種內容可能在社區中占比比高結構化的內容多得多。
筆者嘗試過加入正文內容,以及ocr識圖結果來做匹配,結果是匹配的相關性很差,幾乎是不可用的程度,和策略rd討論過后,有幾種可嘗試的方法,也po出來和大家討論:
- 梯度匹配,同樣引入正文內容和ocr結果,但加入限制,對于這部分內容,要求匹配相關性更高,再加入召回。
- 策略嘗試,在jarcard相似度的基礎上嘗試其他算法,進行bagging,提升匹配的準確性。
- 獲取熱點title及落地頁內容、社區內容title和內容,基于KeyGraph算法做匹配。
同樣,運營在這步中可以做為人工內容補充的一個源泉,同時對策略挖掘的內容做二次審核和不相關剔除,同樣需要制定相應的中間指標,共背指標才能互相約束。
這部分就不細拆了,如果想要進一步討論,可以找筆者私聊~
2.3 熱點內容推薦
這部分反倒是最簡單的,三個步驟需要關注一下:熱點事件的定向人群冷啟、熱點事件的擴散、熱點事件的LCN及時退場。
定向人群依賴于對用戶畫像的刻畫,需要對新熱用戶進行定義,對這部分喜歡看熱點事件的用戶,優先將熱點事件推薦展現,根據他們的表現,來決定下一步是否需要進行熱點推薦的擴散(提權)、熱點事件同樣需要做好LCN退場,即對于同一個事件下,內容推薦超過X條,無點擊行為,需要對該用戶及時退場,避免搶占曝光資源。
這步策略主要聚焦的核心指標,可以通過“事件發生xx min時間內的用戶覆蓋”來衡量。
2.4 熱點感知提升&評估體系搭建
推薦出新熱內容,并不直接意味著用戶新熱感知自提升了,需要結合功能側的一些改動,比如典型如微博,推薦帶推薦理由,搜索框實時展現熱點事件等,都是從功能側驅動,配合策略實現用戶切實對新熱事件感知的提升。
那么怎么評估用戶新熱感知提升了呢?
包括月度的用戶評估報告(最好有和競品的對比,新熱感知月報)和數據維度的例行評估。
數據維度的評估主要從四個方面進行:
- 全面:事件覆蓋全、事件推薦角度全;
- 及時:是否在事件發生第一時間給用戶推薦出來;
- 準確:是否內容是熱點事件相關的,是否推給了對該熱點事件感興趣的人;
- 適度:是否推薦適度,不存在霸屏、連出、退場不及時的問題;
三、新熱推薦的拓展想法
有幾個問題筆者一直在思考:
- 內容社區真的把新熱做起來,應該是一個什么樣的狀態?
- 熱點事件,更應該以什么形式承載,單內容?話題?
- 話題榜中,全網熱點和原生熱點,應該怎么分布才算合理?
- 新熱線條,產品和運營應該怎么分工,究竟是哪方主導?
這幾個問題,限于篇幅,就不在這篇文章中展開了,如果大家有想法,可以在評論區發表自己的看法,也可以找我私聊討論。
若能拋磚引玉,不勝榮幸~
#專欄作家#
隨心將夜,微信公眾號 : 互聯網菜鳥產品進階之路,人人都是產品經理專欄作家。關注社交賽道和社區發展,擅長分析行業趨勢。
本文由原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
內容社區真的把新熱做起來,應該是一個什么樣的狀態?
熱點事件,更應該以什么形式承載,單內容?話題?
話題榜中,全網熱點和原生熱點,應該怎么分布才算合理?
新熱線條,產品和運營應該怎么分工,究竟是哪方主導?
這幾個關鍵點確實很關鍵
關于熱點內容的挖掘需要一定的新聞敏感,這些都是建立在大量閱讀的前提上。
這是運營視角了吧