數據運營實操案例:信息流feeds產品優化

3 評論 7473 瀏覽 55 收藏 16 分鐘

編輯導讀:本文作者帶領大家對信息流的基礎推薦引擎和影響因子有了初步了解,并通過信息流feeds數據運營中的一個實際案例梳理總結了數據運營的價值,供大家一共學習和參考。

一、信息流引言

信息流(Feeds)的形態已經近乎無所不在,貫穿在我們24小時的互聯網生活的當中。當你通勤時在地鐵刷刷今日頭條了解最新資訊,信息流已經把一篇篇時事熱文整齊地排成隊列等待你的閱讀;當你想要好好美餐一頓,大眾點評的信息流給你“種草”了不少同城餐廳;夜不能寐想剁手來犒勞下辛苦工作一天的自己,淘寶上琳瑯滿目的推薦商品流怎么那么精準,刷得停不下來……

盡管信息流這種形態已經廣泛應用,但其實最早的應用是在資訊內容場景,始于Facebook在2006年發布的資訊信息流(News Feed)功能。

平臺通過既定的算法、規則排序后聚合內容,用戶可以在單頁面內進行流暢而高效的內容消費。用戶不再需要如移動互動網史前時代那樣,在門戶網站、博客站點之間進行頻繁地跳轉;平臺也通過提供聚合的內容展示平臺,更高效地把用戶留在了自己的轄區內。

信息流的英文是“Feed”,實在是用得很妙的一詞了。Feed在英文里是“喂養”的意思,生動地刻畫了信息流場景里,用戶被平臺按一定的順序“投喂”內容的場景。

用戶消費的內容時間是有限的,平臺如何在有限的時間內,給用戶投喂TA最喜歡消費的內容、從而讓TA在平臺消費更多的內容(從而給平臺帶來更高的潛在商業價值),就是所有Feed場景運營人員經年累月在不斷鉆研的“推薦排序”問題了。

二、信息流的基礎:推薦引擎

推薦引擎的核心,是“如何把合適的物品推薦給合適的用戶”,所以“物品”和“用戶”之間聯系的建立,是推薦算法里最核心的命題。整個推薦的過程基本可以總結為“召回”→“排序”→“調權”→“輸出結果”的過程,對這個過程進行一個簡單的比喻,來幫助大家理解這個過程。

大家應該都曾經在學生時代參加過軍訓,軍訓最后的分列式檢閱是整個軍訓過程的高光時刻。那該如何對隊列進行合理的排布呢?

  • 首先,教官會需要先“召回”A班的所有學生來到操場上,等待進行排列,只能是A班的學生,其他B、C班的同學先不需要參與;
  • 緊接著,教官會要求同學們按從高到矮的規則進行“排序”,這樣隊伍看起來就不會參差不齊;這時,雖然同學們已經按從高到矮排好了,但可能有個別學生匯演時需要在軍樂團做演奏,教官就需要對這些學生進行“調權”,把他們排除在外;
  • 最后,按這樣的規則排列下來的隊伍,就是最后匯演時A班的隊伍排布了。

推薦算法是一門頗深的學問,技術性也很強,但因為本書面向的讀者主要是運營人員,所以筆者嘗試從更顯性的層面總結如今影響信息流排序的主要影響因子:

  • 時間因子。時間是比較基礎的一個排序影響因子,很多內容產品最初都以時間為第一排序因子,比如公眾號最初則是完全的時間排序。但隨著內容不斷增多,如何利用推薦算法幫助用戶找到其最關注的內容,則是其他因子的命題。
  • 用戶畫像因子。這個因子的假設前提很直觀,“蘿卜青菜,各有所愛”。雖然我們常說不能把人“標簽化”,但對于算法來說的確只有“標簽化”才能更好地認識一個人。打個比方,如果你有“互聯網從業人員”的標簽,那給你推薦的內容自然會更多地傾向于互聯網行業資訊、科技新動向等;如果你有“孕期媽媽”的標簽,那給你推薦的內容也會有更多育兒類資訊。
  • 興趣因子。同樣是對人的理解,用戶畫像更多關注的是人的“屬性”,興趣則更多關注的是人的“愛好”。部分產品對用戶的興趣理解方式比較直接,讓用戶在新進時勾選自己的興趣領域,從而推薦給用戶對應內容;其次還可以通過一些側面的辦法,比如“用戶在某條資訊中閱讀的時長”、“用戶點擊某類資訊的概率”等方式側面去了解用戶的興趣。
  • 正負反饋因子。顧名思義,即是用戶對平臺推薦的內容作出的正面或負面的反饋行為。正面反饋,如“點贊”、“一鍵三連”行為;負面反饋,如“舉報”、“不愿再看到”等行為。許多用戶也深諳此道,在接觸一個新的信息流產品時會用這個方式去“馴化”信息流,“調教”出最適合自己的內容。
  • 互動因子。可以認為是正負反饋因子的進一步細化,比如B站許多UP主常說的“轉評贊”,則是希望通過用戶的轉發分享、評論、點贊等互動指標,幫助其內容被算法認為是優質的內容,從而獲得更高的曝光。另外,用戶的一些具體行為,比如“購買”,對推薦算法來說也是一個很重要的對相關物品提權的信號。
  • 社交因子。對于具有社交關系的產品來說,推薦算法就有更多的可發揮空間了。具有最得天獨厚優勢的莫過于微信,沉淀了中國十多億用戶的深厚社交關系信息。比如“看一看”的內容排序,則用到了用戶的社交關系做算法推薦,某個內容如果有越多我們的好友“在看”,那其在我們的“看一看”中的排序則會更優。
  • 熱度因子。時事變化瞬息萬變,當下的突發新聞事件往往會引起更多人的關注,導致熱門的時事事件得到更高的推薦排序。社會潮流不斷更迭,最近熱播的影視劇或最新潮流風向,也會使一些商品成為最近熱門,從而獲得更高推薦排序。
  • 人工運營干預因子。基于推薦算法的排序基本能解決大部分的效率問題,但對于部分劣質內容,如虛假消息、低俗內容,則需要人工運營的干預,對其進行降權或過濾。

三、難題:資訊Feeds如何做冷啟動?

講到這里,給大家分享筆者此前運營一款工具產品的經歷。大多工具產品的困境大家可能都有所了解:用戶停留時間長、粘性差,從而導致變現的效率和方式都很有限。市場上競品眾多,如果不能快速從數據指標上證明我們產品的價值,那整個產品都面臨著被砍掉的風險。

于是,如何提高用戶提高時長,成了我們團隊內一個很重要的命題。我們這款工具產品具有WiFi連接的功能,此前用戶在連接WiFi成功后跳轉的落地頁就是一個“連接成功”的頁面,除此之外,沒有別的承接;

但此時用戶處在操作完成的情緒高點、且在流量不敏感的WiFi場景,我們想,是不是可以通過承接資訊Feeds的內容,從而提供給用戶一些內容消費的價值,同時還創造了一個商業化變現的場景?

但我們是工具產品的團隊,此前完全沒有內容運營的經驗,要如何從0到1做一個資訊Feeds出來?分析了我們團隊的現狀,我們決定從以下幾個方面快速啟動:首先,資訊內容從哪兒來?我們的一些兄弟產品有現成的資訊內容,但具體的推薦算法需要我們自研;我們的算法團隊雖然沒有內容推薦的經驗,但在軟件分發上推薦的經驗,也有異曲同工可借鑒復用的地方。

巧婦難為無米之炊,“米”和“巧婦”都已具備,但要做成“炒飯”還是“湯飯”我們的用戶才覺得最好吃,我們得多嘗試才能得出結論。

推薦排序的因子那么多,但對于我們來說,因為工具產品的屬性,所以能用的并不多。根據我們的情況,我們決定做如下三組的A/Btest實驗:

  • 基于用戶畫像排序。我們可以獲得的用戶屬性數據有:用戶的軟件安裝列表數據,可以一定程度推測用戶的喜好;用戶的地理位置數據,可以推薦一些本地新聞、附近景點等資訊。綜合這兩方面的用戶數據,混合給用戶推薦合適的資訊內容。
  • 基于熱度排序。因為我們拿到的資訊內容并沒有附帶在其他平臺的熱度數據,所以熱度排序在我們產品中是相對滯后的過程,需要用戶不斷通過點擊行為去“投喂”給算法進行學習,從而把產品內更熱門的內容推薦給更多的用戶閱讀。
  • 基于資訊發布時間排序。相當于是一個基礎對照組,不對資訊做太多算法排序上的干預,用于對比前兩組實驗的效果。

基于三組實驗的設定,我們選定了三組隨機測試的用戶群進行策略的投放,并且設定了“平均資訊消費時長”作為關鍵評估指標。等待實驗效果回收的時間有三天那么漫長,這三天的期間我們團隊內也在打賭哪個策略表現會最優。讀者們,你們也來猜猜哪個策略的表現會最好呢?

四、分析:找到問題更深層的原因

團隊內的打賭,基本都集中認為是前兩組的策略會更優。認為用戶畫像更好的同事的觀點直截了當,用戶會對與自己更相關的內容更感興趣。認為熱度排序效果會更好的同事也很在理,更多人點擊的內容往往是獵奇新鮮的,自然也會吸引更多人閱讀。

但我們運營人員回收整理了實驗數據后,卻有點大跌眼鏡:最不為大家青睞的基于時間排序的方案三,竟然“平均資訊消費時長”都要優于前兩個方案。團隊內一時間有點泄氣,對算法團隊同事的技術能力質疑也在暗暗有聲。

作為運營人員,此時我們需要通過數據分析去多走一步看看:數據指標所呈現的,就是全部的真相了嗎?

為了分析這個問題,首先我們對問題進行了拆解。

實驗的數據指標上:

  1. 我們設定的數據指標有沒有問題?
  2. 數據指標的計算有沒有問題?
  3. 各實驗方案的數據指標計算是否都在同一個口徑上?

實驗的方案設計上:

  1. 實驗組用戶的選擇上是否足夠隨機?
  2. 實驗策略所需要的數據需要齊全?
  3. 實驗策略是否對其用戶組完全生效?

拆解分析后發現,我們看到前兩組方案數據指標不好的現狀,并不盡然是全部的真相。首先我們發現,“平均資訊消費時長”的指標設定存在一定問題。因為我們的產品屬性畢竟是工具產品,大部分用戶在連接上WiFi后是用完即走,資訊Feeds注定只是給一部分相對有閑的用戶的功能。

所以,實驗組之間用戶的“平均資訊消費時長”十分離散,方案三中存在個別極端值用戶拉高了整體平均時長數據。為了解決這個問題,我們在計算時可以對極端值做一定處理,并增加“平均資訊點擊率”的數據指標,可以更客觀地評估各方案之間的效果。

其次通過分析還發現,方案一和方案二由于數據采集上的原因,并沒有完全實現其策略各自的效果。比如方案一“基于用戶畫像排序”,許多實驗組用戶由于安卓權限限制,安裝列表數據不全;對部分用戶IP的地理位置識別也不夠精準,測試發現給有的在廣州的用戶推薦了北京的本地新聞,自然也會影響策略的效果。

比如方案二,由于部分“標題黨”內容點擊率很高,所以導致實驗組用戶首屏全是“標題黨”內容,內容質量很低,用戶點擊后也很快跳出,導致策略的實驗效果很差。

五、數據運營思維的重要性

如果我們沒有對數據指標呈現出來的情況做進一步分析,單看實驗的結果,我們可能直接就會認為對于我們的用戶,“時間排序”就是最好的方案了,以后都應該往這個方向去發展,所謂模型算法的優化也都沒有必要了。但只有通過分析,才能更清晰地看到事實的全貌,不斷提出優化方案進行迭代。

這里體現出的,是問題拆解思維的重要性,是有邏輯的問題分析思維的重要性。希望通過本書,可以跟讀者你分享這些思維框架,成為一個更優秀的運營。

 

作者:黃一元,公眾號:黃一元(ID:yiyuan-huang)。四年互聯網toC toB產品運營經歷。

本文由 @黃一元 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 其實根因就是需求理解不足,技術能力也不足,所謂的推薦算法猜都能猜出來是一種很簡單的算法,根本算不上是產品

    來自江蘇 回復
  2. 很有啟發,感謝!

    來自新加坡 回復
    1. 感謝支持!~

      來自廣東 回復