久久综合九色综合欧美狠狠,97夜夜澡人人双人人人喊

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

搭建標簽體系，學會讓用戶為你干活

珂然

2020-09-05

0 評論 15974 瀏覽 94 收藏

12 分鐘

編輯導讀：用戶標簽是精細化運營的基礎，能有效提高流量的分發效率和轉化效率。用戶由標簽組成，但是這些標簽打那些緯度標簽？由誰來打？怎么打標簽？本文作者對此展開了分析探討，一起來看看~

標簽，主要的作用就是用于商品識別，用來標志產品目標、分類、內容等。標簽按照存在形式分，可分實物標簽、網絡標簽（tag）等。

（1）實物標簽

主要用于標明物品的品名、重量、體積、用途等信息的簡要標牌。有傳統的印刷標簽和現代條碼打印標簽。

適用范圍：包裝：嘜頭標簽、郵政包裹；商品：價格標簽、產品說明標簽；

（2）網絡標簽（tag）

它是一種互聯網內容組織方式，是相關性很強的關鍵字，幫助人們輕松的描述和分類內容，以便于檢索和分享，Tag已經成為自web 2.0以來的重要元素。

今天我們就來聊聊網絡標簽，let’s go

背景

假設一個場景：老板把你叫到辦公室，讓你做一套標簽體系，你會怎樣推進？

常規思路：調研市場上同類型產品做法→通過各種渠道，拿到標簽體系結構（或者利用爬蟲爬取標簽體系數據）→直接套用過來→人工達標、模型訓練→形成自有標簽體系

這是一種快速便捷的方案，但是埋了很多隱性的“坑”，稍不留神就會被坑。

不同平臺內容體量有差異，內容調性與用戶調性亦有差異，完全照搬內容標簽體系，弊大于利。
標簽體系不完善，不適合自有內容生態，就花費大量人力、物力來做，勞民傷財。

怎樣躲“坑”？那得學會靈活運用他人的體系

當拿到搭建標簽體系的任務，首先想到有兩個方案

方案一：調研同類型產品做法，直接套用其分類標簽體系

優點：簡單、高效

缺點：不完全適合自有內容生態

方案二：爬取同類產品內容數據，進行無監督訓練，輸出分類標簽結果。

優點：可以更好的了解內容生態中內容分布情況，制定合理的分類標簽體系。

缺點：時間周期長，成本高

不管方案一還是方案二，得到的都只是初版標簽體系標準（比如一二級分類體系標準），只能用做建立底層分類標簽，離標簽體系建立還有一段露要走。

當有了底層分類標簽，可以在此基礎上進行多維度標簽建構：

情感化標簽
風格標簽
實體標簽
概念標簽

……

多維度標簽有了，怎樣讓內容打上這些標簽？

1. 充分調用用戶生產力，讓作者打標

我們都知道，豆瓣將打標的權利下放給用戶，在上傳文章、寫電影評論都可選擇或手填標簽，對于內容平臺來說，這是一筆巨型財富。但是由于用戶能力水平有高有低，打出的標簽需要進行清洗、消歧等操作后才能使用。

一些資訊平臺、視頻平臺，作者發布文章時，也會讓作者選擇、填寫內容標簽，比如趣頭條、B站等。

B站發文頁面

問題點：用戶手動填寫的標簽沒有統一標準，標簽名稱不規范，無法直接使用。筆者拉出所在公司作者手填tag，利用率也就50%-60%左右，需要人工進行標簽分類，比如篩選出實體標簽、概念標簽、風格標簽等。

2. 人工打標

作者手動填寫tag，只能作為tag體系補充的一環，且利用率有限。因此，專門的標注同學、真實用戶打標，是必不可少的一環，更好的保證標簽可用率與準確率。

調動用戶生產力，讓真實用戶打標簽，不知大家有沒有用過。把打標偽裝成用戶活動，既是用戶運營的手段，也是標簽生產的手段，利用用戶運營的思路來生產標簽，好處多多。

我們來算筆賬——

假設日活用戶1000萬，圈出100萬用戶做活動，預計每日參與活動用戶20w，真正完成答題用戶7w-8w，剔除無效數據，最終可用數據可以有10w左右，平均成本可靈活調控。

如果找專人一天標注10w數據，按照人效1500來算（上限值），那么就需要66個人，人力成本一天也得大幾萬。

對比來看，調動用戶生產力，優勢不言而喻。

第一步：洞察用戶

人口學特征：性別、年齡、職業等
地理位置特征：所在城市，城市等級
活躍行為特征：最近60天、30天、14天、7天等活躍天數
閱讀行為特征：最近60天、30天安、14天、7天等閱讀視頻、圖文次數、時長。

通過這些不同維度的用戶數據，讓你對用戶做個深度剖析，找到你需要的那部分用戶。

第二步：吸引用戶

將打標簽的項目偽裝成用戶活動，比如要進行影視劇劇名打標，可以開展一個“看視頻猜劇名”的活動。比如要進行相似圖片標注，可以開展一個“看圖片找不同”的活動。

怎樣做好偽裝，吸引用戶參與？

活動名稱接地氣，要點突出，直接要害
設計有看點的活動banner
做好答題頁面交互體驗設計
充分利用金幣、獎金競品激勵

第三步：服務用戶

當把用戶吸引進來之后，需要為它們做好服務，提升活躍留存。

定期監測參與活動用戶質量，剔除羊毛黨、質量低用戶。
制定獎懲機制
收集用戶反饋，對于有用建議及時響應。
由于項目具有周期性，做好用戶召回（利用psuh、站內信等手段觸達召回）

再多說一句，當把這套流程機制中臺化，可以滿足不同業務場景需求，對于用戶促活、標簽打標等具有很強的實操價值。

3. 模型訓練

常規的模型訓練流程很簡單，大致分為五個環節：

標準制定→樣本標注→模型訓練→數據評測→上線

隨著業務需求增加，對于模型迭代效率要求越來越高，普通的模型訓練流程太繁瑣，需要跨部門溝通，費時費力，因此，搭建一套模型訓練自動化平臺顯得尤為重要，對于簡單的模型，可以由運營或者產品協調標注，快速訓練、迭代模型，提升效率。

這里簡單聊聊模型自動化訓練平臺的搭建，或有不足之處，大家一起交流學習。

平臺工具可分四大模塊：數據處理、模型訓練、數據集打分、模型對比

模塊一：數據處理（整合數據獲取、數據處理兩個小模塊）

（1）數據獲取

1）內部獲取

來自內部，整合已有工具，平臺加上工具跳轉入口；利用sql自行獲取想要樣本標注數據。
來自內部，算法側提供相應樣本標注數據

2）外部獲取

根據具體需求，制定內容爬取方案，瞭望爬取相應內容（圖文、視頻、小視頻等全體裁），需要入庫，支持輸入標注平臺、眾包進行數據標注。

（2）數據處理

針對內外部獲取的數據集，支持輸入標注平臺、眾包進行標注，輸出有效標注樣本數據集
針對眾包、標注平臺輸出的有效標注樣本數據集，需要有個樣本管理配置平臺，進行數據處理，然后將數據直接推送至對應模型進行訓練。

模塊二：模型訓練

算法提供每個需求所需模型
選定所需模型，輸入有效標注數據集進行訓練
支持配置選擇模型參數，比如，基于神經網絡模型，一般可以迭代訓練輪數、學習率、網絡層數、向量寬度、選擇的優化器等。
支持增量與全量任務訓練，訓練狀態可視化，便于及時掌握訓練情況
建立監控報警機制，訓練狀態異常時觸發，保證訓練狀態正常。

模塊三：數據集打分

已經訓練完畢的模型，輸入測試集、驗證集數據，輸出P\R\F1值
輸出P\R\F1值后，再次輸入人工評測數據集，輸出評測數據結果，人工離線評測，輸出準召率。

模塊四：模型對比

對于準召率達標不同版本模型進行留檔記錄，便于對比迭代前后模型效果

對比維度：模型版本號、訓練完成時間、P\R\F1值、人工評測準召率等

通過作者打標、用戶打標、模型訓練等方式，輸出了各個維度內容標簽，存儲于標簽庫中，為各業務場景提供底層數據支持。

本文由 @珂然原創發布于人人都是產品經理，未經許可，禁止轉載

題圖來自 Unsplash，基于 CC0 協議

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

珂然

公號:珂小汪歡迎交流

5篇作品 44940總閱讀量

蜂花們“這潑天的富貴”，不能只靠蹭來的流量

09-204132 瀏覽

工會業財一體化（一）

08-312192 瀏覽

直播回顧 | RWS 直播分享會：獨家揭秘大廠都在用的文檔核心技能

04-261740 瀏覽

復盤產品如何設計會員權益

06-198413 瀏覽

傳統熱度算法與AI技術的結合：探索更精準的熱點分析方法

03-225722 瀏覽

評論

目前還沒評論，等你發揮！

搭建標簽體系，學會讓用戶為你干活

背景