深入探討 | 其實你并不懂產品標簽機制

11 評論 23408 瀏覽 168 收藏 13 分鐘

標簽,是大家耳熟能詳的信息分類和標記機制,相信各位產品經理都用的爛熟。只不過,閑暇之余有沒有深入思索一下標簽這個不起眼的機制背后所蘊藏的磅礴宇宙觀呢?今天,磊叔就帶你們深入了解一下標簽,再次以工資保證這是你在任何網站都看不到的全新解析和詮釋標簽的視角,是真是假,看完再做決斷。

初來乍到:標簽與分類的區別

先來點開胃菜,也是爛大街的理論,不過磊叔做了小小新的詮釋。標簽和分類的區別,相信大家知道的比磊叔多得多,不過下面這幾個核心區別還是分享給大家:

  • 標簽是扁平的,分類是層級的
  • 標簽是精確的,分類是粗糙的
  • 標簽是多維的,分類是一維的

這里不是重點,不做過多解析,正文從以下開始:

本質:元數據

標簽和分類的區別是大家喜聞樂見的,但是不夠深度和震撼,我們深入一點點。

事實上,在數據領域,有一個鼎鼎大名的詞匯與標簽極其雷同,無論它的定義、它的適用范圍,還是它的衍生應用都與標簽令人驚訝的一致。

它就是:元數據。

元數據:用來描述數據的數據,是從數據中抽取出來用于說明其特征的數據,是結構化數據。

  • 元數據是結構化數據。
  • 元數據是可被搜索和精確定位的。
  • 元數據可以附屬在任意結構數據上。
  • 元數據使得圖片、文檔、視頻這些無法搜索內容的非結構化數據也可以被搜索和組織。

可是和我們要講的標簽有什么關系呢?

別急,如果把元數據的定義替換為標簽,我們就能看到一個令人興奮的進化:

標簽,用來描述信息的數據,是從信息中抽取出來用于說明其特征的數據,是結構化數據。

很貼切、很精確、很完美的標簽定義,不是嗎?

索尼大法好:標簽大法好

標簽的元數據類比定義,有點意思,但是還不夠深度和震撼,我們再深入一點點。下面對比元數據,磊叔給大家說道說道為什么“標簽大法好”:

1、因為標簽是結構化數據

標簽常規型態下是一個普通的不能再普通的文本,文本一定是可以結構化的,也就是說標簽是可以被結構化,可以被有效的存儲、組織、管理、搜索和精確定位的??傊?,結構化數據的特點和治理方式可以完美的套用到標簽上。

2、因為標簽是可被搜索和精確定位的

由于標簽是結構化的,是可以在關系型數據庫中有效的組織、存儲和管理的,那么,它就一定能被搜索且被精確定位。也就是說,我們總是有很高效的辦法來定位出每一個標簽,這個很像X戰警中的博士通過腦波定位全球的變種人一樣。

這一點非常重要,結構化數據總是能夠被高效的搜索和定位,這樣就讓標簽數量可以無后顧之憂的爆發性增長。而隨著標簽數量的不斷增長,標簽能夠越加精確的去描述信息,讓信息本身也越加的可被精確定位和搜索,這是一個雙贏的結果。

3、因為標簽可用于各種數據結構上

雖然標簽本身是結構化的,但標簽本身并不局限于只能描述結構化的數據。

事實上,標簽用以描述的信息是普適性的,也就是標簽可以應用于任意數據結構,比如常規的文本、圖片、視頻、音頻、超鏈接、甚至一些更抽象的信息,例如某種哲學思想,某種行為方式或者某種心智模式等。
回想一下,如果我們要描述一段視頻,以前是怎么做的呢?無外乎:

  • 給視頻加一個文件名
  • 給視頻加一個標題
  • 給視頻加一段描述

管用嗎?管用,但是不特別管用。因為關鍵的特征信息都隱藏在大段的文字當中難以識別。這時,標簽自身的精確性和靈活性就派上用場了,“啪啪啪”的幾個標簽加持,視頻的各種關鍵信息就顯露無疑的展示出來。

4、因為標簽可以使原本無法描述、搜索和定位的數據也可以被描述、搜索和定位

這個特性簡直就是標簽的黑科技,如果把標簽比作天火,數據比作擎天柱,那么給數據加上標簽,也就等于給擎天柱附加了天火的飛行引擎。

拿上面視頻這個冤大頭舉例子。眾所周知,視頻這種非結構化數據不僅存儲起來頭疼,搜索起來更頭疼。因為非結構化數據很難被搜索和精確定位。而上述的給視頻增加文件名、標題甚至大段描述文字的效果依然很差,因為這種描述是宏觀的和整體的,不是具體和精準的。

比如,我想搜索視頻中的指定時間的內容呢?例如我想搜索梁朝偉和張國榮接吻在影片中的時間,懵逼了吧。
沒問題,標簽也能幫到你。

這個不是異想天開,百度就已經開始研發針對視頻的每一幀來打標簽的技術,而最能讓群眾接受和喜聞樂見的針對視頻內容或者視頻幀的標簽,就是你們一直用的:彈幕

難道不是嗎?

標簽和權重

標簽的元數據類比定義,各種熱熱鬧鬧的優點,都算有點意思,但是依然還不夠深度和震撼,我們繼續深入一點點。

本質上,標簽就是一堆對等的特征信息。能理解不?不理解也沒關系,磊叔舉個說人話的例子就明白了。
假設我們系統中有幾個關于地區的標簽,比如說廣州、北京、上海、深圳、曲麻萊縣(我打賭你不知道這個地方在哪里),本質上這幾個地域名稱并無二致,完全一樣,是對等的。但當我們給某些信息打上這些標簽時,其實我們潛意識是有一個預期和判斷的,大致就是一線城市和十線縣城賦予信息的重要程度是完全不一樣的,即信息被打上廣州和被打上曲麻萊縣其實是具有完全不同的含義,那么也就是說:標簽是有權重的

標簽的這個特性徹底顛覆了本質上人人平等的標簽對等性,開始為標簽引入階級的權重。這種進化,大概等同于人類從原始社會一躍而入封建社會,而且是發達的封建社會。

  • 有了權重,標簽就有了分級
  • 有了分級,使用標簽的信息就有了分級
  • 有了權重,標簽就有了優先級
  • 有了優先級,使用標簽的信息就有了優先級
  • 有了權重,標簽可以滿足個性需求
  • 有了個性需求,使用標簽的信息就可以體現個性需求

終極形態:信息圖譜

標簽的元數據類比定義,各種熱熱鬧鬧的優點,還有了進化后的權重屬性,這下有點意思了,但是遠未夠深度和震撼,我們現在深入到底!

標簽直觀的感受和使用,大概就是知乎的話題、豆瓣的標簽等等,不僅可以標識出信息的特征,還能查看與該標簽相關的其他信息。這里磊叔要重復三遍:

  • 能查看與該標簽相關的其他信息
  • 能查看與該標簽相關的其他信息
  • 能查看與該標簽相關的其他信息

信息圖譜

爆點來了:標簽除了可以標記信息的特征,還能建立起信息的關聯。

說人話就是,通過標簽可以將信息之間建立某種聯系,最終將海量信息建立起相互關聯的信息網,也就是通過標簽可以建立起信息圖譜。

信息圖譜,是指信息與信息之間的聯系,通過網狀圖的形式展示信息與信息之間的關聯程度。

信息圖譜有兩個關鍵要素,一個是信息本身,一個是信息與信息之間的關聯關系。很明顯,標簽就是確立信息與信息之間關聯關系的的重要因素。信息與信息之間通過標簽建立聯系后:

  • 信息與信息之間即建立起雙向的聯系(只要我能找到你,你就可以找到我;光路可逆)
  • 更多的標簽會讓更多的信息關聯和組織在一起(我關聯著你們,你關聯著我們;信息網)
  • 同一個標簽可以關聯跨類型的信息(能從蘋果手機通過蘋果關聯到巴博薩啃得多汁蘋果)

以上是全文內容,以下是彩蛋,略晦澀,略逼格:

任何信息系統,無論你看的網易新聞、聽的蝦米音樂、看的豆瓣書籍、擼的羞羞電影,其本質是一個有限的無限系統,即我們在任何確切的時刻去考察任意信息系統,其蘊含的信息數量總是可以被確切描述的。簡單點說就是任何信息系統,在你高興的任何時間去數它的信息數量,一定是可以數清楚的。

在這個前提下,有一個數學領域的理論,一個仍然未被證實的理論就會發生巨大的作用:

Six Degrees of Separation,六度分隔,六度人脈

在網狀的人類社會中,任何人與任何人最多通過五個中間人即能建立聯系。本質上,任何兩個素不相識的人,通過有限的聯系,總能夠產生必然關系。也就是說,你可以在有限的聯系中認識地球上所有的人。

翻譯過來就是:

在網狀的信息系統中,任何信息與任何信息最多通過五個中間信息即能建立聯系。本質上,任何兩個毫無關系的信息,通過有限的聯系,總能產生必然關系。也就是說,你可以在有限的聯系中瀏覽到信息系統中所有的信息。

既然六度人脈依然是數學猜想,那么六度標簽也是磊叔的猜想,周末愉快~

 

作者:磊叔,非資深互聯網產品經理,視產品如己出,堅定不移的傳播產品是打磨出來的,崇尚“認真”和“尊重”的撕逼;一年不讓我旅游一次還不如殺了我吧。

本文由 @磊叔 原創發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 請問合理的打標簽有哪些好的方式?

    來自四川 回復
  2. 很好很好,加深了標簽的理解和應用

    來自廣東 回復
  3. 磊叔威武,二爺受教了 ??

    來自浙江 回復
    1. 666666666

      來自廣東 回復
  4. 您能給講講標簽的分級,垂直,交叉的不同及優劣嗎?我找不到這方面的介紹,謝謝您

    來自河南 回復
  5. 磊叔,求給個微信,有問題加您希望詳細討論一下,我最近在研究標簽機制,恰好看到您的文章,謝謝~

    回復
  6. 哈哈哈哈

    回復
  7. 信息圖譜有兩個關鍵要素,一個是信息本身,一個是信息與信息之間的關聯關系。

    來自山西 回復
  8. 磊叔大法好,不過產品標簽化很重要嗎?

    來自廣東 回復
    1. 是這樣的,因為我們的產品呈現給用戶的僅僅是冰山一角,真的是冰山一角。更多看不見的功能和機制都在后臺業務中,特別是我們需要分析各種業務數據,比如聚類、分類、語義理解等,還有我們的站內搜索引擎,通過標簽來查詢,以及支持自然語言查詢。這些都需要給一個內容打上幾千個標簽,我個人覺得標簽機制對于內容的管理和治理能力,是極大的提升。
      不過如果站內信息就那么幾萬,幾十萬條而已,倒沒什么所謂標簽了。

      來自廣東 回復
    2. 請問,打標簽具體如何實施呢?可有這方面的文章?

      回復