淺談淘寶類目屬性體系:商品搜索背后的邏輯架構(gòu)

3 評(píng)論 7781 瀏覽 88 收藏 11 分鐘

 

[核心提示] 淘寶擁有百萬(wàn)家商戶和超過(guò)10億的商品數(shù),它如何讓用戶精準(zhǔn)地找到想要的商品呢?其背后有著強(qiáng)大的技術(shù)支撐。

淘寶目前在線商品數(shù)超過(guò) 10 億,如何精準(zhǔn)的幫助用戶找到他想要的商品呢?經(jīng)過(guò)多年的探索,淘寶通過(guò)建立一套完整的類目屬性體系,終于較好的解決了這一問(wèn)題,今天就跟大家一起來(lái)談?wù)勌詫毜念惸繉傩泽w系。

一點(diǎn)點(diǎn)歷史和架構(gòu)

2003 年淘寶剛上線時(shí),商品量很少,沒(méi)有分類。 后來(lái),商品量上百,開(kāi)始有了對(duì)商品進(jìn)行單級(jí)分類,有點(diǎn)類似于現(xiàn)在的一級(jí)行業(yè)類目。

等到商品上萬(wàn)的時(shí)候,商品的單級(jí)分類已經(jīng)不能滿足需求,開(kāi)始有了多級(jí)分類,就是一顆類目樹(shù)了。從 06 年開(kāi)始引入了屬性,商家按照屬性模板填寫(xiě)屬性,用戶可以按照屬性篩選商品。

到了 08 年,開(kāi)始將前后臺(tái)類目分開(kāi),用戶根據(jù)前臺(tái)類目篩選商品,商家將商品掛到后臺(tái)類目上,前后臺(tái)類目樹(shù)之間建立好映射。

今天的淘寶類目屬性體系主要由后臺(tái)類目樹(shù)、前臺(tái)類目樹(shù)、掛載在后來(lái)葉子類目上的商品屬性模板以及管理前后臺(tái)類目之間映射關(guān)系的類目管理平臺(tái)組成,整體架構(gòu)如下:

tbshuju2

從圖中可以看出,淘寶類目屬性體系是一個(gè)非?;A(chǔ)的數(shù)據(jù)服務(wù),在商品發(fā)布頁(yè)上商家選擇后臺(tái)類目上傳商品信息,詳情頁(yè)上以面包屑的方式給用戶顯示商品所屬的前臺(tái)類目,在搜索結(jié)果頁(yè)上讓用戶根據(jù)前臺(tái)類目篩選商品。運(yùn)營(yíng)同學(xué)可以通過(guò)一個(gè)管理后臺(tái)來(lái)管理前后臺(tái)類目之間的映射關(guān)系以及后臺(tái)類目的屬性模板。

后臺(tái)類目

后臺(tái)類目面向商家,主要用于商品的分類和屬性管理。商家上傳商品時(shí)見(jiàn)到的就是后臺(tái)類目,如下圖:

tbshuju3后臺(tái)類目有如下特點(diǎn):

  • 后臺(tái)類目樹(shù)中最重要的是葉子類目,也就是類目樹(shù)上不能再往下分的類目,任何商品都必須掛載到后臺(tái)葉子類目上。
  • 葉子類目掛載屬性模版,商家發(fā)布商品時(shí)選擇好類目之后會(huì)根據(jù)屬性模版,補(bǔ)充必填的商品屬性信息,方可成功上傳商品。
  • 后臺(tái)類目相對(duì)穩(wěn)定,不能隨便刪除,葉子類目不能重復(fù)。

前臺(tái)類目

前臺(tái)分類面向用戶,方便用戶篩選查找商品,大部分時(shí)候用戶見(jiàn)到的類目都是前臺(tái)類目。下圖就是淘寶搜索結(jié)果頁(yè)上的淘寶前臺(tái)類目樹(shù):

TBshuju4

前臺(tái)類目有如下特點(diǎn):

  • 用戶購(gòu)買時(shí)看到的類目是前臺(tái)類目。
  • 前臺(tái)類目通過(guò)跟后臺(tái)映射間接和商品關(guān)聯(lián)。
  • 前臺(tái)類目由后臺(tái)葉子類目+屬性組成,一個(gè)前臺(tái)類目可以包含多個(gè)后臺(tái)類目,一個(gè)后臺(tái)類目也可以映射給多個(gè)前臺(tái)類目。
  • 前臺(tái)類目不直接掛載屬性模版,前臺(tái)類目對(duì)應(yīng)的屬性來(lái)自后臺(tái)葉子類目的公共屬性。
  • 前臺(tái)類目很靈活,可重疊,可刪除。

為什么要將前后臺(tái)類目分開(kāi)呢?

介紹完淘寶的類目屬性體系,或許你會(huì)問(wèn)為啥要將前臺(tái)類目和后臺(tái)類目分開(kāi)呢?直接用一套類目體系不就行了嗎?這里我就給大家解釋一下原因,到了 08 年,淘寶商品日益增多,類目層級(jí)也越來(lái)越深,買家越來(lái)越難找到想要的商品。淘寶的小二們就開(kāi)始不斷調(diào)整類目屬性,把類目樹(shù)變淺,讓商品更容易被買家找到。只有一套類目體系的情況下,小二每次調(diào)整,賣家也必須跟著調(diào)整。如果只是改一次,賣家也能勉強(qiáng)接受,但這是周期性的。比如,在夏天服裝這個(gè)類目下可能是連衣裙、襯衫等夏裝,到了冬天就會(huì)變成打底褲、羽絨服等冬裝了,而且賣家也都知道這些調(diào)整時(shí)合理的,但是一年到頭這么調(diào)整,意味著他一年到頭都在編輯類目,可能還得專門(mén)養(yǎng)個(gè)把人在那里,一天到晚改類目,無(wú)形中賣家的運(yùn)營(yíng)成本也就提高了。

08 年的時(shí)候,有個(gè)淘寶的產(chǎn)品經(jīng)理從線下零售巨頭沃爾瑪?shù)玫絾l(fā),他發(fā)現(xiàn)沃爾瑪倉(cāng)庫(kù)里面的類目分區(qū)和貨架區(qū)的類目分區(qū)是分離的,倉(cāng)庫(kù)里面的類目分區(qū)比較穩(wěn)定,很少變化,而貨架區(qū)的類目分區(qū)會(huì)根據(jù)活動(dòng)和季節(jié)經(jīng)常調(diào)整。類似的,淘寶也可以把原來(lái)的一套類目體系分為后臺(tái)分類和前臺(tái)分類,后臺(tái)分類面向商家,用來(lái)掛載商品和屬性模板,比較穩(wěn)定很少變化;前臺(tái)分類面向用戶,主要方便用戶查找商品,很靈活,可以經(jīng)常調(diào)整。后臺(tái)類目和前臺(tái)類目之間通過(guò)映射聯(lián)系起來(lái),一個(gè)后臺(tái)類目可以映射到多個(gè)前臺(tái)類目,一個(gè)前臺(tái)類目也可以包含多個(gè)后臺(tái)類目。

從技術(shù)的角度來(lái)看的話,前臺(tái)類目就是在后臺(tái)類目的基礎(chǔ)上建立了一個(gè)虛擬類目。

類目屬性體系在搜索上的應(yīng)用

先來(lái)看看類目屬性體系是怎么幫助提升搜索的精準(zhǔn)度的,下圖是說(shuō)明了用戶 query 到商品搜索結(jié)果的全過(guò)程:

tbshuju5

用戶輸入 query:iPhone,淘寶類目屬性體系預(yù)測(cè)到跟這個(gè) query 最相關(guān)的前臺(tái)類目是手機(jī),然后前臺(tái)類目通過(guò)映射找到后臺(tái)類目手機(jī),最終在這個(gè)類目下找到了“iPhone 5s 土豪金”這個(gè)商品。

有了類目屬性體系,用戶搜索 iPhone,淘寶就不會(huì)給出手機(jī)套這樣的配件了,因?yàn)樗粫?huì)到手機(jī)類目下去找商品。

有了類目屬性體系,用戶可以直接在搜索結(jié)果頁(yè)按照類目和屬性篩選商品,更加高效的找到想要的商品。而淘寶搜索可以通過(guò)記錄用戶搜索 query 之后的類目屬性篩選行為,精準(zhǔn)預(yù)測(cè)每一個(gè) query 的類目和屬性意圖,當(dāng)用戶再次搜索的時(shí)候,可以根據(jù) query 的類目屬性意圖,在 query 文本相關(guān)性的基礎(chǔ)上計(jì)算出商品的類目和屬性相關(guān)性,把包含 query,且跟用戶的類目和屬性意圖最相關(guān)的商品優(yōu)先展示給用戶。這也是百度這樣的通用搜索引擎所做不到的,因?yàn)樗鼪](méi)有類目屬性體系。

有了類目屬性體系,還可以做好搜索算法的垂直化優(yōu)化。也就是在每一個(gè)細(xì)分類目下,可以采用不同的商家權(quán)重和品牌權(quán)重,甚至可以有不同的排序公式。比如用戶選擇手機(jī)時(shí),更多考慮各項(xiàng)參數(shù)和評(píng)測(cè)文章,這個(gè)時(shí)候相應(yīng)的排序權(quán)重因子可以加強(qiáng),而選擇服裝的時(shí)候,一張漂亮的主圖就無(wú)比重要了,排序因子里面主圖質(zhì)量的權(quán)重就需要提升了。 有了類目屬性體系,還可以做基于類目和屬性的個(gè)性化搜索。搜索引擎通過(guò)用戶的類目屬性篩選日志,可以挖掘出用戶的一些特征,比如性別,意向價(jià)格區(qū)間,偏好品牌,偏好品類等,從而可以對(duì)這個(gè)用戶做個(gè)性化的展示。

類目屬性體系無(wú)處不在

除了電商,其實(shí)在各個(gè)需要幫助快速查找信息領(lǐng)域都可以見(jiàn)到類目屬性體系的身影。比如:教育行業(yè)里面的課程分類,醫(yī)療行業(yè)的疾病和醫(yī)院分類。當(dāng)我們把用戶查找的信息看做一個(gè)個(gè)實(shí)體的時(shí)候,對(duì)實(shí)體分類以幫助快速定位查找就是一個(gè)非常通用的方法。從這個(gè)角度來(lái)講,Google 的 Knowledge Graph 可以看做是將電商網(wǎng)站里面的商品類目屬性體系推廣到了整個(gè)世界中的萬(wàn)事萬(wàn)物,它試圖使用一套統(tǒng)一的類目屬性網(wǎng)來(lái)囊括所有的實(shí)體,或許這就是通用搜索引擎的類目屬性體系吧。

來(lái)源:@葛燦輝-搜索數(shù)據(jù)挖掘/搜索產(chǎn)品經(jīng)理
 
 

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 前臺(tái)類目和后臺(tái)類目區(qū)分開(kāi)是明智的,一個(gè)相對(duì)固定一個(gè)相對(duì)不固定

    來(lái)自廣東 回復(fù)
  2. 這不就是淘寶那些事里的內(nèi)容嗎

    來(lái)自北京 回復(fù)
    1. 哈哈,又一個(gè)抄襲

      來(lái)自福建 回復(fù)