電商入門(4):如果我來負(fù)責(zé)搜狗云表情的搜索功能,會怎樣去優(yōu)化?
通過體驗云表情APP的搜索功能,本文作者希望從APP端展現(xiàn)出來的規(guī)律和現(xiàn)象,猜測目前云表情搜索功能的后臺邏輯,進而假設(shè)如果是自己負(fù)責(zé)云表情搜索功能,會怎樣去優(yōu)化搜索。
之前抽出時間體驗了一下搜狗云表情APP,這是一款工具型APP。先說說為什么會把它列入到電商入門的系列里面呢?因為之前有說過,如果有機會,我要說一說電商里面的另一個靈魂——搜索,現(xiàn)在積蓄還不夠,所以會抽出時間去研究一下其他具備搜索功能的APP,希望能逐步提煉出一些自己的東西,以后才有可能寫出電商領(lǐng)域的搜索。(ps:如果把云表情的單個表情比作電商的一個sku,你可能會對我的意圖理解得更深刻些~)
通過體驗云表情APP的搜索功能,我希望從APP端展現(xiàn)出來的規(guī)律和現(xiàn)象,猜測目前云表情搜索功能的后臺邏輯,進而假設(shè)如果是自己負(fù)責(zé)云表情搜索功能,會怎樣去優(yōu)化搜索。
所以本文的大概框架和思路是:現(xiàn)象?→?猜測?→?優(yōu)化,一共寫了4個case:分類及元素歸屬、關(guān)鍵詞匹配效率、語義分析以及標(biāo)簽體系。
注:下文元素指一個表情(jpg、gif、……)
Case1:分類及元素歸屬
現(xiàn)象:
- 輸入任意不同關(guān)鍵詞,轉(zhuǎn)搜索結(jié)果頁,可見結(jié)果列表分暴漫、視頻截屏、卡通形象、純文字4類聚合展示全部匹配元素;
- 切換分類,比如從暴漫切換到視頻截屏,各類中所包含的元素不重復(fù)。
猜測如下:
- 沒有前、后臺分類的區(qū)分,前臺分類即為后臺分類,也就是說云表情后臺只有:暴漫、視頻截屏、卡通形象、純文字4個分類;
- 每一個元素只能歸屬于一個后臺分類,進而導(dǎo)致每一個元素只能歸屬于一個前臺分類。
優(yōu)化:
后臺分類是用來管理素材的,一般枝葉較密;前臺分類是方便用戶篩選的,一般枝葉稀疏,兩者用途不一樣。從可擴展性角度出發(fā)(素材增多),前、后臺分類一致不利于日后類目擴展以及應(yīng)對素材急劇增加帶來的問題。
- 建立前臺分類和后臺分類;
- 一個前臺分類可對應(yīng)多個后臺分類;
- 每一個元素僅可掛在一個后臺分類上,但在前臺展示時,可能出現(xiàn)在多個前臺分類中。
Case2:關(guān)鍵詞匹配效率
現(xiàn)象:
分別輸入“快樂”、“快樂寶”、“快樂拉”和“寶拉”4個關(guān)鍵詞(由表情包“快樂寶拉”拆分得來):
- “快樂”和“快樂寶”可搜索得到“快樂寶拉”表情包,“快樂拉”和“寶拉”無表情包展示,但在結(jié)果列表中有“快樂寶拉”相關(guān)元素展示;
- 搜索“快樂拉”關(guān)鍵詞,在結(jié)果列表中包含“快樂”、“快樂寶拉”和“拉”3者元素之并集。
猜測如下:
- 依據(jù)關(guān)鍵詞優(yōu)先查詢表情包庫,若無匹配表情包(名稱),則僅在結(jié)果列表中展示全部與(已拆分)關(guān)鍵詞匹配的元素;
- 表情包搜索不支持表情包(名稱)中間空缺(如快樂*拉這樣),但支持尾部空缺(如快樂寶*這樣)[注:但某些關(guān)鍵詞,如“快樂”,卻能匹配出“我超快樂”表情包];
- 按關(guān)鍵詞搜索元素時,結(jié)果列表包含該關(guān)鍵詞所有被拆分的有效(包括模糊匹配)關(guān)鍵詞包含元素之并集。
優(yōu)化:
- 優(yōu)化搜索關(guān)鍵詞與表情包(名稱)匹配效率,如“寶拉”和“快樂*拉”能匹配出“快樂寶拉”表情包;
- 優(yōu)化結(jié)果列表(即有效(包括模糊匹配)關(guān)鍵詞包含元素之并集)排序,如優(yōu)化搜索“快樂拉”關(guān)鍵詞的結(jié)果展示列表。
Case3:語義分析
現(xiàn)象:
- 分別輸入“開心”、“快樂”和“高興”3個同義詞,轉(zhuǎn)搜索結(jié)果頁:
- 關(guān)鍵詞“開心”對應(yīng)結(jié)果頁,匹配出了“不開心”表情包;
- 各關(guān)鍵詞對應(yīng)結(jié)果列表頁中元素有交集(比例很高)。
猜測如下:
- 尚未做語義分析功能;
- 假設(shè)第一條成立,那么同義詞搜索對應(yīng)結(jié)果呈現(xiàn)出高相似度的現(xiàn)象,可以說明一個元素可能對應(yīng)多個標(biāo)簽,比如結(jié)果中相同元素均具備“開心”、“快樂”和“高興”三個標(biāo)簽,所以不論搜索“開心”、“快樂”還是“高興”,它們都能出現(xiàn)在結(jié)果列表中。
優(yōu)化:
優(yōu)化語義分析功能,至少在搜索結(jié)果中不能出現(xiàn)自相矛盾的元素,比如搜索“開心”,結(jié)果中出現(xiàn)“不開心”元素。
Case4:標(biāo)簽體系
現(xiàn)象:
- 輸入關(guān)鍵詞“開心”,轉(zhuǎn)搜索結(jié)果頁:
- 開心?表情包中部分表情,并未展現(xiàn)在下方結(jié)果列表中。
猜測如下:
- 每一個元素都存在一個或多個關(guān)鍵詞(標(biāo)簽),同一個表情包可以收錄具備不同標(biāo)簽的元素(通過其他案例發(fā)現(xiàn)同一個元素可以被不同表情包收錄);
- 補充:通過以上case2其實還可以猜測:后臺可能沒有從表情包的維度去維護標(biāo)簽(對表情包來說,可能僅僅只維護了一個表情包名稱)。
優(yōu)化:
- 一個表情包代表同類型元素的合集,它們一般具有相似的屬性(標(biāo)簽),后臺可以在表情包的維度維護標(biāo)簽,表情包下所有元素繼承表情包的標(biāo)簽,這樣可以解決當(dāng)搜索“開心”時,“開心?”表情包中所有元素也會陳列在下方結(jié)果列表中。
- 后臺建立完善的表情包體系,因為在元素日益增多時,元素分門別類以表情包這個維度聚合必然是未來的發(fā)展方向。
我最近也是想多積累一些搜索相關(guān)的知識點,歡迎大家和我討論,在底下留言就可以了~
持續(xù)產(chǎn)出干貨是我的初衷,相信也是你關(guān)注我的初衷!
相關(guān)閱讀
作者:QJQ,微信公眾號:倔牛的人生
本文由 @QJQ 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來源于網(wǎng)絡(luò)
然后就是不斷的評估建模bulabula
其實都是本質(zhì)標(biāo)簽體系,切分term,在把這些term經(jīng)過一系列的數(shù)據(jù)計算加權(quán)(包括詞的基礎(chǔ)熱度、詞相關(guān)性、圖本身質(zhì)量等等維度)等最終得出分值再展現(xiàn)
同建議做個配圖,方便理解
贊一個文章調(diào)理清楚,如果配圖就能不用費勁腦補咯。
另外我認(rèn)為這樣類比有點牽強,畢竟前后端菜單掛靠的設(shè)計電商是標(biāo)配?;蛟S可以找?guī)讉€小伙伴組隊一起,分專題討論,一個人負(fù)責(zé)一個平臺。京東淘寶亞馬遜一人一個,從葉子類目的維護到搜索,從運費模板設(shè)計到排名競價,或許針對性強一點哈。
本文相對電商入門系列前3篇文章,確實有點晦澀。
研究電商搜索的時候一般最好是研究電商,但是為了積累其他行業(yè)內(nèi)搜索相關(guān)功能知識點,退而求其次的選擇了一些不相關(guān)的東西,哈哈哈~
電商的搜索太復(fù)雜了,如你所說的,和類目、商品屬性等等一系列都有關(guān),如果可以咱們可以一起討論啊,搜索我之前也沒接觸過,還在學(xué)習(xí)中,需要和各位朋友學(xué)習(xí)~
關(guān)鍵詞匹配搜索這里,我認(rèn)為是采用了 文本分詞和ES搜索。
(“快樂”和“快樂寶”可搜索得到“快樂寶拉”),是因為前綴匹配;
(“快樂拉”關(guān)鍵詞,在結(jié)果列表中包含“快樂”、“快樂寶拉”和“拉”)是因為“快樂拉”分詞成了“快樂”和“拉”,然后通過ES搜索出來;
(“快樂”,卻能匹配出“我超快樂”表情包)同樣是因為ES搜索的結(jié)果。
而采用這種分詞和搜索方式,優(yōu)化點恐怕是不好解決了。
可以,可以,我先去研究下文本分詞和ES搜索這兩個詞的概念,看來搜索這塊兒我還是很業(yè)余的,哈哈哈