揭秘淘寶搜索?那段故事

0 評論 5085 瀏覽 7 收藏 20 分鐘

【7哥導讀】本文是《揭秘淘寶搜索》系列文章的第一篇,主要介紹了搜索的特點,系列文章的規(guī)劃,以及淘寶搜索的歷史和變化。可以作為了解淘寶搜索的入門級的文章,不懂搜索的人也能看得懂,懂搜索的人可以有更整體的概念。

寫在前面

終于要開始寫揭秘淘寶搜索的文章了,2013年1月自媒體”鬼腳七”剛開始的時候,我說如果微信”鬼腳七”粉絲數(shù)達到10萬,我就開始寫《揭秘淘寶搜索》,在這個賬號中連載,沒想到很快就到了。當時我還在負責淘寶搜索的產(chǎn)品,現(xiàn)在我不再負責淘寶搜索業(yè)務,正好可以專心寫淘寶搜索的文章。

  之所以寫想寫這個系列的文章,有幾個原因:

1、淘寶搜索對于一個賣家來說,太重要了。目前又沒有系統(tǒng)性的介紹,我之前答應過要寫,這次剛好有機會??梢怨┵u家參考。

2、我負責了4年多的淘寶搜索技術和產(chǎn)品,如今不再負責搜索業(yè)務了,也希望能寫一些文章,做為總結。也算對自己交代。

3、目前對于購物搜索方面的文章太少,我寫出來,可以讓其他做購物搜索的同仁們有所借鑒。

搜索這十多年,就像一幕電影。我現(xiàn)在只不過把劇本零星的整理出來形成系列的文章。

我假定的讀者對象是搜索相關產(chǎn)品和技術人員、所有淘寶和天貓上的賣家,以及其他對購物搜索感興趣的朋友。因此文章不能太技術,但又不能太沒有技術,這是很有挑戰(zhàn)的地方。所以大家不要期望太高,照顧一下其他讀者。

雖然是計劃寫揭秘淘寶搜索系列,但我希望我的文章包括淘寶搜索、一淘搜索、天貓搜索、以及阿里巴巴B2B的搜索,也不會有真的內(nèi)部秘密要公開,能公開的就不是秘密。

 那幾個搜索引擎

B2B、B2C、C2C這些名詞想必都很熟悉,還有現(xiàn)在比較新潮的O2O, C2B。所謂的模式,都是做出來以后總結出來的。先知先覺設定某個模式,然后去搞,十有八九不會成功。此文章系列不談這些,著重談搜索技術,不同的搜索引擎,搜索的原理基本一致,只是在產(chǎn)品策略,排序因素上有各自的特性。

如果講這幾搜索引擎技術的完整性,一淘搜索最完整。具體技術以后再講,先說說一淘搜索。

中國最大的全網(wǎng)購物搜索是一淘搜索(淘寶搜索不是全網(wǎng)購物搜索),但明顯一淘搜索還不屬于購物的主要入口,相比淘寶本身還很小,看似一個很好的應用,卻一直沒有得到市場的認可。原因是多方面的,我這里列幾個:

當市場一家或幾家獨大的時候,站內(nèi)的購物搜索已經(jīng)能解決用戶90%的需求,全網(wǎng)購物搜索引擎的需求不大;

購買商品不同于瀏覽網(wǎng)頁,需要輸入賬號,很少有人愿意到一個地方搜索,然后到另外一個地方重新輸入賬號、瀏覽、購買,然后再回來進行搜索的;

各個電商網(wǎng)站的數(shù)據(jù)非常不一樣,如果搜索產(chǎn)品想做到非常好用,技術難度不是一般的高。

淘寶搜索是最有挑戰(zhàn)性的。我從2000年開始做搜索技術,先后做網(wǎng)站的站內(nèi)搜索、企業(yè)知識搜索、網(wǎng)頁搜索,最后做淘寶搜索。這十幾年中,遇到最具挑戰(zhàn)性的就是淘寶搜索。雖然數(shù)據(jù)量不是最大的,但其技術的復雜性,一點都不低于網(wǎng)頁搜索,更具有挑戰(zhàn)的是,其產(chǎn)品策略太難制定,在考慮用戶體驗的同時,還需要考慮幾百萬賣家的利益。而且道高一尺魔高一丈,無論多好的策略,很快就可能被市場破壞。

天貓搜索和淘寶搜索都是同一套技術體系,因為他們要解決的問題都是一樣的。天貓的數(shù)據(jù)量小,商家數(shù)只有淘寶商家數(shù)的百分之幾,商品量也很小,天貓搜索的產(chǎn)品策略和淘寶搜索有明顯的不一樣。天貓搜索不擔心馬太效應(馬太效應是指大者越來越大,小者很難成長),天貓可以通過制度要求讓賣家配合很多規(guī)則,例如商標、圖片、正品要求、發(fā)票等。當然,天貓搜索還會倡導品質(zhì),而不是便宜。

淘寶搜索和天貓搜索都有兩個類型的應用,一個是直接關鍵詞搜索,一個是類目瀏覽(也就是list)。前者好理解,后者是指當用戶通過某個類目名稱進入到商品列表頁的時候,出現(xiàn)的搜索結果。這兩者都是調(diào)用的同一個后臺,只不過排序因子有些不一樣。

阿里巴巴B2B的搜索,也就是1688的搜索,我自己還不太了解,等過些天我去拜訪一下相關的負責人,再向大家做介紹。

 淘寶搜索VS. 網(wǎng)頁搜索

我們平時用網(wǎng)頁搜索引擎更多,為了讓大家更清楚了解淘寶搜索的特點,我這里把網(wǎng)頁搜索和淘寶搜索的特點做個對比。

 一、搜索流量的價值

淘寶上每個賣家店鋪流量來源主要分成三部分:推廣流量(付費廣告或免費活動);老客戶(直接登錄、收藏等);搜索流量。由于推廣活動的持續(xù)性問題,搜索流量基本上決定了一個店鋪新客戶來源。如果一個店鋪新客戶來源不夠的話,在市場上會日益衰落。

目前的網(wǎng)頁搜索引擎公司,盈利的主要來源還在搜索廣告。但對于網(wǎng)頁搜索引擎來說,不是所有的流量都有價值,例如:在百度上搜索“李湘”,估計就沒有什么廣告,大多是明星新聞八卦什么的。一般的網(wǎng)頁搜索流量中,大約20%~30%的搜索詞是有商業(yè)價值的(適合出廣告)。淘寶搜索不一樣的是,基本上99%的流量都是有商業(yè)價值的。搜索“李湘”,會出來減肥茶;在韓寒和方舟子鬧得很厲害時,搜索“韓寒 VS 方舟子”也有很多個性T-shirt結果。某種程度上可以說,如果淘寶搜索流量有10億,其價值估計相當于網(wǎng)頁搜索流量40億的商業(yè)價值。

在淘寶搜索上,如果要賣廣告,是最好融合的。因為淘寶搜索的結果本身就是商品,廣告也是商品,二者沒有區(qū)別。

 二、搜索的社會影響

這個和淘寶本身的社會影響相關聯(lián)。現(xiàn)在淘寶賣家數(shù)達到800萬,活躍賣家數(shù)應該在200萬左右。我們假設平均每個活躍賣家背后有5個人,那么直接在淘寶上就業(yè)的人就有1000萬人,如果加上其他兼職賣家、快遞公司、第三方服務公司等,估計能到2000萬人。每天有上億的用戶上淘寶去買東西。淘寶任何一個規(guī)則的變化,對整個社會都會有不小的影響。

2012年淘寶、天貓雙十一,整個交易額達到191億,考驗的不只是淘寶、淘寶賣家、淘寶買家,還有物流快遞公司、銀行支付系統(tǒng)等。試想有一天淘寶忽然停業(yè)一天,全國有多少人都得在家打麻將了。同理,搜索的任何一個變化,都會影響淘寶賣家,通過賣家會影響到買家、第三方物流……

不知道有多少人還記得2010年7月份搜索規(guī)則的變化,已經(jīng)由一個公司內(nèi)部的技術變革,演變成一個社會事件。這個在本文后面會有專題介紹。

 三、搜索的實時性

如果有人自己建了個網(wǎng)站,網(wǎng)頁搜索引擎要是一兩個星期沒有收錄這個網(wǎng)站,站長也不會太著急。但在淘寶上不一樣,必須是實時或者接近實時的。賣家發(fā)布一個商品,希望幾分鐘后就能搜索到。因為商品是實體,賣一件少一件,價格也會有變化,賣家還會經(jīng)常搞活動,如果信息更新不及時,就會誤導買家,造成糾紛。這些對搜索的實時性要求非常高。

在淘寶上,每天會有上億的商品信息發(fā)生變化,包括上架、下架、銷量、價格、屬性、描述的變化等。這些商品絕大部分都會在幾分鐘之內(nèi)反應到搜索結果中去,如果要做到實時的呢? 這對技術帶來的挑戰(zhàn)是巨大的。淘寶最開始更新的周期是半個小時到40分鐘,到2012年已經(jīng)縮短到三四分鐘之內(nèi)了。當然,晚上系統(tǒng)做更新的時候,數(shù)據(jù)更新會稍微慢一些。

  四、搜索的查全率

查全率是個專業(yè)術語。所謂查全率,就是搜索鞋子,找到的鞋子數(shù)量占總體鞋子數(shù)量的百分比。類似的術語還有相關性,相關性就是指搜索結果和搜索詞是否相關。例如:搜索“做自己”,出來《做自己》這本書就算相關,出來《做自己的口才專家》就屬于不相關。搜索手機,出來手機鏈也屬于不相關。

網(wǎng)頁搜索是會做一些消重和過濾的。我們在網(wǎng)頁搜索時,最不希望看見的就是一摸一樣的重復結果。在淘寶搜索中,我們也不希望看見太多的重復結果,但同時又希望有不同的商家可以對比,有不同的地域可以選擇。對于賣家來說,如果自己店鋪的寶貝因為跟其他店鋪重復而不出現(xiàn)的話,一定會詢問為什么,淘寶的客服電話很快就會打爆了。

淘寶搜索,一方面要考慮買家的體驗,一方面又要考慮賣家的利益,這就需要采用很多不同的技術解決。

 五、搜索的反作弊

有一項很吃香的職業(yè),叫搜索引擎優(yōu)化(SEO),他們的主要工作就是如何讓制定的結果在搜索引擎中排名靠前。如果用正常手段,叫SEO,如果用一些欺騙的手段,就叫作弊。網(wǎng)頁搜索和淘寶搜索上作弊的人都非常多,因為搜索引擎的重要,導致有太多的利益驅(qū)動。雖然都有作弊,但手段很不一樣。

在淘寶搜索上是直接和交易相關,所以作弊更加瘋狂;同時檢測作弊的對象又是淘寶的賣家,如果算法有誤殺,會導致正常的賣家受到損失,這個損失經(jīng)常是這個賣家不可承受的。如何進行搜索的反作弊,也是一項很有挑戰(zhàn)的技術。

  阿基米德

淘寶搜索這幾年,最大的變化有兩個,一個是阿基米德,一個是個性化搜索。這是我在負責淘寶搜索期間,主導的最重要的兩個項目。阿基米德的上線,奠定了整個淘寶搜索的框架,直到現(xiàn)在,搜索的排序算法還是基于當時建立的框架。如果說阿基米德是過去和現(xiàn)在,那么個性化項目則是淘寶搜索的未來。從2012年開始在個性化排序和推薦上做了很多工作,2013年也是重點。個性化以后會有專門的文章來介紹,這里只介紹阿基米德。

2010年7月8日,淘寶搜索新排序算法阿基米德上線。由于排序算法變化大,導致很多賣家的流量波動非常大。特別是靠之前規(guī)則獲得很多流量的賣家,這次規(guī)則的調(diào)整,導致他們流量大幅下降,因此很多賣家開始圍攻淘寶。這就是7.8事件?;貞洰敃r的情景,我仍然歷歷在目。

 

以下內(nèi)容摘選自我在2010年8月發(fā)給所有淘寶內(nèi)部小二的郵件:

Hi 大家好,

想必這段時間大家從各方渠道都聽到了不少賣家的聲音,有新聞、有論壇、有抗議的、有拉橫幅的,肯定也有賣家直接找到我們小二來詢問,背后到底發(fā)生了什么?搜索規(guī)則的修改真的是像外界說的一樣么?相信每個小二都有疑惑。

夜深人靜,我來給大家做個詳細介紹。

 不是前言的背景

以前的搜索,一直是簡單的原則:消保優(yōu)先、相關性、櫥窗推薦的三大前提下,按照下架時間排序。

存在的一些不好的現(xiàn)象:

1. 一個貌似對賣家很公平的原則,從實際展現(xiàn)數(shù)量和點擊數(shù)量來看,還是被一些針對規(guī)則做了很多優(yōu)化的大賣家把持著;

2. 對于消費者也沒有任何公平可言,因為最重要的排序因素下架時間,消費者不關心。消費者最關心的賣家服務質(zhì)量,卻沒考慮在內(nèi)。

3. 流量浪費非常嚴重,不少賣家每天得到流量很大,但成交比例非常低。有的賣家經(jīng)常每天上千個搜索點擊流量,只有一到兩單的成交,有的甚至一單都沒有。

4. 很多賣家花很多心思琢磨如何給店鋪增加更多的流量(不排除通過作弊等方式),但通常忽視對于買家的服務質(zhì)量。

我們希望那些服務質(zhì)量好的賣家,能自然得到更多的流量。服務越好,流量增長越多!

我們希望那些得到流量的賣家,如果服務質(zhì)量不好,流量會越來越低!

我們希望賣家可以花更多的時間和精力在如何服務好買家,而不是挖空心思想搞流量!

于是我們有了阿基米德!

 什么是阿基米德

2010年,淘寶消費者年。

每天是誰在直接接觸消費者?不是淘寶幾千名小二,而是淘寶幾百萬的賣家。如果賣家對消費者的服務越來越好了,那么消費者的體驗會越來越好!

阿基米德,簡單說,就是把“店鋪服務質(zhì)量”作為重要因素加入到搜索中來影響排序。7月8日上線阿基米德以后,目前的排序規(guī)則是:

消保優(yōu)先、相關性、櫥窗推薦的三大前提下,在一定時間范圍內(nèi),按照店鋪服務質(zhì)量權重排序。

目前影響店鋪服務質(zhì)量參考的因素有很多,包括:是否違規(guī)、是否作弊、退款率、超時退款率、發(fā)貨速度、旺旺響應速度、滯銷商品率…….等。參數(shù)有幾十個,只是權重不一樣。

 阿基米德的影響

這次調(diào)整,確實對賣家的影響比較大,應該說是幾家歡喜幾家愁。各方面的新聞報道,就不計其數(shù);來淘寶抗議的賣家,也來了幾波了。

這個情況下,來看看整體數(shù)據(jù):

1 搜索帶來的UV成交轉(zhuǎn)化率至少提升7.942%,搜索結果點擊率提升4.14%,退款率下降19%

2 今天剛收到BI同學做的全站對比分析數(shù)據(jù):

 全網(wǎng)UV下降明顯

大家都知道6、7、8月是淡季,我不擅長做數(shù)據(jù)分析,但有一點是可以說明的:阿基米德的上線沒起啥壞作用,也并不是很多抵制搜索排序改版的人說的那樣。

這次調(diào)整,對于P4P廣告的收入沖擊很大,上線的第一周,搜索右側(cè)的廣告收入,下降了約10%左右。主要的原因就是因為消費者使用搜索時點擊搜索結果更多 了,點擊廣告更少了。超凡、龍飛、三多對這次變化,表現(xiàn)出了高度的姿態(tài):支持搜索的改變!老陸、三豐、東邪也紛紛表示:不要擔心收入下降,只要對消費者有 更好的體驗,支持!

加上數(shù)據(jù)的支持,給予搜索部門同事更多的信心!

這次事情對搜索部門的影響就更加深遠了,在提升消費者體驗方面,可以在排序上做更多的工作。同時,也可以真正利用排序的變化,來引導賣家的行為!讓搜索排序成為撬動賣家行為的支點吧!

—-鬼腳七

2010.8.7

從現(xiàn)在來看當時的目的,已經(jīng)完全達到了,只是當時有點鬧騰。

好吧,那就是一段故事,都過去了。

為什么會有這么糾結的地方,思考一下淘寶搜索所處的位置。淘寶搜索的任何變化,需要考慮三方面的因素:買家、賣家、平臺。買家的體驗是第一位的,需要平衡眾多賣家的利益,還要考慮平臺的健康發(fā)展。

通過這篇文章的描述,應該對淘寶搜索有了大體的印象。不要著急,下次的文章我會專門介紹淘寶搜索系統(tǒng)的原理,逐漸比較技術。如果有耐心看完這個搜索系列文章,就算他不能成為搜索專家,一定能對搜索的邏輯非常清楚。

文章來源:鬼腳七的微信

本文由“人人都是產(chǎn)品經(jīng)理”QQ群④群的 ?Charles-PM-北京 推薦

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!