搜索PM:Query“長尾詞”的分析及處理思路

4 評論 18582 瀏覽 148 收藏 24 分鐘

做搜索、排序,乃至搜索推薦的PM,都需要關注長尾詞的處理。這篇是某電商搜索技術大牛的討論和分享,同時我結合之前做內容和電商搜索的經驗,會加以整理、梳理、加粗。整體都是干貨滿滿,都是從實戰經驗所得,可以參考學習。

PM角度理解“長尾詞”

今天的主題是雜談,長尾詞是什么?

在百度百科上,長尾詞解釋是:非目標關鍵詞但也可以帶來搜索流量的關鍵詞,這是一個明顯的SEM的長尾詞解釋。

用我們做搜索產品經理的“人話”來說:長尾詞就是那些個每天搜索量不是很多,但是一直都有搜索量的詞。

首先,我們給個結論,長尾詞是個金礦

一、長尾詞有些什么特征呢?

(1)比較長

這個“長”和長尾詞的長不是一個意思,一般的搜索詞都比較精煉,比如只有一兩個詞語,一般不超過三個,而長尾詞可能有5、6個短語組成。

(2)搜索意圖一般都比較明確

就是說用戶搜長尾詞的話,一般搜索的意圖都比較明確。

比如:如果用戶搜索范冰冰李晨,可能用戶只是聽說了這兩個人有聯系,搜索只是想看看范冰冰和李晨到底有什么聯系;但是如果搜索范冰冰李晨康熙來了,那么這個用戶很可能知道他倆有一腿,并且知道他們上了康熙來了,然后想搜索出那一期的康熙來了來看看,所以意圖比第一種情況明確多了。

(3)搜索次數比較少

這個很好理解,搜索范冰冰李晨的搜索肯定比范冰冰李晨康熙來了的人要多的多得多。

(4)總量特別巨大

雖然說搜索次數少,但是使用搜索的人多啊,腦洞也大啊,所以長尾詞的搜索量總的來說是巨大的。

所以今天,我們來聊聊長尾詞,我們不分析大搜的長尾詞優化,還是講垂直類搜索的長尾詞。

垂直類的長尾詞一般分成兩種:

  1. 一是有搜索結果的,只是被搜索的次數比較少,這種不在優化范圍內,即便要優化也是對排序的優化。
  2. 一種是這個長尾詞沒有搜索結果,這種是需要優化的,要優化到有個結果。

二、長尾詞的處理?

從搜索引擎端來看,長尾詞是個金礦,我們知道一般的事物都會滿足二八原則,搜索引擎也不例外,一般20%的搜索詞占用了80%的流量,甚至更多,剩下80%的搜索詞都屬于長尾詞。

如果優化這一部分搜索詞的體驗直接影響到用戶的留存率,有時候用戶就是通過一兩個詞的搜索就會主觀判斷出哪個搜索引擎更好,我們看個大搜的例子。

比如我們搜索多路求交,這是一個比較專業的詞語,同時也是一個不太常用的詞語,屬于長尾詞的范圍。

1. google搜索

我們在google搜索的話,出現的是下面的搜索結果(第一個結果請忽略,是我文章寫出來以后被收錄的),前幾個結果感覺比較靠譜吧,至少說的都是算法方面的東西,而且確實是求交集的文章。

搜索PM:Query“長尾詞”的分析及處理思路

2. 百度搜索

然后我們再看看百度的搜索結果,對于這種結果,我只能是呵呵了。

(大部分互聯網人都使用google搜索是有原因的,尤其是開發等專業性強的崗位?;蛟S百度搜索專業性領域不行,但八卦、趣聞或一些分享文檔倒還不錯)

搜索PM:Query“長尾詞”的分析及處理思路

很明顯,一個正常的人,要是搜幾次偏一點的東西都是出現上面的結果,那必然會覺得google更靠譜了。

好,我們來看看,這個搜索詞在這兩個搜索引擎端都做了什么?(重點原理思路)

(1)在google端

  1. 他分析了這個搜索詞,然后把這個搜索詞變成了多路/求交集,
  2. 這樣的搜索詞,并且他認為交集是這個搜索詞的重要詞(中心詞),排序上占優,
  3. 所以這樣分析完以后,即便搜索出來的很多不太相關的東西,但是排序以后出來的結果也比較靠譜了。(中心詞,即此時搜索權重最高)

(2)我們再看看在百度端

  1. 百度做了啥呢?呵呵,直接切詞成多路/求/交了,
  2. 首先沒管詞序,所以出現了第一個求多路這樣的詞組合,
  3. 第二因為搜索不到結果,所以把這個關鍵詞去掉了繼續搜,出現了第二個多路公交這樣的文章,
  4. 后面的結果完全沒法看了(他們爬蟲估計也有問題,呵呵呵呵呵呵)。

上面是在通用搜索引擎端遇到長尾詞,直接影響的是用戶體驗。

3. 淘寶京東搜索

如果是在垂直搜索領域(比如說電商領域)遇到長尾詞,那可能直接影響到的就是訂單了,

比如我們在淘寶、京東搜索:喇叭 高腰 牛仔 七分 李維斯(為了避免廣告嫌疑,搜索結果沒有截圖)。

淘寶:

搜索PM:Query“長尾詞”的分析及處理思路

京東:

搜索PM:Query“長尾詞”的分析及處理思路

這種詞是一個搜索意圖非常明確的長尾詞,我們看看京東和淘寶分別做了什么。

(這里不做搜索結果的好壞比較,因為京東的服裝本來就比淘寶的服裝要少,搜索不出來很正常),看看中國第一和第二大電商為了這個長尾詞能盡可能多的讓用戶點擊搜索結果都做了啥。(提升搜索點擊轉化率的策略)

首先,他們都分析了這個長尾詞,找到了他們認為比較關鍵的詞,這一步兩邊得出來的結果就很不一樣了。(兩者認為“比較關鍵的詞”不同,影響搜索召回。而認為不同的原因,有自身商品庫是否存在該品類、品類豐富的有關)

淘寶認為李維斯這個品牌不是重要的詞,直接去掉了,淘寶認為前面這些個描述才比較重要,是用戶的主要意圖,他給推薦了喇叭,高腰,牛仔,七分這幾個詞的三三組合。(淘寶在這里的策略:是弱品牌,以商品的屬性(參數)為重。

即認為用戶是追求是符合參數的商品,品牌可能只是作為參考,權重一般。

為什么會這樣的?聽起來其實不符合邏輯對吧?

但我們細想一下:淘寶不像天貓、京東、唯品會等,不是“以品牌”為調性,更多是中小企業賣家,甚至是DIY設計師等;同時,奔著淘寶購物的用戶畫像,也并非是要以品牌非買不可等等。

基于這樣的情況,弱品牌,重參數是囊滿足“人”、“貨”的出發點,能平衡“場”。

京東搜索分析出來以后,覺得李維斯,牛仔才是重要詞,用戶主要意圖在這個品牌上面而不在款式上,所以直接給出了牛仔,李維斯作為推薦詞進行搜索。

誰好誰壞,大家各自心里有各自的想法,也許女生覺得淘寶的好,男士覺得京東的好,這個東西沒什么定論的。(因為用戶畫像也是很關鍵,技術或許有標準,但落地到業務就是無法去衡量,這里更多是策略相關,是否能滿足該平臺下的用戶需求、體驗)

再說一遍:上面這個比較不能說明兩個搜索引擎的差距,在這個品類上,淘寶的商品優勢更明顯,所以出現無結果的情況更少,我舉的這個例子只是為了說明再尋找關鍵詞上不同的引擎會有差異。

我們看到了大搜和垂直搜索中遇到長尾詞的一些個情況,前面我們說了長尾詞是金礦,如果能處理好長尾詞,那么京東淘寶的成單率估計也能上一個臺階。

三、那么在搜索引擎端如何來優化長尾詞呢?

1. 用戶搜索意圖分析

所謂用戶的搜索意圖分析,就是這個用戶到底想搜什么?

首先,我要要知道一點:對于電商的搜索,用戶意圖一定是一個商品,只不過表述這個商品的關鍵詞不一樣而已。

比如上面說的京東和淘寶的例子中:京東認為用戶想搜的是李維斯這個品牌,而淘寶認為的是用戶想搜的是這些款式的牛仔。

如何得到這些個關鍵詞呢?

首先這些關鍵詞一般是一些具體的物品(比如牛仔褲,鞋子,帽子),或者一些品牌(比如李維斯),因為在電商網站,買物品和買品牌才是關鍵,所以將物品詞作為關鍵詞比較說得過去。

而對于物品詞的提取,可以通過你已有的商品進行提取。因為每個商品都是一個物品,都有一個物品詞或者品牌詞,整個商品過一遍就有你所有的物品品牌詞了。當用戶的搜索詞里面出現了這個物品或者這個品牌,那么我們即使沒搜索出來東西,給出這個物品或者這個品牌的商品,用戶一般也會有點擊。

如果是大搜的話,用戶搜索意圖的分析就復雜了,因為不見得是搜物品了,那個我也只懂點皮毛,就不在這里瞎扯了。

這里要看平臺內容的豐富度。如像淘寶、京東等,其實已經由電商發展成內容+電商,帶有導購屬性。

以后搜索不僅是有商品維度,還有如榜單類、KOL類、好貨類、必買類、圈子等等。如現在在淘寶搜索一個關鍵詞,還會出現淘攻略、挑尖貨等。從搜索策略來看,就是豐富搜索內容,提高用戶可選擇性,滿足點擊和用戶需求的一個精細化運營方式。

有了這個關鍵詞的分析,基本上長尾詞能干掉大部分的沒有結果的情況,因為只要用戶搜索的詞里面有個物品或者品牌(一般肯定有),基本上都能出一個不太離譜的搜索結果。

當然,對于電商類搜索,還有一種特殊的情況,找到了搜索詞中的關鍵詞也不頂用,那就賣書的電商,比如當當,亞馬遜這種,因為書名可不能體現這個商品的關鍵詞。

比如追風箏的人,你說關鍵詞是風箏還是人?如果有人搜索放風箏的人,你怎么辦?

這里,就要用到下面的方法了:

2. 后繼詞挖掘

后繼詞挖掘是基于用戶行為數據的。(可以相信是基于用戶畫像和歷史行為數據挖掘)

比如上面那個放風箏的人搜索結果我們要是不滿意,用戶會自己修改關鍵詞,然后找到他想找的結果。

這個用戶主動修改過的詞就是這個詞的后繼詞(一般后臺有存儲搜索歷史的地方,可以挖掘用戶的詞,這里要注意是時效性、以及受熱度等影響),那么我們可以把這個用戶行為記錄下來,當這個長尾詞搜不出東西時,用他的后繼詞來給出一個搜索結果,這種靠用戶自己的修正值進行的長尾詞優化效果比較好。

但是他的前提是已經有人搜索過這個詞并且主動修改過關鍵詞了。

這里說一句:我們看到的百度的相關搜索就是一個后繼詞的應用。

3. 編輯距離

編輯距離來找意圖也是一種方法,這里我們不展開了,以后說意圖識別的時候再具體說說編輯距離,感興趣的可以自己查查。

簡單說,就是我們發現一個商品的標題和用戶的搜索詞差別比較小(其實這里可以用算法模型,原理應該就是相似性、向量計算比較等),小余某個設定的編輯距離,那么我們就把這個長尾詞改成這個標題,上面那個搜索中,追風箏的人放風箏的人編輯距離就是1,那么我們認為這個用戶其實是想找追風箏的人。

垂直搜索的長尾詞的優化,最終的目的是讓用戶在搜索長尾詞的時候,即便搜索引擎有些長尾詞給不出精確的結果,也能給一個相對靠譜點的結果,增加用戶的點擊,這個是大的話題。

對于搜索引擎來說也是一個可以持續挖掘的東西,投入再多的人力和精力也都值得,不然一個搜索引擎組哪來那么多自然語言處理的人員啊。

對于最后一句話深有感觸,也是實戰最能感知的,不管是在大廠還是小廠,開發的資源總的來說都是很缺的。

就算大廠的開發再多,再牛逼,可是他們需要支持項目也很多!尤其搜索方面,在開發人力,處理NLP方面確實是個問題。如前端搜索功能不完善需優化,但這涉及改版、排期、測試,而后端一些大概也需要人力,甚至涉及到架構。

這時候你可以通過一些很靈活的方法去優化搜索,從以前的經驗,可以有完善商品的分類、標簽、優化匹配詞庫、聯想詞庫、排序的因子、權重等,這些都是一種策略,一種直接給開發就能修改,甚至半天就生效,是否靈活!

四、長尾詞的應用

長尾詞是個金礦,這不僅是對搜索引擎來說是這樣的,對使用搜索引擎的人來說也是這樣的,我們來幾個例子說一下。

(這里是列了幾個角度,還是比較有趣的)

1. 我是商家

如果我是商家,在一個電商平臺開了店,如果沒有監管的話,我把我的商品名稱取得千奇百怪,也叫關鍵詞堆砌吧,那么長尾詞搜索就有很大概率搜索到我的商品了,而前面也說過,搜索長尾詞的用戶一般是搜索意圖很明確的,那么搜出來點我的概率就大了哈。

但是很可惜,這東西在很久以前可以玩玩,目前各大電商網站對商品名稱都有比較嚴格的限制,靠堆關鍵詞基本上很難了,呵呵。

關于標題等SEO范圍,PM一般不會在聚焦,這是運營的技巧或者賣家的一些技巧。

也可以了解了解,如選淘寶、京東、阿里巴巴等的大電商參考就行,尤其是阿里巴巴系,人才濟濟呀!京東這些比較偏規范,但阿里系的2B2C,還是比較“多花樣”。

2. 我是廣告主

這里我們以百度投放廣告為例,如果我知道一堆長尾關鍵詞而別人不知道,那么這些個關鍵詞的百度競價很可能很低,也許只有一塊兩塊錢點一次,那么我就用了很低的價錢在這些詞上面投了廣告,并且這種長尾詞用戶意圖明顯,點擊率非常高,那比花幾百塊錢去爭搶熱門詞靠譜多了。

在這里,如果找長尾詞成了一門學問,呵呵,我們不深究了,這里黑科技太多。

(這里涉及的是SEO優化、廣告競價RTB等方面的策略了,比較深。有運營側的技巧,一般廣告和商業PM主要是關注RTB方面,即競價計算,連接SSP和DSP的事情也就是價格。)

好了,想想最近很熱的醫療的關鍵詞,是不是滿足長尾詞的全部特征?搜索次數少,意圖非常明確(誰會沒生病去搜索一次醫療相關的詞?),搜索詞的量很巨大,所以,呵呵,這種搜索詞你一旦投廣告,不明真相的群主哪有不點的道理?某搜索引擎的收入怎能不高?

(我想起了之前莆田系的醫藥虛假廣告,唉~有時候目的意圖很明顯,轉化確實也高。在這些行業價格也高,公辦醫院不屑于、名門規定不準投放。競爭排名,反而變成私家醫院的“召回客戶”池子。百度總是出這樣,那樣的廣告競價虛假新聞,就如王欣快播當年的“技術無罪”,可一旦觸及大部門人民利益,倫理等,再大的公司也得倒~

所以程序化廣告,風控安全策略也很重要,要有敏感的策略,這方面百度應該會一直很重視,PM是需要考慮平衡商業化和引導用戶、體驗等)

3. 我是平臺

好了,我們再進一步,如果我是一個平臺(這里假設是個電商平臺,其實很多其他平臺也可以這樣),我這個平臺上有很多第三方的店,賣各種商品,他們可以通過各種方式在我的平臺上打廣告,每個廣告點一次5塊錢。

這時候,我拿一些個打廣告的商品,分析出這個商品的一些長尾關鍵詞,然后我去百度投放廣告,比如一個長尾關鍵詞百度賣1塊錢,當有人在百度搜索這個長尾詞的時候,第一個看到的就是我平臺的這個商品,然后點進來。呵呵,我給百度1塊,商家給我5塊,分分鐘4塊到手。

(這也是我們逛百度,逛網頁,看到一些詞或者點擊某些頁面,跳轉到其他商品等頁面,是有利益可圖)

4. 我是搜索引擎

如果我是搜索引擎,我有全部搜索詞和點擊率,所以很容易查出長尾詞來,分分鐘秒了各種找長尾詞的黑科技,我拿到這些個長尾詞以后怎么辦呢?

當有人在我這投關鍵詞廣告的時候,通過相關性匹配,我給他推薦這些長尾詞啊,并且告訴他這些次點擊率高啊,結果客戶一試,還真是點擊率高,于是各個客戶開始拼命競價,我的收入開始呼呼漲啊。

所以現在,長尾詞已經被搜索引擎本身挖掘完了,廣告主想靠長尾詞降低投放的花費已經比較困難了,呵呵。

這里可以留意阿里媽媽,就是生意參謀等投放平臺。我以前玩廣告平臺時,特意開了淘寶店,沒事玩玩生意參謀和投放廣告,里面的詞包是挺強大的,有包括聯想詞和推薦詞,這些會根據綜合維度的去計算,是策略相關。

如果玩用戶畫像、標簽系統等,可以留意阿里媽媽下的達摩盤,這里估計是中國電商算TOP的標簽系統。

你會發現用戶側、商家側、平臺側的標簽體系,以及三者能做成場景化運營標簽。這個以后我有時間會單獨寫,或者開live單獨聊、用戶畫像、標簽系統的事情。這個對于電商真的很重要,上到精細化運營,用戶維護等,下到個性化推薦、廣告變現,金融服務……

好了,今天簡單的說了說長尾詞的一些特點,長尾詞挖掘是個長期的工作,對于巨量的搜索詞,如果找到一個合適的規則能處理一部分長尾詞,那么對搜索引擎的效果都有很好的提升。

所以長尾詞的優化,不管是大搜索還是垂直搜索,都是一個搜索引擎最重要的模塊之一。

 

本文由 @鳳城狂客 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 很棒

    來自上海 回復
  2. 同樣,有啟發,學習了

    來自北京 回復
  3. 有啟發

    來自北京 回復
  4. 錯詞糾正,減詞搜索,類目預測與關聯,中心詞匹配策略這些是站內搜素的常用召回在手段,其次就是排序算法。 編輯距離有點牽強,現在基本上使用自然語言大數據處理一下就能將這個放風箏的人 直接給改寫了。樓主講的有點表面了。

    來自浙江 回復