需求滿足綜述

0 評(píng)論 5044 瀏覽 2 收藏 20 分鐘

一、什么是需求滿足

1.1 什么是需求滿足

用戶來搜索“章魚 保羅”,就文本相關(guān)性而言,搜索引擎只要返回和“章魚 保羅”內(nèi)容相關(guān)的結(jié)果就可以了,這樣用戶是否滿意呢?

用戶甲:聽說章魚帝掛了,來看看最新結(jié)果,怎么全是8月份的,往后翻頁中…

用戶乙:今天同事們?cè)谟懻撜卖~哥掛了,章魚哥是啥?我又out了,來搜索一下章魚帝生平事跡是啥,怎么全是最新的結(jié)果,沒有章魚哥的介紹啊,變換個(gè)query看看

用戶丙:我是鐵桿球迷,看完章魚哥,再看看足球相關(guān)的吧,魯尼,杰拉德是否又進(jìn)球了,怎么連個(gè)相關(guān)推薦都沒有,還得我親自輸入。

用戶?。赫覀€(gè)章魚哥的頭像用一下吧,一定很拉風(fēng),怎么全是結(jié)果沒有方圖呢,這么扁的圖怎么用啊

用戶戊:換個(gè)章魚哥的壁紙,也許下次買彩票能發(fā)大財(cái),咦,怎么全是小尺寸的圖…

(以上信息通過分析2010-10-27用戶session得出。)

籠統(tǒng)的說,用戶向搜索引擎表達(dá)他的需求,搜索引擎理解用戶需求,提供各不同的需求下的資源,這整個(gè)過程可統(tǒng)稱為需求滿足。簡(jiǎn)單說,就是除了基礎(chǔ)文字相關(guān)性之外的rank工作,都屬于需求滿足的范疇,也就是說,提供給用戶的檢索結(jié)果,不僅僅要求在字面上是和用戶輸入的文字相關(guān)的,還要滿足用戶的各種不同需求。

需求滿足在rank體系中所處的位置:

1.2 為什么需要需求滿足

用戶通過query表達(dá)了自己的需求,而對(duì)于大部分query來說,尤其是具有隱含需求的query,僅僅字面匹配的查詢結(jié)果未必能夠滿足其需求。目前我們的排序系統(tǒng)是主要是基于文本相關(guān)性這個(gè)維度的,權(quán)值體現(xiàn)了query中的term與obj的相關(guān)程度,在這個(gè)體系下,相關(guān)的結(jié)果未必能夠滿足用戶需求。

例如前面提到的“章魚 保羅”的例子,顯然,這些需求在文本相關(guān)性這個(gè)維度下很難解決,尤其涉及到突發(fā)時(shí)效性需求,泛需求等。

1.3 需求滿足包含哪些工作

從上面的例子中,可以看出,需求滿足需要解決時(shí)效性需求問題,多需求問題,相關(guān)推薦,size需求,素材類需求,瀏覽引導(dǎo)等問題。除了基礎(chǔ)文本相關(guān)性以外的rank策略以及為了這些所做的query分析工作可認(rèn)為屬于需求滿足的工作,另外還包括前端結(jié)果展現(xiàn)與用戶引導(dǎo)瀏覽的工作。

Image需求滿足,按照不同的維度,可以劃分為如下幾個(gè)方面:

  1. 需求識(shí)別
  2. 資源建設(shè)
  3. 需求調(diào)權(quán)
  4. 結(jié)果組織與推薦
  5. 用戶引導(dǎo)交互

 

二、需求滿足如何做

需求滿足要解決的核心問題

需求識(shí)別

資源建設(shè)

需求調(diào)權(quán)

2.1 需求的識(shí)別

2.1.1 需求的類型

識(shí)別query有哪些需求,以及需求的強(qiáng)弱,是最基礎(chǔ)的工作。首先要有需求的體系,能完備的描述各種需求,其次是如何識(shí)別這些需求,把每個(gè)query的需求對(duì)應(yīng)到這個(gè)體系中去。

通過query分類識(shí)別需求

現(xiàn)在線上query分類體系,是按照話題屬性為依據(jù)來建立的。包括風(fēng)景類,地名類,人物類,汽車類等等,對(duì)于每個(gè)類別,在一些維度上的需求是不一樣的,比如風(fēng)景類需要尺寸比較大,比較清晰,不包含人的圖片,而聊天類則需要尺寸較小,最好是動(dòng)態(tài)的gif圖。

這個(gè)策略下的項(xiàng)目有:size調(diào)權(quán),格式調(diào)權(quán),人臉需求,人與非人等。

基于統(tǒng)計(jì)的需求識(shí)別

通過對(duì)大量的數(shù)據(jù)統(tǒng)計(jì)分析,可以識(shí)別出query有哪些方面的共性??晒┓治龅臄?shù)據(jù)很多,比如用戶行為數(shù)據(jù),點(diǎn)擊反饋,檢索結(jié)果等。

比如:對(duì)query的檢索結(jié)果,按照某一feature進(jìn)行聚類,如果某個(gè)類別所包含的圖片數(shù)很多,超過設(shè)定閾值時(shí),則認(rèn)為這個(gè)類別內(nèi)的圖片,在這個(gè)feature上,代表了這個(gè)query的需求。線上人臉需求識(shí)別就是這樣來做的。

統(tǒng)計(jì)用戶反饋來獲取需求是最能反映用戶需求的方式,用戶的反饋包括用戶點(diǎn)擊,query變換等,在這方面我們做的工作不多,經(jīng)驗(yàn)也不多,是我們后續(xù)工作的重點(diǎn)。

專名&需求詞

判斷query中包含專名或者需求詞等關(guān)鍵詞,是最直接的方式。比如“紅色寶馬”,顯示的表達(dá)了顏色方面的需求。

時(shí)效性需求

時(shí)效性需求包括三部分,突發(fā)時(shí)效性、周期時(shí)效性和泛時(shí)效性需求,目前線上做的是突發(fā)時(shí)效性需求。需求的識(shí)別,主要是通過檢索量的突發(fā),資源數(shù)突發(fā)和實(shí)效性事件來判斷的。

檢索量的突發(fā),是指累積每個(gè)小時(shí)的用戶檢索頻率,用連續(xù)15天的用戶檢索頻率,計(jì)算突發(fā)的斜率,根據(jù)斜率的大小,來判斷時(shí)效性需求的強(qiáng)弱。

上述方法只適合熱門query,對(duì)于長尾query,檢索頻率很低,無法通過這種方式識(shí)別出來,一般這種query是多term的query,可以通過是否命中關(guān)鍵詞來判斷:

通過事件判斷:這種方式,主要是想看關(guān)鍵term命中時(shí)效性事件的比例。當(dāng)然這些事件是通過主動(dòng)挖掘的時(shí)效性query,通過聚類后,對(duì)每個(gè)類別訓(xùn)練出來的關(guān)鍵詞。

2.1.2 需求的強(qiáng)弱

要做好需求滿足,不僅要識(shí)別query有哪一類型的需求,而且要識(shí)別該類型需求的強(qiáng)弱,他直接指導(dǎo)了后續(xù)需求調(diào)權(quán)的力度。

每個(gè)維度的需求,必須要有需求的強(qiáng)度,在各維度調(diào)權(quán)合并時(shí),需求的強(qiáng)度決定了該維度的權(quán)值。比如時(shí)效性需求,需求的強(qiáng)度很高,要求滿足時(shí)效性的資源,一定要排在前面。又比如清晰度 飽和度調(diào)權(quán),對(duì)大部分query而言,需求不是很強(qiáng)烈,調(diào)權(quán)時(shí)的力度就不能太大。

需求強(qiáng)弱的計(jì)算,和后面rank model的要求相關(guān),理想的狀態(tài)是每個(gè)query,可以動(dòng)態(tài)的計(jì)算在每個(gè)維度上的需求強(qiáng)弱,我們?cè)谶@方面經(jīng)驗(yàn)不多,如果暫時(shí)不能做到準(zhǔn)確的計(jì)算的話,暫時(shí)可以考慮人工指定的方式,比如針對(duì)不同的query分類,人工設(shè)定需求維度的強(qiáng)度。目前可以想到的一些方式:

顯式的需求為強(qiáng)需求

用戶通過在query中包含需求詞的方式,表達(dá)自己的需求,這樣的為強(qiáng)需求。

比如,最新劉德華圖片,紅色寶馬

基于統(tǒng)計(jì)的方式挖掘需求時(shí),判定值超出閾值的比例大小,決定需求的強(qiáng)弱

在用統(tǒng)計(jì)挖掘用戶需求的方法時(shí),一般會(huì)選取某個(gè)維度的屬性,量化后計(jì)算它的統(tǒng)計(jì)特性,可以根據(jù)統(tǒng)計(jì)后該數(shù)值的分布情況,判斷需求的強(qiáng)弱。比如,時(shí)效性需求,某段時(shí)間內(nèi),該query檢索量突發(fā)特別大,是昨天檢索量的100倍,如果我們?cè)O(shè)定的閾值是2倍的話,那么這個(gè)query就可認(rèn)為時(shí)效性需求特別強(qiáng)。

又比如通過用戶點(diǎn)擊數(shù)據(jù)挖掘size需求,對(duì)于頭像類的query,大部分用戶點(diǎn)擊的是100*100的方圖,但是所占總點(diǎn)擊中的比例不是很高,比如只到60%,那么對(duì)這個(gè)query而言,size需求是一般強(qiáng)度的需求。

2.2 需求的滿足

識(shí)別出query有哪些需求,下一步的工作就是提供相應(yīng)的資源。

2.2.1 資源的挖掘

如何獲得滿足需求的資源,是需求滿足的另一個(gè)核心問題。在資源上,通過某一個(gè)或者幾個(gè)特征組合,能夠把滿足要求的資源和不滿足要求的資源區(qū)分開,找到用戶需求需要的資源,去掉不滿足要求的資源,是主要的工作。

內(nèi)容屬性特征

對(duì)內(nèi)容屬性維度來說,可以分為底層的物理特征,中層的物體識(shí)別和高層的語義特征;對(duì)于底層的物理特征,相對(duì)比較簡(jiǎn)單,我們現(xiàn)在可以利用的,包括尺寸,顏色,格式,清晰度飽和度等,中層特征,我們目前用到的不多,有人與非人的,色情圖片的,整車的識(shí)別,手機(jī)圖片的識(shí)別等;對(duì)于高層的語義特征,包括場(chǎng)景的識(shí)別,圖片風(fēng)格的識(shí)別,是我們未來發(fā)展的方向。

話題屬性維度

類似的query分類的體系,也可以對(duì)資源進(jìn)行相似的話題屬性分類,我們目前只做了站點(diǎn)級(jí)別的分類,效果不是很理想,主要原因一是站點(diǎn)粒度太粗了,二是站點(diǎn)分類的召回存在很大的問題。

我們希望能做到obj級(jí)別粒度的分類,至少是頁面級(jí)別的分類。如果有了話題屬性的分類,和query需求的分類相配合,可以達(dá)到事半功倍的效果。

時(shí)效性資源的收錄

我們目前時(shí)效性資源主要是挖掘的ps的時(shí)效性庫,和news的資源,和非時(shí)效性資源的區(qū)分是比較容易的。

2.2.2 需求調(diào)權(quán)

明確了query的需求,挖掘了滿足需求的資源,那么如何把滿足需求的資源rank到前端呢?

對(duì)于各種不同的需求維度,都有自己的調(diào)權(quán)的策略。比如格式調(diào)權(quán),假設(shè)query有g(shù)if圖需求,對(duì)于gif的動(dòng)態(tài)圖,權(quán)值乘了1.2,對(duì)于靜態(tài)圖要降權(quán),權(quán)值乘了0.1。又比如時(shí)效性需求,直接在前三頁插入的時(shí)效性庫的結(jié)果,這是因?yàn)闀r(shí)效性需求是一個(gè)強(qiáng)需求維度,簡(jiǎn)單的加權(quán),不能保證結(jié)果調(diào)整到前三頁。從這些例子中可以看出,目前需求調(diào)權(quán)的策略就是2種類型:在總權(quán)值上調(diào)權(quán),在最后排序結(jié)果上調(diào)序。

目前這種策略直接疊加的調(diào)權(quán)方式,優(yōu)點(diǎn)是簡(jiǎn)單,直接,缺點(diǎn)也比較多,最大的是不可控,一個(gè)維度上的調(diào)權(quán),會(huì)對(duì)最后結(jié)果造成多大的影響,在多個(gè)調(diào)權(quán)維度上,他說的話,分量有多大,不知道。

未來的需求調(diào)權(quán),首先應(yīng)該把資源滿足需求的情況,做出細(xì)化的分檔,做到有直觀的物理含義,其次,根據(jù)該維度需求的強(qiáng)弱,把這個(gè)維度的打分反映到最終結(jié)果中去,究竟是跨檔調(diào)權(quán)還是檔內(nèi)微調(diào),比如:

強(qiáng)需求:符合要求的結(jié)果直接調(diào)到最高檔,比如時(shí)效性需求

一般需求:符合要求的結(jié)果,可以根據(jù)一定規(guī)則,提高自身檔位

弱需求:不能提升檔位,在同一檔內(nèi),做權(quán)值調(diào)整

2.3 需求滿足的效果

前面已經(jīng)完成了query需求識(shí)別,資源識(shí)別已經(jīng)需求調(diào)權(quán)的工作,那么用戶是否滿足了呢?搜索引擎最終是給用戶服務(wù)的,用戶覺得爽,才是最重要的目標(biāo)。那么如何知道用戶是否滿意呢?

用戶接收到搜索引擎的提供的信息后,會(huì)對(duì)這些信息做出反饋。這些反饋包括了用戶對(duì)搜索結(jié)果的點(diǎn)擊、對(duì)query的主動(dòng)變換,以及這些行為之后的相關(guān)行為。通過對(duì)這些數(shù)據(jù)的分析,可以知道用戶的滿意度。

比如對(duì)需求識(shí)別的修正,通過用戶點(diǎn)擊反饋,可以知道query需求識(shí)別的是否正確,該需求是否該退場(chǎng)。比如時(shí)效性需求,被誤判的query或者應(yīng)該退場(chǎng)的query,都可以通過用戶的反饋,來判定是否應(yīng)該退場(chǎng)。

當(dāng)然,這種方式是否合理還有待調(diào)研,畢竟用戶不點(diǎn)擊一張圖的原因有很多可能,有可能是需求識(shí)別的問題,有可能是該維度強(qiáng)弱識(shí)別的問題,也有可能是rank的問題。目前用戶反饋應(yīng)用只有點(diǎn)擊調(diào)權(quán),是否用戶的反饋可以在單獨(dú)的維度上有效,還需要詳細(xì)的調(diào)研分析。

另外,隨著時(shí)間的推移,query的需求是在不斷變化的,通過用戶的反饋,可以做出及時(shí)的調(diào)整。

三、需求滿足的展望

3.1 需求滿足體系框架的建立

之前做了很多需求滿足的工作,顏色,格式,尺寸,人臉,表情,頭像等等,分別是case by case來做的,其實(shí)他們之間存在著很多相似的地方。從調(diào)研過程來看,可以分為需求識(shí)別、資源滿足和需求調(diào)權(quán)三大部分。

這樣分散的各個(gè)點(diǎn)去做,有很多弊端,一是調(diào)研重復(fù),效率低;二是前端調(diào)權(quán)系統(tǒng)像打補(bǔ)丁一樣,越來越亂,沒有形成清晰的體系框架。三是容易造成調(diào)權(quán)重復(fù)。

目前比較好的思路是建立需求滿足的體系框架,包括前端的需求分析和后端需求調(diào)權(quán)。前端分析清楚query包含哪些需求,以及每個(gè)需求的強(qiáng)弱,把這些信息傳遞給后端;后端首先要有各個(gè)需求所對(duì)應(yīng)的資源,然后結(jié)合上面提到的需求調(diào)權(quán),給每個(gè)obj一個(gè)合適的檔位和權(quán)值。

以后再做需求滿足類項(xiàng)目時(shí),只需要調(diào)整前端的需求識(shí)別即可,如果沒有新增的需求維度,后端的資源和需求調(diào)權(quán),都可以不用改動(dòng)。

3.2 更智能的需求識(shí)別

1. 分析用戶行為數(shù)據(jù)挖掘需求

用戶在搜索過程中,能夠被我們記錄下來的一切行為,比如點(diǎn)擊,翻頁,query變換,停留時(shí)間,去向,來源等等,利用好這些數(shù)據(jù),就能更好地理解用戶的意圖。目前在這方面的應(yīng)用還只有點(diǎn)擊調(diào)權(quán),需要挖掘方面的應(yīng)用還很少,是我們未來工作的重點(diǎn)方向。

2. 個(gè)性化需求挖掘

通過分析session,可以獲取個(gè)性化的用戶個(gè)體需求。目前我們結(jié)果的展示的好壞,主要是通過分析session,來判斷用戶的需求,而對(duì)于高頻query,展示的結(jié)果是大規(guī)模用戶的行為統(tǒng)計(jì),得出的一個(gè)普適的模型,這個(gè)模型由于是統(tǒng)計(jì)出的,因此具有客觀性,可能會(huì)傷害一部分個(gè)性用戶。

3. 需求強(qiáng)度的識(shí)別

每個(gè)維度的需求,必須要有需求的強(qiáng)烈度,在各維度調(diào)權(quán)合并時(shí),需求的強(qiáng)度決定了該維度的權(quán)值,比如時(shí)效性需求,需求的強(qiáng)度很高,要求滿足時(shí)效性的資源,一定要排在前面。又比如清晰度 飽和度調(diào)權(quán),對(duì)大部分query而言,需求不是很強(qiáng)烈,調(diào)權(quán)時(shí)的力度就不能太大。

3.3 資源建設(shè)

目前我們?cè)趒uery分類,query需求識(shí)別,query分析方面做了大量的工作,相比較而言,資源方面的建設(shè),我們做的工作比較少,接下來希望推動(dòng)obj級(jí)別的資源分類,內(nèi)容屬性上的幾個(gè)資源分類:圖標(biāo)資源識(shí)別,地圖資源識(shí)別,卡通動(dòng)漫圖的識(shí)別,以及一些截圖的識(shí)別。

3.4 需求引導(dǎo)

Image是瀏覽型為主的產(chǎn)品,如何引導(dǎo)用戶更加方便的瀏覽,是未來工作的重點(diǎn)之一。

我們已經(jīng)嘗試了明星結(jié)果頁的query分類展示,未來我們希望能對(duì)更多類別的query,做主動(dòng)引導(dǎo)。引用pm對(duì)主題式query的定義:“主題式”Query是指:Query指代的人、事、物中包含有多方面內(nèi)容,具體表現(xiàn)為Query對(duì)應(yīng)目前的檢索結(jié)果中存在明顯的多方面內(nèi)容的混雜情況。其實(shí)就是指泛需求、多需求的query。

對(duì)于這種泛需求query的結(jié)果的展示樣式,這種分tab多結(jié)果頁的形式也未必是最優(yōu)的,如何更好的發(fā)揮作用,需要更加深入的調(diào)研和創(chuàng)新的思路。

另外,還包括對(duì)rs展示優(yōu)化,動(dòng)態(tài)摘要的顯示和套圖展現(xiàn)等方面的持續(xù)升級(jí)。

四、結(jié)語

Image需求滿足方向才剛剛起步,未來要向智能化,自動(dòng)化,多樣化方向持續(xù)的發(fā)展。我們最終的目標(biāo)是把需求滿足這個(gè)方向做沒了,需求挖掘,資源滿足全部自動(dòng)化,做到“手中無劍 心中有劍”。

源地址:http://stblog.baidu-tech.com/?p=404

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!