關(guān)于推薦系統(tǒng)的5個問題

0 評論 6492 瀏覽 1 收藏 6 分鐘

2009年一月,在阿姆斯特丹舉行了一個名為Recked的活動,活動由Wakoopa和Strands主辦,旨在討論工程師們感興趣的推薦系統(tǒng)。在活動介紹的內(nèi)容中,提出了一些公司對于建造有效的推薦系統(tǒng)必須解決的幾個問題。

1.缺少數(shù)據(jù)
或許推薦系統(tǒng)面臨的最大問題,是需要大量的數(shù)據(jù),以便能形成有效的推薦?,F(xiàn)在能給出最好的推薦的公司正是那些擁有大量數(shù)據(jù)的公司:google,amazon,Netflix,last.fm,這并不是巧合。下圖是Recked活動中Strand’s的演示文檔,如該圖所示,一個好的推薦系統(tǒng)首先需要類目(種類)數(shù)據(jù)(從目錄或者其它形式得到),然 后系統(tǒng)必須捕獲并且分析這些用戶數(shù)據(jù)(用戶行為),然后,再應用神奇的算法工作。分析越多的類目(種類)和用戶數(shù)據(jù),系統(tǒng)越有可能生產(chǎn)好的推薦。但是,這 又是一個蛋和雞的問題:要形成好的推薦,首先需要有大量的用戶,這樣才能得到大量的推薦數(shù)據(jù)。

2.不斷變化的數(shù)據(jù)
這個問題由Clicktorch公司(一家做“智能推薦”的公司)的CEO:Paul Edmunds 在ReadWriteWeb網(wǎng)站的評論中指出。他在評論中指出:系統(tǒng)通常偏向于舊的數(shù)據(jù)而難以有新的改進。

這 方面的一個例子是David Reinke在StyleHop(一個時尚愛好者的社會團體)的博客上寫道:“過去的用戶形為并不是好的工具,因為趨勢總是在不斷變化”。很明顯,運算方 法將很難或者不可能跟上時尚趨勢。時尚-挑戰(zhàn)人們-我接受時尚-依靠值得依賴的有時尚意識的朋友和家人,把衣服推薦給他們。

David Reinke說,“類目(種類)推薦行不通,因為有太多的產(chǎn)品屬性,而每個屬性(比如價錢,顏色,風格,面料,等等)在不同的時候?qū)τ谙M者的重要程度都是不一樣的”,他指出,社會化推薦可能可以“解決”這個問題。

3.不斷變化的用戶喜好
提出這個問題的仍然是Paul Edmunds,他認為問題在于:今天自己瀏覽amazon時是會有特定意圖的,明天或許會有另一個特定意圖。舉個典型的例子:有可能某天我會上amazon為自己買本書,但第二天我到amazon的原因可能是要為姐姐找一份生日禮物。

對于用戶喜好,推薦系統(tǒng)也可能錯誤的標注。華爾街雜志2002年有一篇文章“如果TiVo覺得你是個同性戀,這就是把你標注成同性戀的方式”

4.不可預知的類目(事項)
我們都知道,Netflix花100萬美元來獎勵能提升推薦引擎質(zhì)量10%的人。我們注意到對于一些古怪(特別)的電影會有一些問題,有一些電影觀眾對它又愛又恨,比如:大人物拿破侖。這種類型的電影是很難去做推薦的,因為用戶對它們會有各種反映而且無法預計。

音樂中就有很多種這樣的類型。你能猜出來某個作者同時是卡彭特和金屬樂的愛好者嗎?Last.fm可能需要這種推薦

5.這個東西是復雜的
我們可以很簡明的描述,但是從下面這張Strands的演示PPT截圖可以看到,哪怕是最簡單的推薦,也需要涉及到非常多的參數(shù)和變量(而且我們想象到的這些只涉及到系統(tǒng)表面)
到目前為止,有很多公司都已經(jīng)建立起了用戶滿意程度較高的推薦引擎系統(tǒng)—amazon,Netflix,google這些名字跳入腦中。但是相對我們想 到的這些少數(shù)成功的案例,還有其它成百上千的網(wǎng)站和應用,都在尋找推薦新產(chǎn)品和新內(nèi)容給用戶的道路上掙扎。的確,在ReadWriteWeb,我們更希望 讀者在網(wǎng)站上點擊發(fā)現(xiàn)更多其它的內(nèi)容,我們使用很多種插件和方法來達到這個目的,但目前我們并不滿意

問題之外
推薦引擎可能發(fā)生的問題有很多,比如:給出太多最低級公共屬性的推薦;對于長尾的支持不夠;只推薦顯而易見的內(nèi)容,等等。

譯文出處(http://www.thinktag.cn/archives/73)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!