花費(fèi)百萬的Netflix推薦系統(tǒng),有那些值得借鑒的特性

1 評(píng)論 14058 瀏覽 38 收藏 9 分鐘

2006年,一家通過租用傳統(tǒng)DVD影片發(fā)跡的網(wǎng)站netflix宣布了一個(gè)消息:他們將舉辦一次大賽,第一個(gè)能夠?qū)⒃摼W(wǎng)站推薦效果提升10%的團(tuán)隊(duì)將會(huì)獲得100萬美元的獎(jiǎng)金。消息甫一公布,世界各地的團(tuán)隊(duì)無不踴躍參與,紛至沓來。最終,歷經(jīng)三年時(shí)間,前后一百八十多個(gè)團(tuán)隊(duì)的較量,一支名叫“BPC”的團(tuán)隊(duì)率先突破障礙,以10.06%的改進(jìn)效果獲得了這份百萬大獎(jiǎng)。他們算法是怎么做到的呢,讓我們留個(gè)懸念,文章結(jié)尾再做說明。

而通過這次百萬大獎(jiǎng)賽,netflix升級(jí)了自家網(wǎng)站的算法,在工程師中塑造了財(cái)大氣粗的大公司形象,發(fā)掘了無數(shù)優(yōu)秀算法人才,可謂一舉多得。更重要的是,它向用戶普及了“推薦”這個(gè)概念,并在用戶心目中將推薦這個(gè)概念與netflix網(wǎng)站劃上了等號(hào),從此用戶使用netflix時(shí)對(duì)它的推薦系統(tǒng)有了更直觀的價(jià)值參照物——一百萬美金,天然產(chǎn)生信任感和參與感,不可不謂高明之至。

下面,就讓我們看看,netflix耗時(shí)三年開發(fā)、花費(fèi)百萬、吸引無數(shù)業(yè)界精英關(guān)注的推薦系統(tǒng)都有哪些特性。

為每個(gè)用戶建立畫像

打開netflix,首先彈出的是角色選擇窗口,通過一句親切的詢問”who’s watching“,netflix迅速定位到用戶的年齡、性別、過去看過的視頻,甚至好友信息,并據(jù)此產(chǎn)生一個(gè)瀑布流主頁,結(jié)合獲取到的信息為用戶推薦符合口味的影片和電視劇。

讓用戶知道為什么而推薦

Netflix推薦系統(tǒng)中一個(gè)非常重要的特性就是”推薦理由“,在每個(gè)推薦板塊中,用戶能夠清楚地知道為什么獲得這些推薦結(jié)果。這些理由都是些口語化的句式,比如:”因?yàn)槟憧催^**“,”我們猜你喜歡**“等等。這個(gè)舉措不但會(huì)給用戶帶來信任感,還會(huì)鼓勵(lì)他們更積極地參與到推薦互動(dòng)中來,給予更多有效反饋。

56e2607969de3.jpg

注重多樣性

如果認(rèn)為netflix的推薦就是一行一行視頻海報(bào)組成的瀑布流,那你就錯(cuò)了,它的推薦綜合了多種形式,并且很注重多樣性。同一個(gè)首頁中,不僅會(huì)根據(jù)用戶曾經(jīng)看過什么、也許會(huì)有的喜好推薦,netflix還專門開辟區(qū)域,為用戶推薦當(dāng)天或當(dāng)周最熱的視頻-即topN為用戶推薦。這些舉措在最大限度滿足用戶喜好的同時(shí),為發(fā)現(xiàn)更多用戶喜愛影片提供了可能。

56e2608cab8e7.jpg

利用好友鏈

Netflix鼓勵(lì)使用facebook登陸,因?yàn)橐粋€(gè)Facebook賬號(hào)在帶來用戶身份特征的同時(shí),還有一項(xiàng)非常重要的作用,那就是它所關(guān)聯(lián)的好友圈,這個(gè)圈就是用戶的互聯(lián)網(wǎng)社交圈,所謂物以類聚人以群分,通過好友們正在觀看的視頻,能更準(zhǔn)確地推算用戶喜好。

Genre系統(tǒng)

這是netflix最強(qiáng)大,也是最核心的推薦理念之一。這些“基因”可以廣泛如“喜劇”、“正劇”這些包括成千上萬的分類概念,也可以細(xì)分如”80年代的時(shí)間旅行科幻電影“這種主題。每個(gè)基因下限制一個(gè)影片集合,再按照影片本身屬性與該基因吻合程度排序。

一個(gè)用戶會(huì)看到什么樣的基因內(nèi)容呢?這個(gè)就要結(jié)合前面所有特征:用戶角色、瀏覽歷史、多樣性、好友信息等等,再糅合保證讓用戶有足夠新鮮感的更新特征,最終選擇合適的genre展現(xiàn)在用戶面前。在用戶瀏覽每個(gè)基因下的影片時(shí),netflix還會(huì)采取手段吸引用戶為基因的合理性打分。

56e260aa23466.jpg

相似度系統(tǒng)

Netflix除了top N和genre系統(tǒng)外,還有一個(gè)重要的推薦形式,被netflix穿插在推薦系統(tǒng)中,那就是相似度推薦。這個(gè)相似度推薦可以是兩個(gè)影片的相似度,也可以是兩個(gè)用戶的相似度,它可以出現(xiàn)在播放頁里,也會(huì)出現(xiàn)在搜索結(jié)果中,甚至首頁timeline中,作為一個(gè)genre出現(xiàn)。

推薦系統(tǒng)發(fā)展到現(xiàn)在,已經(jīng)是一個(gè)擁有無數(shù)工程師、眾多分支共同發(fā)展的成熟體系,它在大部分網(wǎng)站中也均有應(yīng)用。以上提到的種種特性,可以說是凡有推薦網(wǎng)站都會(huì)或多或少采用的推薦措施。

但是Netfilx推薦系統(tǒng)的強(qiáng)大之處在于它的將這些特性完美地綜合在了一起,在主頁上你會(huì)看到topN型的推薦,也會(huì)看到genre型推薦,還會(huì)看到根據(jù)歷史的相關(guān)推薦,但它同時(shí)保持了界面的簡(jiǎn)潔,每個(gè)推薦都有適當(dāng)?shù)睦碛?,讓你一眼就知道它為什么?huì)出現(xiàn)在timeline里。這正符合了推薦的作用:讓用戶最快最簡(jiǎn)便地找到所需信息。

結(jié)語

最后,讓我們揭開懸念,看看價(jià)值百萬美金的算法究竟是什么樣子:獲勝團(tuán)隊(duì) BPC 的算法的高明之處在于考察了用戶評(píng)級(jí)數(shù)據(jù)中的時(shí)間和“頻率”,用戶在為影片打分時(shí)往往帶有情緒影響,而情緒是與時(shí)間有關(guān)的。

另外,用戶的口味也許隨著時(shí)間的變化而變化;對(duì)比一位用戶五年之前的打分和他最近的打分,肯定他最近的打分更為準(zhǔn)確地反映了他當(dāng)前的好惡標(biāo)準(zhǔn),在決定他明天可能喜好哪些電影時(shí)所起的作用更大。于是 BPC 團(tuán)隊(duì)就研究用戶評(píng)分的結(jié)果與他們打分的時(shí)間以及頻率之間的關(guān)系,建立了相關(guān)性模型。

比如用戶在周一和周五在打分時(shí)所用的標(biāo)準(zhǔn)有差異,有些用戶在周日的情緒最好,這時(shí)所打的分?jǐn)?shù)比平時(shí)偏高。通過這樣的分析,他們能更精確地發(fā)現(xiàn)用戶對(duì)電影的喜好口味,進(jìn)而對(duì)他們打分的規(guī)律預(yù)測(cè)得更為準(zhǔn)確。

據(jù)我所知,netflix已經(jīng)發(fā)布了第二次百萬大獎(jiǎng)賽的懸賞。這一次,這個(gè)以傳統(tǒng)DVD租賃開始,卻以先進(jìn)推薦技術(shù)笑傲群雄的網(wǎng)站,又會(huì)給我們帶來什么驚喜呢,讓我們拭目以待。

 

作者:linz,來自樂視創(chuàng)新與用戶體驗(yàn)研究院(LetvIUEI)。樂視IUEI是一個(gè)技術(shù)交流平臺(tái),將第一時(shí)間向行業(yè)展現(xiàn)樂視最新的技術(shù)成果、項(xiàng)目經(jīng)驗(yàn)與工作感悟。微信ID:LetvIUEI

本文由@linz 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 翻譯錯(cuò)了genre是風(fēng)格題材的意思,不是基因,stupid!

    來自廣東 回復(fù)