推薦系統(tǒng)隨想,冷啟動(dòng)和評(píng)論推薦

10 評(píng)論 18481 瀏覽 131 收藏 9 分鐘

最近,我司的O2O營(yíng)銷(xiāo)系統(tǒng)考慮做推薦系統(tǒng),雖然不是我的功能,但是趁著放假,也了解了一下。通過(guò)文章一起來(lái)學(xué)習(xí)下。

什么是推薦系統(tǒng)?

隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時(shí)代走入了信息過(guò)載的時(shí)代。在這個(gè)時(shí)代,無(wú)論是信息消費(fèi)者還是信息生產(chǎn)者都遇到很大的挑戰(zhàn);對(duì)于消費(fèi)者,從大量信息中找到自己感興趣的信息是一件非常困難的事情;對(duì)于信息生產(chǎn)者,讓自己的信息脫穎而出,受到廣大用戶(hù)的關(guān)注,也是一件非常困難的事情。推薦系統(tǒng)就是解決這一矛盾的重要工具。推薦系統(tǒng)的任務(wù)就是聯(lián)系用戶(hù)和信息,一方面幫助用戶(hù)發(fā)現(xiàn)對(duì)自己有價(jià)值的信息,另一方面讓信息能夠展現(xiàn)在對(duì)它感興趣的用戶(hù)面前,從而實(shí)現(xiàn)信息消費(fèi)在和信息生產(chǎn)者的雙贏。

這是我摘抄過(guò)來(lái)的一段話,對(duì)于推薦系統(tǒng)給出了比較簡(jiǎn)單易懂的解釋。推薦的精髓在于,我想要的你都有,你給我的都是我想要的,其中,我就是用戶(hù),你就是信息提供方。這樣完美的推薦的實(shí)現(xiàn),還需要一些時(shí)日,但是終歸要到來(lái),現(xiàn)在想來(lái)還是挺可怕的,因?yàn)榭赡軝C(jī)器比我更了解我自己。

推薦系統(tǒng)的冷啟動(dòng)

本篇文章是寫(xiě)給產(chǎn)品經(jīng)理看的,所以說(shuō),我們不討論算法,只說(shuō)方法。

冷啟動(dòng)在整個(gè)推薦系統(tǒng)中,是一個(gè)非常重要而又非常難的一件事情,推薦系統(tǒng)一般都需要在大量的數(shù)據(jù)基礎(chǔ)過(guò)后才能比較準(zhǔn)確的進(jìn)行推薦,而一個(gè)新用戶(hù)剛使用APP的冷啟動(dòng)可能直接決定著這個(gè)用戶(hù)還會(huì)不會(huì)使用下去,所以冷啟動(dòng)是一件至關(guān)重要的事情。

冷啟動(dòng)在互聯(lián)網(wǎng)行業(yè)有著很多的通用的方法和經(jīng)驗(yàn),可以讓用戶(hù)更快更優(yōu)質(zhì)的去冷啟動(dòng)。那么冷啟動(dòng)主要關(guān)注的兩個(gè)方面是,推薦的內(nèi)容是否全面和內(nèi)容是否可靠有用。

總結(jié)一下方法如下:

第一、盡可能用用戶(hù)給你的信息,比如app music會(huì)選擇讓用戶(hù)主動(dòng)選擇一些流派或歌手,根據(jù)選擇結(jié)果進(jìn)行冷啟動(dòng),這樣會(huì)比較準(zhǔn)確。這種方法在很多APP第一次打開(kāi)時(shí)都會(huì)用到。推薦關(guān)注人或者主題,都是這種原因。

第二、用戶(hù)的社交信息比較重要,比如今日頭條13-14年的時(shí)候做過(guò)引導(dǎo)用戶(hù)微博登陸,登陸后會(huì)去爬取用戶(hù)在微博上的一些信息,比如發(fā)的動(dòng)態(tài)、圖片、文章,贊過(guò)、轉(zhuǎn)發(fā)過(guò)的的內(nèi)容等數(shù)據(jù),通過(guò)這些數(shù)據(jù)進(jìn)行分析,比如在微博上轉(zhuǎn)發(fā)了某個(gè)女歌手的新聞,就會(huì)知道用戶(hù)喜歡這個(gè)女歌手,這種數(shù)據(jù)比較真實(shí)也有延續(xù)性,也符合用戶(hù)最近的思維,這種數(shù)據(jù)質(zhì)量比較好。

第三、有可能會(huì)涉及一些用戶(hù)隱私。某些應(yīng)用會(huì)上報(bào)其他app的信息,可以了解用戶(hù)安裝了哪些app、app中傳遞了哪些信息,可以了解到用戶(hù)喜歡哪些東西,是喜歡游戲、美食甚至是喜歡的內(nèi)容風(fēng)格,可以了解到用戶(hù)的喜好,用這些數(shù)據(jù)去服務(wù)冷啟動(dòng)會(huì)更好。所以說(shuō)手機(jī)信息這塊還是很有用的,手機(jī)廠商其實(shí)已經(jīng)掌握了用戶(hù)的各種行為,但是有個(gè)缺點(diǎn)就是很多手機(jī)系統(tǒng)不會(huì)提供讀取用戶(hù)app安裝信息的服務(wù)。

最后,可以提供有獎(jiǎng)?wù)骷姆椒?,去收集用?hù)的年齡和性別,或者其他的社會(huì)信息,這是一種短平快的方法,但是這種方法需要提供什么樣的誘惑,需要嘗試中去摸索可行性。

評(píng)論推薦

除了產(chǎn)品的推薦,在O2O中,用戶(hù)評(píng)論也是比較重要的,用戶(hù)去下線消費(fèi)與否很可能會(huì)因?yàn)橐粭l好的評(píng)論或者壞的評(píng)論而改變想法。對(duì)于評(píng)論,我們有兩點(diǎn)需要關(guān)注。

1、怎么樣去識(shí)別一個(gè)優(yōu)質(zhì)的評(píng)論

怎樣從海量的評(píng)論中找到好的、優(yōu)質(zhì)的評(píng)論,我們可以從以下兩個(gè)方面來(lái)嘗試。

  1. 通過(guò)評(píng)論內(nèi)容去直接分析。字?jǐn)?shù)較多的、使用高級(jí)冷僻詞匯的一些評(píng)論質(zhì)量相對(duì)較好,這部分可以通過(guò)算法去識(shí)別出來(lái)。其中,需要去過(guò)濾掉有過(guò)多重復(fù)詞、違禁詞的評(píng)論。那通過(guò)這種方法可以去簡(jiǎn)單去提取出一些相對(duì)有用的評(píng)論。
  2. 從一個(gè)評(píng)論的用戶(hù)屬性去出發(fā)。一般來(lái)說(shuō),哪些用戶(hù)會(huì)發(fā)表的評(píng)論比較高質(zhì)量呢?
  • 一種可能是學(xué)歷,我覺(jué)得學(xué)歷是一個(gè)相當(dāng)重要一個(gè)點(diǎn)。因?yàn)閷W(xué)歷高的話你所使用的詞匯可能也會(huì)比較好,包括你的思考相對(duì)說(shuō)完整性較好,而不會(huì)出現(xiàn)像小學(xué)生那種好好好、贊贊贊等這種相對(duì)來(lái)說(shuō)比較水的一些評(píng)論互動(dòng)。再來(lái)經(jīng)過(guò)編輯篩選就更加方便了。
  • 第二種就是我們可以通過(guò)一些歷史統(tǒng)計(jì),比如說(shuō)我發(fā)現(xiàn)他之前發(fā)表過(guò)一個(gè)評(píng)論可能得到點(diǎn)贊數(shù)都特別多,也可以幫助我們識(shí)別出來(lái)他現(xiàn)在發(fā)的一些最新評(píng)論是不是也是優(yōu)質(zhì)做一個(gè)參考。
  • 第三種可以通過(guò)一個(gè)用戶(hù)他平時(shí)在我們平臺(tái)上面的一些行為來(lái)確定。比如說(shuō)一個(gè)用戶(hù),如果真的很懂美食,那可能在我們這邊是相對(duì)活躍的。我們可以通過(guò)一些統(tǒng)計(jì)歷史性過(guò)于發(fā)現(xiàn)他活躍的一些特征。提高一定的權(quán)重。
  • 第四種,這種用戶(hù)本身等級(jí)都較高,在我們的平臺(tái),等級(jí)較高的用戶(hù)不管是文化程度還是收入都比較高,這類(lèi)用戶(hù)的評(píng)論應(yīng)該更加受到重視。

2、假如識(shí)別出來(lái)之后要怎么給他們?cè)O(shè)置前置規(guī)則

確實(shí)很多評(píng)論系統(tǒng)會(huì)有這個(gè)問(wèn)題,假如一個(gè)優(yōu)質(zhì)評(píng)論比較早發(fā)布的話,那他一直被置頂?shù)膸茁试絹?lái)越高。

1)其實(shí)如果我們?cè)谒惴ㄉ厦孀鲆粋€(gè)衰減因子。當(dāng)隨著時(shí)間衰退,這個(gè)因子變得越越大的時(shí)候。在打分上面,我們把熱度再乘以這個(gè)因子,那就會(huì)把這個(gè)分?jǐn)?shù)拉低。這樣子一些剛剛上線了一些質(zhì)量比較好的評(píng)論,在短時(shí)間獲得大量贊的評(píng)論,可能會(huì)超過(guò)之前的評(píng)論,從而排序會(huì)出現(xiàn)在更靠前。

2)另外,可以嘗試在評(píng)論區(qū)里面開(kāi)辟一個(gè)熱門(mén)評(píng)論區(qū)。由編輯精選的一些優(yōu)質(zhì)的評(píng)論,去不停地滾動(dòng),去嘗試推薦這些評(píng)論。比如說(shuō)達(dá)到曝光量一萬(wàn)的時(shí)候,或者達(dá)到一定的數(shù)值,這個(gè)數(shù)值可以是點(diǎn)贊數(shù),也可以是其他的關(guān)鍵行為。

如果他達(dá)到了我們的一個(gè)預(yù)期值。那他可以繼續(xù)留在這里,再把一些不滿(mǎn)足的評(píng)論給踢掉,換其他一些優(yōu)質(zhì)評(píng)論上來(lái)。這樣子就可以保證有比較多的新增評(píng)論可以在評(píng)論區(qū)里面不斷被曝光。而且如果他真的寫(xiě)得好的話,其實(shí)可以他曝光之后可以

 

作者:郭小刀刀

鏈接:http://www.jianshu.com/p/3feb0794e8ac

本文由 @郭小刀刀 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自PEXELS,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 寫(xiě)的很全面,力透紙背,引人深思。

    來(lái)自廣東 回復(fù)
  2. 如果評(píng)論數(shù)量級(jí)在平臺(tái)搭建初期,很少的情況下,是否提供給商家(店鋪)把自己店鋪下面的某些評(píng)論置頂?shù)墓δ苣?。原?/p>

    來(lái)自上海 回復(fù)
  3. 作為一只老是寫(xiě)好好好、贊贊贊的煙酒僧,我表示很羞愧 ?

    來(lái)自浙江 回復(fù)
  4. 評(píng)論從用戶(hù)屬性出發(fā),這個(gè)出發(fā)點(diǎn)是好,但點(diǎn)贊評(píng)論很高并不一定就是優(yōu)質(zhì)評(píng)論,可能是段子或引起共鳴的批判性語(yǔ)言等,情況比較復(fù)雜,也是一種思路

    回復(fù)
    1. 這也是為什么網(wǎng)易云音樂(lè)的評(píng)論里一堆“這二胡拉得太6了”、“我的腿抖得停不下來(lái)”、“媽媽問(wèn)我為什么跪了”了。

      來(lái)自浙江 回復(fù)
  5. 太有用了,最近在做評(píng)論這塊,感謝分享

    回復(fù)
  6. 為啥,因子越大,相乘之后,分?jǐn)?shù)會(huì)越低?

    來(lái)自北京 回復(fù)
    1. 這個(gè)因子可以是正數(shù),也可以是負(fù)數(shù)吧。

      來(lái)自浙江 回復(fù)
    2. 上面作者寫(xiě)到了,這個(gè)是一個(gè)衰減因子

      來(lái)自浙江 回復(fù)
  7. 好好好,贊贊贊(笑)

    來(lái)自浙江 回復(fù)