不要迷信算法,會(huì)變得無趣

5 評(píng)論 7491 瀏覽 3 收藏 16 分鐘

編輯導(dǎo)語:算法推薦在各個(gè)平臺(tái)應(yīng)用廣泛,在抖音上刷到了一個(gè)視頻,你點(diǎn)贊了,這一段時(shí)間就會(huì)不時(shí)地給你推薦相關(guān)類型的視頻,讓你感覺它占據(jù)了你的全部信息場所,但是事實(shí)上不是這樣的,算法推薦只是基于一定基礎(chǔ)上進(jìn)行推薦,你仍可以根據(jù)自己的喜好搜索自己想要的信息。這篇文章介紹了APP工廠真正的優(yōu)勢和算法推薦并不是唯一的信息推薦方式,推薦想要了解算法推薦的童鞋進(jìn)行閱讀。

在互聯(lián)網(wǎng)世界,近年來彌漫著一股“算法迷信”的風(fēng)氣,并且有愈演愈烈之勢。

以字節(jié)跳動(dòng)的快速崛起為起點(diǎn),尤其是大家提到抖音時(shí),會(huì)理所當(dāng)然地認(rèn)為他們的秘密武器是存儲(chǔ)在服務(wù)器里那一行行神秘的代碼。

這種迷信在去年TikTok的強(qiáng)制賣身風(fēng)波中體現(xiàn)得淋漓盡致。當(dāng)談判陷入僵局,有相當(dāng)一部分競購方認(rèn)為如果出售業(yè)務(wù)不帶有算法,那么毫無意義。

《華爾街日報(bào)》援引自消息人員的說法是,沒有算法的TikTok就如同用著廉價(jià)引擎的豪車。

但事實(shí)上,字節(jié)內(nèi)部關(guān)于機(jī)器學(xué)習(xí)推薦算法并未取得多少外界未知的突破性進(jìn)展。

雖然抖音并未在國內(nèi)公布他們的算法是如何工作的,但為了自證清白,TikTok不僅向當(dāng)?shù)氐谋O(jiān)管機(jī)構(gòu)和外部隱私專家開放了查看代碼的權(quán)利,還在洛杉磯建立了一個(gè)存放著所有數(shù)據(jù)流和代碼的透明度及問責(zé)中心。

可我們至今都沒有找到任何關(guān)于個(gè)性化推薦算法函數(shù)本身的顛覆性創(chuàng)意,美國市場上也沒有出現(xiàn)新的相關(guān)產(chǎn)品。那么,APP工廠的真正優(yōu)勢,到底在哪里?

一、字節(jié)系爆款真正的閃光點(diǎn),在算法友好型的UI設(shè)計(jì)上

過去二十年,科技產(chǎn)品的UI設(shè)計(jì)始終圍繞著如何消除用戶與他們的需求之間的摩擦。

在這個(gè)網(wǎng)絡(luò)效應(yīng)爆發(fā)式增長的時(shí)代,誰能設(shè)計(jì)出比競爭對手更好地滿足用戶需求的產(chǎn)品和服務(wù),誰就能成為利用聚合理論獲得大量用戶群的科技巨頭。

這是一種寫在字里行間的以用戶為中心。

拔地而起的科技公司,迅速過載的膨脹信息,讓我們?yōu)橛脩籼峁┳詈梅?wù)的關(guān)鍵,從洞察人們某種未被發(fā)掘的需求變成了利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)對海量數(shù)據(jù)的篩選與過濾。

首先明確一個(gè)前提:ML算法的訓(xùn)練需要大量的數(shù)據(jù)集,任何一個(gè)Google或Facebook的算法專家都沒辦法獨(dú)自訓(xùn)練出一個(gè)高質(zhì)量的推薦算法。

這是否意味著所有全新垂類的APP都會(huì)被打上大廠的標(biāo)簽?

大概率是這樣,但不全是。

自1998年亞馬遜推出基于項(xiàng)目的協(xié)同過濾算法以來,它被改編和應(yīng)用到了大部分網(wǎng)頁上,比如向人們推薦視頻或新聞的算法,以及各式各樣的互聯(lián)網(wǎng)廣告。

但作為個(gè)性化推薦的商業(yè)鼻祖,亞馬遜只有30%的網(wǎng)頁瀏覽量來自推薦系統(tǒng),搜索結(jié)果頁面目前仍是用戶下單的最主要路徑。

在這個(gè)推薦引擎中,系統(tǒng)正常運(yùn)轉(zhuǎn)的前提是用戶過往的購買記錄、在商店瀏覽過的商品、已經(jīng)添加到購物車?yán)锏纳唐?,以及一些以后可能?huì)訂購的商品。

所有的一切都是基于用戶的搜索行為。所以時(shí)至今日,我們依然會(huì)面臨在淘寶上搜索一次“花架”就一直被推薦花架的囚徒困境,而不是轉(zhuǎn)而詢問你需不需要一盆花。

可以明顯地感覺到,這類算法永遠(yuǎn)都處于“猜你喜歡”的狀態(tài)。因?yàn)楫?dāng)屏幕上同時(shí)展示多個(gè)項(xiàng)目時(shí),它無法分辨出你的眼睛所注視的到底是哪個(gè)區(qū)域。就算能看到,因?yàn)闆]有upvote/downvote的反饋設(shè)置,它也不可能知道這種關(guān)注是正面的還是負(fù)面的。

一言以蔽之,算法對用戶情緒的判斷并不清晰。

然后我們再來看抖音的界面。

從視頻開始播放的那一刻起,APP的UI設(shè)計(jì)會(huì)促使用戶立即開始思考一個(gè)問題:你怎么看待眼前的這個(gè)視頻?

  1. 你會(huì)在視頻還沒播放完的時(shí)候就下滑進(jìn)入下一個(gè)視頻嗎?是的話就隱含表示你對它不感興趣。
  2. 你看完了它,還給視頻漫不經(jīng)心地點(diǎn)了個(gè)贊?
  3. 你在這個(gè)視頻中停留了一陣子,甚至讓它循環(huán)播放了好幾次?
  4. 你通過內(nèi)置的分享面板把這段視頻分享給別人了嗎?
  5. 你是否點(diǎn)擊了右下角旋轉(zhuǎn)的LP圖標(biāo),看了更多使用同款背景音樂的視頻?
  6. 你打開視頻制作者的個(gè)人界面頁面了嗎? 是否觀看了他其他的視頻?之后你關(guān)注這個(gè)人了嗎? 是的話,說明你除了喜歡這個(gè)視頻之外,也許還特別喜歡這類人。

但這些都不屬于硬核的技術(shù)突破,而是來自UI方面的巧妙構(gòu)思。

這種設(shè)計(jì)最大的特點(diǎn),就是幫助用戶像算法一樣看東西。

所以抖音的算法比其他短視頻APP學(xué)得更快。這一點(diǎn)非常重要,要知道,即使算法本身同幾年前并沒有有太大差別,僅僅是在更大的數(shù)據(jù)集上進(jìn)行訓(xùn)練,就足以讓OpenAI開發(fā)出GPT-3這樣的模型。

在抖音之前,絕大部分短視頻App都采用了微博式的界面,照搬圖文信息流的展示方式,以縮略圖的形式顯示視頻,再加上幾個(gè)關(guān)鍵詞標(biāo)簽或一段描述。

這種信息展示的方式歷史悠久,適用面很廣,但是對算法來說并不友好。

至于抖音設(shè)計(jì)巧思的來源,如果你恰巧使用過他們早期的版本,就會(huì)發(fā)現(xiàn)其界面、內(nèi)容、調(diào)性與Musical.ly如出一轍。

據(jù)說張一鳴很早就洽談過收購musical.ly,后來未果才回國做了抖音。完成反向收購之后,字節(jié)的后端算法插入Musical.ly(現(xiàn)在的TikTok)的效果是顯著的,用戶時(shí)長很快就增長了一倍以上。

二、算法推薦是重要的,但它并非全部

信息展現(xiàn)方式一直是互聯(lián)網(wǎng)產(chǎn)品里最基礎(chǔ)的部分,也是爭議最大的部分。

只是在技術(shù)至上的論調(diào)下被忽略了。

最常見的信息展現(xiàn)方式有瀑布流,以及全屏。它們之間的區(qū)別在于一屏里放多少內(nèi)容合適。

按照張小龍?jiān)谖⑿殴_課上的說法,一屏里的內(nèi)容條數(shù),跟命中率成反比。所以視頻號(hào)上線后的前半年,采用半屏式的信息流展現(xiàn)方式。后來在灰度半屏和全屏的用戶時(shí),關(guān)注tab的用戶因?yàn)閮?nèi)容命中率不夠高,全屏后反而帶來了后臺(tái)清晰可見的選擇困難。

這是內(nèi)容池深度的問題,與推薦算法的調(diào)教無關(guān)。

這里普及一個(gè)技術(shù)方面的常識(shí):當(dāng)?shù)讓诱倩貎?nèi)容數(shù)據(jù)不足時(shí),算法會(huì)從候選隊(duì)列中進(jìn)行降級(jí)召回。

即本來算法覺得用戶可能會(huì)喜歡內(nèi)容A,但整個(gè)內(nèi)容候選集中都沒有A的存在,只能遞補(bǔ)與A相近的B。

如果連B都沒有時(shí),算法會(huì)進(jìn)一步做降級(jí)召回處理,或是直接按照熱度排序補(bǔ)充全局熱門的內(nèi)容給用戶。

從而帶來持續(xù)的惡性循環(huán)——被污染了的算法模型,會(huì)始終局限在某個(gè)范圍內(nèi)尋求帕累托次優(yōu)解。

出于這樣的理由,我更愿意相信視頻號(hào)的全屏是出于內(nèi)容積累到達(dá)某個(gè)臨界點(diǎn)后開始進(jìn)入調(diào)教算法的階段,而非所謂的對抖音的妥協(xié)。包括快手的精選tab,也是同樣的道理。

人們永遠(yuǎn)可以爭論社交網(wǎng)絡(luò)是由什么組成的,但需要明確的一個(gè)前提是,大多數(shù)社交網(wǎng)絡(luò)都采用一種漸進(jìn)的方式來擴(kuò)大規(guī)模。

鼓勵(lì)用戶與其他人互關(guān),一次建立一個(gè)聯(lián)系。為工具而來,為關(guān)系而留,這樣做唯一的問題就是速度太慢,而互聯(lián)網(wǎng)恰好是一個(gè)崇拜速度的地方。

只需要搜幾個(gè)關(guān)鍵詞,無需關(guān)注或與任何人成為好友,抖音就可以快速了解一個(gè)人的喜好。

我們姑且把它命名為一個(gè)圍繞興趣建立的娛樂網(wǎng)絡(luò)?,F(xiàn)階段,它是一個(gè)快速、高效的傳播媒介,因?yàn)檫@個(gè)網(wǎng)絡(luò)不由關(guān)系連接,所以抖音博主的流量永遠(yuǎn)不可能屬于個(gè)體。

很多人認(rèn)為抖音商業(yè)化走在前面是因?yàn)閺V告算法好,但實(shí)際上抖音對游戲廣告主的包容程度才是隱藏不言的奧秘,他們允許以單個(gè)付費(fèi)用戶為單位結(jié)算,甚至可以約定“若用戶流失則退款”。

然而想靠這個(gè)設(shè)計(jì)留住用戶和增長并不現(xiàn)實(shí)(字節(jié)國內(nèi)的廣告收入趨于停滯已經(jīng)證明了這件事)。中文互聯(lián)網(wǎng)的殘酷之處在于,任何UI設(shè)計(jì)都可以在一夜之間被同類產(chǎn)品模仿和復(fù)制,只要它被證明是有用的。

在這個(gè)機(jī)器學(xué)習(xí)占據(jù)主流的時(shí)代,全屏的設(shè)計(jì)就是為了幫助算法更快地去“看”這個(gè)世界。

但這并不意味著算法是萬能的。因?yàn)橹钡浇裉?,字?jié)都沒有辦法大規(guī)模地侵入長視頻領(lǐng)域,即使張一鳴的戰(zhàn)略PPT上明明白白地寫著“只要在信息分發(fā)領(lǐng)域,字節(jié)都要用算法來重新做一遍?!?/p>

即使抖音的UI設(shè)計(jì)讓他們的算法迭代更快,也不可能做到篩選出人們行為信息中的所有“噪聲”。有時(shí),人們希望算法再“聰明”一些,更理解自己;有時(shí),人們并不愿意重復(fù)看那些自己感興趣的內(nèi)容,也想了解一點(diǎn)公共熱點(diǎn);還有的時(shí)候,人們會(huì)想培養(yǎng)一些新的潛在興趣。

事實(shí)上,那些乏味重復(fù)、引起用戶輕微不快的內(nèi)容才是產(chǎn)品的慢性殺手。如今,這些負(fù)面情緒正在抖音的APP里緩慢發(fā)酵。

算法今天不是,未來也不可能是萬能的。

舉一個(gè)最直觀的例子,不管是我們自己的優(yōu)愛騰,還是海外那個(gè)算法驅(qū)動(dòng)的Netflix,內(nèi)容消費(fèi)都是以運(yùn)營陣地和導(dǎo)航搜索為第一生產(chǎn)力的。

因?yàn)闆Q疑成本的巨大差異,長視頻至今還保持著傳統(tǒng)貨架式的消費(fèi)方式:

最新最熱的內(nèi)容放在首頁曝光度最高的輪播欄;用戶依賴類目導(dǎo)航去查找想要的內(nèi)容,比如按照類型、地區(qū)、上映時(shí)間和評(píng)分來選擇電影;還有很大一部分消費(fèi)來自于搜索對應(yīng)的站外決策。

比如在微博種草了某部電視劇,根據(jù)豆瓣評(píng)分來選擇觀看的電影,以及最近身邊的朋友們常常聊起的綜藝。

毫無疑問,算法在長視頻領(lǐng)域依然沒有占據(jù)主導(dǎo)地位。

三、結(jié)語

當(dāng)個(gè)性化推薦在某些領(lǐng)域大殺四方之時(shí),我們總會(huì)不由自主地假設(shè)它占據(jù)我們?nèi)啃畔鼍暗漠嬅?;然而,現(xiàn)實(shí)卻是一個(gè)人在日常生活中接觸信息的渠道,遠(yuǎn)比他自己想象得要更加豐富。

假設(shè)一個(gè)初級(jí)電影愛好者想在周末看一部電影,會(huì)有幾種可能?

他可能直接打開搜索框,搜索自己喜歡的演員或?qū)а荩纯此麄冞€有哪些自己沒看過的作品;也可能打開豆瓣,刷一刷有沒有自己感興趣的電影;當(dāng)然,如果他有一個(gè)朋友恰好是發(fā)燒級(jí)的影迷,他可以直接請對方推薦幾部。

事實(shí)上,推薦、搜索和社交是滿足人們不同需求的互補(bǔ)類工具,它們之間并沒有明確的替代關(guān)系。

算法與編輯、社交并不對立,也不存在唯一的最優(yōu)選。就像微信的算法,一定有克服「社交情景崩潰」的成分,而今日頭條的內(nèi)容審核,也聘請了大量的人工編輯。

當(dāng)我們站在科技與人文的交匯點(diǎn)去看這個(gè)世界,會(huì)發(fā)現(xiàn)每一種新技術(shù)都既是包袱又是恩賜,它永遠(yuǎn)不會(huì)是非此即彼的結(jié)果,反倒比我們預(yù)想中的要更加復(fù)雜與深刻。

《楚門的世界》里,創(chuàng)造者對楚門說:“外面的世界跟我給你的世界一樣的虛假,有一樣的謊言,一樣的欺詐。但在我的世界你什么也不用怕,我比你更清楚你自己。”

楚門卻說:“You never had a camera in my head!”(你無法在我腦子里裝一個(gè)攝像機(jī))

盡管楚門的世界是假的,但楚門是真實(shí)的。所有計(jì)算好的下一刻,是行云流水般的此世光陰。

【參考資料】

  1. 取消算法推薦,是技術(shù)上的倒退嗎?騰訊研究院,2021年
  2. Seeing Like an Algorithm,Eugene Wei,2020年
  3. 算法知識(shí)匯總:構(gòu)成/學(xué)派/算法,潘一鳴,2019年
  4. 推薦算法的“前世今生”,紙皮小火車,2019年

 

作者 : 牧遙,公眾號(hào):科技復(fù)聯(lián)汪

本文由 @科技復(fù)聯(lián)汪 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 推薦、搜索和社交是社交互補(bǔ)性工具,不能相互替代,也不能一家獨(dú)大。

    來自陜西 回復(fù)
  2. 有一段時(shí)間很相信算法,感覺算法入侵了我所有娛樂APP,但是后來就發(fā)現(xiàn)不是這樣的,我仍可以根據(jù)喜好去搜索,讓算法猝不及防。

    來自陜西 回復(fù)
  3. 大數(shù)據(jù)時(shí)代,總是感覺被數(shù)據(jù)所監(jiān)控,在抖音上看了一件商品,有時(shí)候刷別的軟件的時(shí)候就會(huì)到相似的內(nèi)容。

    來自陜西 回復(fù)
  4. 不要迷信算法,會(huì)變得無趣。你題目把我都給搞混了,哈哈哈,看完之后才知道,原來是明白算法機(jī)制之后就可以行云流水了,但是前提是內(nèi)容得還可以。

    來自河南 回復(fù)
    1. 是醬紫滴~

      來自四川 回復(fù)