亞馬遜產(chǎn)品經(jīng)理:TikTok 的真正優(yōu)勢(shì),從來(lái)都不是算法(上)

0 評(píng)論 11993 瀏覽 25 收藏 20 分鐘

編輯導(dǎo)語(yǔ):在如今大數(shù)據(jù)的時(shí)代,一些軟件會(huì)根據(jù)我們的地理位置、性別、喜好等等進(jìn)行算法推薦;能夠?qū)σ欢ㄒ?guī)范的輸入,在有限時(shí)間內(nèi)獲得所要求的輸出;比如TikTok,以用戶為中心進(jìn)行推薦,精確度很高;本文作者分析了TikTok 的真正優(yōu)勢(shì),我們一起來(lái)看一下。

字節(jié)跳動(dòng)往往被說(shuō)成是一家算法公司,很多人認(rèn)為, TikTok是靠算法的黑科技才取得成功的。

事實(shí)真的是這樣嗎?

eugenewei認(rèn)為不是:TikTok的算法跟其他公司使用的并沒(méi)有太大的不同;TikTok最大的優(yōu)勢(shì)是它采取了對(duì)算法友好的設(shè)計(jì)模式,在自己內(nèi)部建立了一個(gè)飛輪,幫助其機(jī)器學(xué)習(xí)算法看到了優(yōu)化自己所需要看到的東西。

原文發(fā)表在其個(gè)人博客上,標(biāo)題是:Seeing Like an Algorithm;篇幅關(guān)系,我們分兩部分刊出,此為上半部分。

劃重點(diǎn):

  • TikTok的算法本身沒(méi)什么不一樣;
  • TikTok的不一樣在于它的app設(shè)計(jì)讓算法“看到”有效精確地執(zhí)行匹配工作所需的所有細(xì)節(jié);
  • 現(xiàn)代社交網(wǎng)絡(luò)巨頭的傲慢導(dǎo)致自己陷入到錯(cuò)綜復(fù)雜的問(wèn)題不能自拔;
  • 為了讓自己的算法發(fā)揮最大的效用,TikTok成為了自己的訓(xùn)練數(shù)據(jù)源;
  • 以用戶為中心的設(shè)計(jì)模式一直占據(jù)主導(dǎo),但算法友好型設(shè)計(jì)正在逆襲;
  • 為了最大限度地服務(wù)好用戶,請(qǐng)先服務(wù)好你的算法;
  • TikTok的設(shè)計(jì)使得它的視頻、用戶和用戶首選項(xiàng)對(duì)For You Page算法清晰可見(jiàn)。

在我上一篇關(guān)于TikTok的文章中,我討論了為什么它的For You Page算法是讓TikTok發(fā)揮作用的結(jié)締組織;它就是主板的總線,用來(lái)連接和關(guān)閉所有的反饋回路。

但是,在急于了解為什么各家公司都想收購(gòu)TikTok的情況下,如果字節(jié)跳動(dòng)把這款熱門的短視頻app拆分出來(lái)的話,圍繞著它的算法的炒作已經(jīng)有點(diǎn)被異化成那種往往被歸納為最近西方對(duì)中國(guó)科技分析的套路了。

在這篇文章中,我想討論一下TikTok的設(shè)計(jì)究竟是如何幫助它的算法表現(xiàn)得跟它一樣好的。

上次我討論了為什么FYP(For You Page)算法是TikTok飛輪的核心,但是如果這一算法不夠有效的話,那整個(gè)反饋回路就會(huì)崩潰;哪怕你對(duì)TikTok或短視頻領(lǐng)域不感興趣,了解一下這個(gè)算法是如何實(shí)現(xiàn)精確性也很重要,因?yàn)楦餍懈鳂I(yè)的公司都日益面臨著核心優(yōu)勢(shì)是機(jī)器學(xué)習(xí)算法的競(jìng)爭(zhēng)對(duì)手的競(jìng)爭(zhēng)。

我想討論的是TikTok的設(shè)計(jì)是如何幫助它的算法“看”東西的。

一、《國(guó)家的視角》 Vs 算法的視角

James C. Scott的《國(guó)家的視角》(Seeing Like a State)是那種很獨(dú)特的書,看過(guò)之后你會(huì)意識(shí)到硅谷就有那種使用(濫用)清晰性這個(gè)術(shù)語(yǔ)的類型。

我是在看到Venkatesh Rao的書摘之后第一次聽(tīng)說(shuō)這本書的,如果你不打算看原著的話,那篇書摘仍然是很好的tldr入門讀物(Scott Alexander的書評(píng)也不錯(cuò),只不過(guò)他的書評(píng)也已經(jīng)長(zhǎng)到可以做自己的tldr );不過(guò),我建議你還是要好好看看原著。

Scott那本書的副標(biāo)題是“那些試圖改善人類狀況的項(xiàng)目是如何失敗的”。

這本書可以提高你對(duì)日常生活當(dāng)中的各種意外后果的意識(shí),當(dāng)我們也有著偉人一般的傲慢時(shí),不妨保持更謙卑的態(tài)度;這個(gè)世界比我們想象的要更豐富、更復(fù)雜。

比方說(shuō),Scott的討論有很多都跟我們的現(xiàn)代社交網(wǎng)絡(luò)巨頭的某種傲慢感有關(guān);這些占主導(dǎo)地位的應(yīng)用的目的就是要提高自身用戶群的清晰性,其中包括促進(jìn)互動(dòng)、防止用戶流失并最終提供定向廣告;反過(guò)來(lái),這又導(dǎo)致他們的母公司陷入到錯(cuò)綜復(fù)雜的問(wèn)題之中,至今都未能擺脫困境。

不過(guò)這是需要另行討論的話題了;Scott關(guān)注的是民族國(guó)家如何用簡(jiǎn)化的抽象在概要的層面 “看清”自己的公民,而我想討論的是TikTok的app設(shè)計(jì)是如何讓它的算法“看到”有效精確地執(zhí)行匹配工作所需的所有細(xì)節(jié)的——這篇文章討論的則是是應(yīng)用和服務(wù)在設(shè)計(jì)時(shí)最大限度利用機(jī)器學(xué)習(xí)新模式。(我知道,這種討論有點(diǎn)諷刺意味,因?yàn)檫@種“看法”有可能被塑造為另一種決定用戶看法的看法,一種美國(guó)的科技公司只能作壁上觀的看法。)

二、TikTok把自己變成算法的訓(xùn)練源

近年來(lái),至少在像我這樣的門外漢看來(lái),我們意識(shí)到,只需要通過(guò)把訓(xùn)練的數(shù)據(jù)量增加幾個(gè)數(shù)量級(jí),機(jī)器學(xué)習(xí)就可以取得很大程度的進(jìn)步;也就是說(shuō),就算算法本身跟幾年前沒(méi)有太大的不同,僅通過(guò)在更大的數(shù)據(jù)集上對(duì)其進(jìn)行訓(xùn)練,人工智能研究人員就能取得像GPT-3這樣的突破(GPT-3暫時(shí)給科技Twitter們帶來(lái)了高潮) 。

當(dāng)大家說(shuō)TikTok的算法是取得成功的關(guān)鍵時(shí),很多人會(huì)把某些神奇的代碼段看作是公該司的秘密武器。

俄羅斯當(dāng)代后現(xiàn)代主義作家Viktor Pelevin說(shuō),所有的現(xiàn)代電影都是同一個(gè)主角:一個(gè)裝滿錢的公文包;從《死吻》的放射性物質(zhì)公文包,到《低俗小說(shuō)》里面的那個(gè)類似的里面金光閃閃的、不知道裝著什么的公文包;從《魔頭對(duì)捕頭》(The Formula)的創(chuàng)世紀(jì)方程,到大衛(wèi)·馬梅特(David Mamet)的《西班牙囚犯》(The Spanish Prisoner)里面的秘密的金融處理,我們長(zhǎng)期以來(lái)一直對(duì)有魔力的麥格芬(McGuffin,推動(dòng)情節(jié)發(fā)展的對(duì)象或事件)感到癡迷。

最近幾周,對(duì)TikTok算法的討論已經(jīng)把它提升成了類似的東西,這個(gè)算法就好像是《奪寶奇兵》系列電影(如《法柜奇兵》、《圣戰(zhàn)奇兵》…)里面那些神秘的考古文物一樣。

但是這個(gè)領(lǐng)域大多數(shù)的專家的態(tài)度不會(huì)是這樣,他們不相信TikTok在機(jī)器學(xué)習(xí)推薦算法方面取得了迄今為止我們所不知道的進(jìn)步;實(shí)際上,大多數(shù)人會(huì)說(shuō),TikTok的做法大概跟別人的解決問(wèn)題方法無(wú)異。

但是要記住的是,機(jī)器學(xué)習(xí)算法的有效性不僅僅取決于算法,還要取決于利用某些數(shù)據(jù)集訓(xùn)練過(guò)后的算法;GPT-3也許并沒(méi)有什么新鮮,但是通過(guò)接受大規(guī)模的數(shù)據(jù)訓(xùn)練,以及設(shè)置大量的參數(shù),其輸出往往令人驚訝。

同樣地,基于自身數(shù)據(jù)集訓(xùn)練過(guò)的TikTok FYP算法,在將視頻與認(rèn)為該視頻有趣的人進(jìn)行匹配方面非常準(zhǔn)確有效(而且,同樣重要的是,在不向那些不認(rèn)為視頻有趣的人推送方面也很有效) 。

有些領(lǐng)域,比方說(shuō)文本,可以輕松獲得大量訓(xùn)練得很好的數(shù)據(jù);比方說(shuō),要想訓(xùn)練出像GPT-3這樣的AI模型,你可以到互聯(lián)網(wǎng)、書籍等上面找到大量可用的文本集;如果你想訓(xùn)練視覺(jué)AI,可以在網(wǎng)上和各種數(shù)據(jù)庫(kù)里面找到大量照片;訓(xùn)練仍然很費(fèi)錢,但是至少你手頭有足夠的訓(xùn)練數(shù)據(jù)。

但對(duì)于TikTok (或者抖音)來(lái)說(shuō),它那擅長(zhǎng)推薦短視頻給受眾的算法可就沒(méi)有公開(kāi)可用的這么大規(guī)模的訓(xùn)練數(shù)據(jù)集了。

去哪里可以找到模因、小孩跳舞、對(duì)口型、可愛(ài)的寵物、推銷品牌的網(wǎng)紅、士兵越障訓(xùn)練、小孩模仿品牌等內(nèi)容的短視頻呢?就算你有這樣的視頻,又該去哪里找到關(guān)于大眾對(duì)此類視頻感受的可比數(shù)據(jù)呢?除了Musical.ly的數(shù)據(jù)集以外(主要是美國(guó)喜歡玩對(duì)口型的青少年),這樣的數(shù)據(jù)并不存在。

這是一個(gè)獨(dú)特的雞生蛋還是蛋生雞的問(wèn)題,如果沒(méi)有這款app的的攝像頭工具和濾鏡,以及拿到版權(quán)的音樂(lè)剪輯的話,TikTok的算法需要訓(xùn)練的那種視頻就很難創(chuàng)建。

那么,這就是TikTok設(shè)計(jì)的魔力所在:app會(huì)激發(fā)和促進(jìn)視頻的創(chuàng)作與瀏覽,算法然后用這些視頻進(jìn)行訓(xùn)練,再反過(guò)來(lái)激發(fā)和促進(jìn)視頻的創(chuàng)作與瀏覽,形成反饋回環(huán)。

為了讓自己的算法發(fā)揮最大的效用,TikTok成為了自己的訓(xùn)練數(shù)據(jù)源。

三、以用戶中心 Vs 對(duì)算法友好

要了解TikTok是如何做出這么強(qiáng)大的學(xué)習(xí)飛輪,我們需要對(duì)它的設(shè)計(jì)進(jìn)行深入研究。

關(guān)于科技的UI設(shè)計(jì),主導(dǎo)的思想流派(至少是我成長(zhǎng)的過(guò)去二十年里)關(guān)注的重點(diǎn)是消除用戶所做事情的摩擦,并讓他們?cè)诖诉^(guò)程中感到愉悅;其設(shè)計(jì)目標(biāo)是優(yōu)雅,什么是優(yōu)雅:優(yōu)雅就是直觀、巧妙,甚至?xí)r尚。

也許沒(méi)有一家公司比蘋果把這種設(shè)計(jì)風(fēng)格體現(xiàn)得更加淋漓盡致,巔峰狀態(tài)下的蘋果總能把自己的軟硬件做出優(yōu)雅的感覺(jué)——“就是這么好用(it just works)”,但同時(shí)又很迷人,讓用戶覺(jué)得很雅致。

(蘋果控制風(fēng)格的名聲就沒(méi)那么光彩了——手機(jī)、筆記本電腦不可替換的電池,目前有關(guān)應(yīng)用商店規(guī)則的爭(zhēng)論)在發(fā)布新品的主旨演講時(shí),展示一塊硬邦邦的鋁塊是如何變成嶄新的MacBook Pro機(jī)身的視頻的理由是什么?

因?yàn)槁?tīng)到工業(yè)激光把那塊鋁雕刻成一體化機(jī)身時(shí)發(fā)生的聲音很性感?然后,當(dāng)你在咖啡店用那臺(tái)筆記本電腦敲擊一封電子郵件時(shí),在你的潛意識(shí)里,有關(guān)那段視頻的一點(diǎn)殘留的記憶里面會(huì)不會(huì)讓你的多巴胺受到一點(diǎn)點(diǎn)的觸動(dòng)?

這種以用戶為中心的設(shè)計(jì)模式在這么長(zhǎng)時(shí)間以來(lái)一直占據(jù)著主導(dǎo)地位是有原因的,尤其是在消費(fèi)類技術(shù)里面。

首先,這的確有用——蘋果的市值最終超過(guò)了2萬(wàn)億美元(還記得假冒的Sean Parker說(shuō)過(guò)十億美元很酷嗎?那還是十年前,現(xiàn)在十億美元不再是金牛了,財(cái)富的量級(jí)在飛速發(fā)展。)

此外,我們生活在大規(guī)模網(wǎng)絡(luò)效應(yīng)時(shí)代,應(yīng)用了Ben Thompson的聚合理論并獲得大量用戶群的科技巨頭,可以在他們所參與的市場(chǎng)當(dāng)中發(fā)揮出不可思議的杠桿作用——要先做到這一點(diǎn),最佳的辦法之一就是設(shè)計(jì)出能比競(jìng)爭(zhēng)對(duì)手更好地滿足用戶需求的產(chǎn)品和服務(wù)

長(zhǎng)期以來(lái),這種設(shè)計(jì)流派一直占據(jù)著主導(dǎo)地位,以至于我?guī)缀跬浟诉^(guò)去時(shí)代慣常采用過(guò)的一些蠻不講理的軟件設(shè)計(jì)了。(不要把它跟野獸派設(shè)計(jì)混為一談,后者其實(shí)就像它在建筑方面的表親一樣,在設(shè)計(jì)上是相當(dāng)美的。)

但是,如果要想最大限度地服務(wù)好用戶的關(guān)鍵要取決于對(duì)機(jī)器學(xué)習(xí)算法的訓(xùn)練呢?如果這個(gè)ML算法需要龐大的訓(xùn)練數(shù)據(jù)集該怎么辦?在機(jī)器學(xué)習(xí)方興未艾的時(shí)代,這日益成為關(guān)鍵的設(shè)計(jì)目標(biāo)。

在考慮如何設(shè)計(jì)app時(shí),你日益必須考慮怎么才能最好地幫助算法去“看”——為了最大限度地服務(wù)好用戶,請(qǐng)先服務(wù)好你的算法。

TikTok讓我著迷,因?yàn)椴还苁且馔膺€是有意而為之,這都是一個(gè)為了盡可能多地給自己的算法提供有用信號(hào)的現(xiàn)代app的典范——這就是我所謂的算法友好型設(shè)計(jì)的范本。(我曾經(jīng)想過(guò)把它叫做以算法為中心的設(shè)計(jì),但覺(jué)得這種說(shuō)法有點(diǎn)過(guò)頭了;一個(gè)幫助算法看見(jiàn)東西的設(shè)計(jì)到頭來(lái)仍然是為了給用戶提供盡可能好的體驗(yàn)。)

我們?nèi)匀豢梢哉J(rèn)為這只是以用戶為中心的設(shè)計(jì)的一種變體,但是對(duì)于那些大量采用機(jī)器學(xué)習(xí)算法組件進(jìn)行產(chǎn)品開(kāi)發(fā)的團(tuán)隊(duì)來(lái)說(shuō),明確地承認(rèn)這一點(diǎn)也許有用;畢竟,當(dāng)產(chǎn)品經(jīng)理,設(shè)計(jì)師和工程師開(kāi)會(huì)討論app設(shè)計(jì)時(shí),算法是不會(huì)出席的;但是,對(duì)算法的訓(xùn)練需求必須得到體現(xiàn)。

James Scott在談到《國(guó)家的視角》,談到了城市設(shè)計(jì)等領(lǐng)域的巨大變化,比如讓土地面積和業(yè)主數(shù)量對(duì)征稅者“清晰可見(jiàn)”;TikTok的設(shè)計(jì)使得它的視頻、用戶和用戶首選項(xiàng)對(duì)For You Page算法清晰可見(jiàn);這種app設(shè)計(jì)履行了它的主要職責(zé)之一:“像算法一樣看東西”。

我們不妨仔細(xì)看看,TikTok打開(kāi)后就是“For You Page”頁(yè)面,然后直接進(jìn)入視頻。這就是它的樣子。

這個(gè)是到目前為止有史以來(lái)最熱門的TikTok視頻,截止到我發(fā)布這篇文章時(shí),它的34.1M個(gè)點(diǎn)贊可能已經(jīng)不止了;你可以看看有關(guān)這條TikTok是如何誕生的故事,看過(guò)之后你仍然會(huì)覺(jué)得這是一個(gè)充滿悖論的文化難題,但是你看過(guò)后會(huì)喜歡的。

我把這個(gè)給我侄女看了,然后我們一起循環(huán)播放了好幾十次,然后我們一起開(kāi)始大喊“從M到B,從M到B”,然后一起笑了起來(lái),這是我在這場(chǎng)疫情當(dāng)中真正的感受不是絕望的少數(shù)幾次之一。

整個(gè)屏幕被一個(gè)視頻填滿。只有一個(gè)視頻,視頻用豎屏全屏顯示;注意,這是不能滾動(dòng)的,而是分頁(yè)。視頻幾乎是立即自動(dòng)播放(接下來(lái)的幾個(gè)視頻被加載到后臺(tái),所以輪到的時(shí)候可以很快播放出來(lái))。

這種設(shè)計(jì)讓用戶要面對(duì)一個(gè)緊迫的問(wèn)題:你對(duì)這個(gè)短視頻的感覺(jué)如何?就這個(gè)短視頻。

從視頻開(kāi)始播放到現(xiàn)在,你所做的一切都是你對(duì)該視頻的感受的信號(hào);你是不是在它還沒(méi)播放完就滑向了下一個(gè)視頻?是的話就隱含(盡管邊界是顯性的)表示你對(duì)它不感興趣。

你是不是看了不止一次,讓它循環(huán)播放了好幾次?似乎不知怎的它就吸引了你。你有沒(méi)有通過(guò)內(nèi)置的分享面板分享了這段視頻?這是正面情緒的另一個(gè)有力指標(biāo)。

如果你點(diǎn)擊右下角旋轉(zhuǎn)的LP圖標(biāo),看了更多有著同樣背景音樂(lè)的視頻的話,就是該視頻對(duì)你胃口的進(jìn)一步信號(hào);音樂(lè)線索往往是模因的代名詞,現(xiàn)在TikTok又有了一條為你推薦視頻的軸線了。

還有,你是不是跑去看了看視頻創(chuàng)作者的個(gè)人資料頁(yè)面?你是不是看過(guò)她其他的視頻,然后還關(guān)注了對(duì)方?是的話說(shuō)明你除了欣賞視頻以外,也許你還特別欣賞對(duì)方這個(gè)人。

但是,我們不妨再退后一步,看看這你還沒(méi)有看到這個(gè)視頻之前,TikTok的算法自己是怎么“看見(jiàn)”這個(gè)視頻的;在這個(gè)視頻通過(guò)FYP算法發(fā)送到你的手機(jī)之前,TikTok的運(yùn)營(yíng)團(tuán)隊(duì)有人已經(jīng)看了這個(gè)視頻,并添加了大量相關(guān)標(biāo)簽或標(biāo)記。

這個(gè)視頻是跟跳舞有關(guān)的嗎?是對(duì)口型?還是視頻游戲?有小貓嗎?還是花栗鼠?是搞笑的嗎?主體是男的還是女的?大概幾歲?是群視頻嗎?背景在哪里?用的是什么濾鏡或視覺(jué)效果?如果里面包括有食物,是什么食物?等等,所有這些標(biāo)簽都成為了算法現(xiàn)在可以看到的功能。

視頻還要在視覺(jué)AI這里處理一下,并為自己能看到的東西做出貢獻(xiàn);TikTok有些攝像頭濾鏡能夠跟蹤人臉、手或者手勢(shì),所以視覺(jué)AI往往在視頻被創(chuàng)建出來(lái)之前就被調(diào)用過(guò)了。

這個(gè)算法還可以看到TikTok所了解到的有關(guān)你的信息,你過(guò)去喜歡什么類型的視頻?有關(guān)你的人口統(tǒng)計(jì)學(xué)信息或心理學(xué)信息有哪些?你是在哪里看這個(gè)視頻的?你用的是什么類型的設(shè)備?等等,除此之外,還有哪些其他用戶跟你相似?

 

譯者:boxi;原作者播客標(biāo)題:Seeing Like an Algorithm

原文地址:https://www.36kr.com/p/936688851967107

本文由 @神譯局 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!