看完抖音電商,你就明白字節AI終局布局

0 評論 518 瀏覽 1 收藏 26 分鐘

國內電商在有淘寶京東這兩個巨頭的情況下,抖音電商還是殺出了自己的一條路,而且僅僅才用了3年的時間。這篇文章,作者就梳理了抖音電商的發展歷程,一起來學習一下。

不服不行,抖音電商從圈外到圈內僅用了3年

一、發展歷程

2020 年:抖音電商 GMV 近 2000 億元,還為其他電商平臺導流 3000 億 GMV。6 月,抖音電商負責人康澤宇提出打造獨立字節跳動電商生態的設想,希望商家和品牌通過抖音小店在抖音內完成交易、不再跳轉外部平臺;10 月,抖音不再允許第三方平臺商品鏈接進入抖音達人直播間,抖音電商正式成立。

2021 年:抖音電商 GMV 完成 7300 億元,呈現出快速增長態勢。

2022 年:GMV 達到 1.41 萬億元,規模進一步擴大。

2023 年:商品交易總額(GMV)達 2.7 萬億,已十分接近同年京東的 3.47 萬億和拼多多的 3.2 萬億 GMV。

2024 年:預計 GMV 為 4 萬億,持續保持高速增長趨勢。

二、發展成果

短短3年間,抖音電商從最初起步到逐漸建立起獨立生態,GMV 不斷攀升,增長速度迅猛,在 2024 年其 GMV 規模已擠進4巨頭中的3巨頭。傳統電商巨頭京東、拼多多在 GMV 方面的差距,越來越危險。

在抖音電商的探索期,諸多挑戰如影隨形。創作者深陷商品選擇匱乏的泥沼,供應鏈體系亦漏洞百出。然而,抖音敏銳地捕捉到 AI 技術的巨大潛力,開啟了在電商領域的 AI 探索之旅。

此階段,抖音初步應用傳統推薦系統及早期 AI 算法。借助內容推薦技術,抖音依據用戶瀏覽的視頻內容,嘗試挖掘其潛在的商品興趣;運用計算機視覺技術,對商品圖片、視頻進行智能識別與分析,以更好地理解商品特性;憑借自然語言處理技術,解讀用戶的評論、搜索關鍵詞等文本信息,洞察用戶需求;通過深度學習技術,不斷優化對用戶行為和商品特征的理解與關聯。

抖音電商的推薦系統在探索期已具雛形,采用多層次召回和排序機制。它充分利用用戶行為數據,如觀看時長、點贊、評論、轉發等,以及商品信息,如品類、價格、品牌等,運用協同過濾算法尋找具有相似興趣的用戶群體,基于內容推薦算法分析商品與用戶興趣的匹配度,并引入深度學習算法進行深度挖掘與預測,以此不斷優化推薦效果,為用戶提供初步個性化的商品推薦。

同時,在大數據處理、實時計算和 AI 技術方面,抖音逐步積累經驗,為創作者工具和商家支持平臺的智能化發展奠定基礎。盡管初期困難重重,但抖音憑借這些技術創新與精準的推薦策略嘗試,成功踏出電商業務成長的關鍵步伐,并預示著未來將借助 AI 技術持續深耕,進一步提升電商平臺的效能與用戶體驗,在電商之路上砥礪前行,探索更多未知的可能。

「探索期」

2017 年底到 2018 年初,抖音上線購物車,購物袋兩個產品,可以掛外網的鏈接,想要激發創作者創作帶貨。

自從抖音上線購物車功能開始,抖音電商業務開始逐漸從廣告業務中脫離。但是受制于創作者不懂怎么組貨,也不懂供應鏈,品牌方也沒有人重視,一直都不溫不火。抖音還嘗試過通過付費流量的方式來分發商品,讓商家在過程中賺取流量,但這個模式非常傷害用戶體驗,最終發展不如預期。

抖音電商自2017年底推出購物車、購物袋等功能,開始逐步獨立于廣告業務,推動創作者帶貨。

探索期的AI

然而,初期面臨創作者缺乏商品選擇和供應鏈不完善等挑戰。隨著時間推移,抖音通過AI技術推動電商業務發展,利用內容推薦、計算機視覺、自然語言處理和深度學習等技術提升用戶體驗。抖音的推薦系統基于海量數據,通過特征工程、模型訓練和實時動態調整,為用戶提供個性化的商品推薦。

抖音電商的推薦系統采用多層次召回和排序機制,實時更新推薦內容。系統利用用戶行為數據和商品信息,通過協同過濾、內容推薦和深度學習等算法不斷優化推薦效果。此外,抖音在大數據處理、實時計算和AI技術方面積累了大量經驗,推動了創作者工具和商家支持平臺的智能化發展。盡管初期面臨困難,抖音通過技術創新和精準的推薦策略,成功促進了電商業務的成長,未來將繼續通過AI技術進一步提升電商平臺的效果和用戶體驗。

探索期主要應用傳統推薦系統和早期AI算法

三、「發展期」

真正讓抖音電商火起來是在2020 年,正值疫情期間,消費者出行受限、商家停工關門,線上購物需求大增。2020年4 月 1 日,抖音花了 6000 萬簽約了羅永浩,開啟直播帶貨,在 3 小時 17 分鐘的直播時間內,最終收獲了超過 1.1 億元人民幣的銷售額、4800 萬累計觀看人數、上了 2 次微博熱搜。

2020 年 6 月,字節跳動內部將電商視為戰略級業務,正式成立了以“電商”命名的一級業務部門,正式發布「抖音電商」品牌。同月,抖音小店官方應用程序“抖店”面世,抖店是一款集內容、營銷、技術于一體的電商平臺,為商家帶來了更多的機遇和價值,作為商家官方操作后臺,進一步完善了基礎設施。2020 年 10 月起,抖音關閉所有第三方商品外鏈,與淘寶、京東、唯品會等電商平臺進行“正面對決”。

發展期的AI

在這個期間抖音一方面發展內容推薦系統,另外一方面在物品與用戶畫像領域繼續發展傳統機器學習推薦系統。

四、「爆發期」

2021 年 1 月,抖音支付正式上線,此后成交、支付、物流均可在平臺完成,抖音電商完成生態閉環。抖音開啟電商節活動,1 月開啟抖音搶新年貨節,交易額飛速增長,較同比增長超50 倍。3 月開啟抖音女王節。

抖音電商的 GMV 產生于兩個場,分為內容場和貨架場。

內容場主要以短視頻、直播和圖文為核心,集聚平臺大部分流量,通過“貨找人”的形式促成交易;

而貨架場包括搜索、商城、店鋪、達人櫥窗等消費場景,以“人找貨”為交易路徑。

抖音電商成為中國四大電商平臺之一,隨著抖音一系列產品、運營和商家的策略的落地,抖音電商形成內容+貨架的雙驅動平臺,憑借價格和供應鏈優勢,讓用戶可以在逛的同時,又能夠有更好的購物體驗,更極致的價格。隨著抖音電商規模的增大,對于商家來說選擇性可以更多,對于用戶來說也是好事。

爆發期的AI

推薦的本質是一個CTR預估問題。

如果是(用戶)user的推薦,則是預估目標用戶是否會和推薦的用戶user產生某種聯系,比如說關注,成為朋友等。

如果是短視頻內容或者物品內容item的推薦,則是預估目標用戶是否會點擊item,然后產生后期的一些操作,比如消費等召回,多路召回,滿足目標用戶的方方面面的需求。

既需要滿足目標用戶近期的興趣(新的興趣),又需要滿足用戶的一些歷史行為偏好,還需要根據u2u2i來擴展用戶的興趣點。

排序階段,這個階段需要模型。

這個模型就是針對每個召回的item進行ctr預估的一個概率。排序模型的輸入包括2大部分,分別是user的特征(用戶畫像)和item的標簽(標簽體系)排序模型的輸出是一個概率,及用戶點擊這個短視頻的概率(我們推薦的是用戶點擊概率大的短視頻)最后按照概率進行倒排,最后輸出一部分概率較大的短視頻。

傳統常用的排序模型有:

GBDT+LR:通過GBDT得到組合特征,然后放在LR模型中進行概率的預測,GBDT是一棵決策樹,從根節點到每一個葉子節點,都是一條路經,每一條路經都是一個組合特征。

然后把這些組合特征放在LR邏輯回歸模型中進行訓練,最后會給出一個概率。

wide&&deep:是LR和DNN的結合

FM:因子分解機deepFM

如下圖:

現在常用的召回策略是多路召回

在多路召回中,無論是實時召回、基于內容召回、用戶畫像和短視頻內容標簽召回,亦或基于Queery召回,

在這個階段常采用DNN的辦法,對短視頻抽幀然后放到DNN的模型中去訓練,從而得到短視頻的標簽。

實現手段是DNN的最后一層是softmax,作為一個多分類的問題來處理。

將DNN在推薦系統中進行商業變現的第一人可以說他是朱文佳。

五、「AIGC時期」

2023-至今 抖音電商年GMV站上4萬億階段,「電商已進入成熟期,AIGC深度全面應用恰巧進入普及期」。

抖音集團的推薦系統再也不需要數萬人的標注團隊了。

抖音的用戶畫像小組再也不用快速從2300人增加到3500人了。

抖音的數據采集不僅可以用GAN神經網絡生成現在還可以用GAN加注意力機制引導數據生成了。

2023年年會梁汝波說字節得了大公司病,大公司該有的病字節一樣沒少,居然連大模型到2023年初字節才發現,1月30日,在2024年年度全員會上,字節跳動CEO梁汝波表示,如今的字節“該有的大公司病全有了”。

梁汝波也舉了一個例子,說公司半年度技術回顧時,發現2023年才開始討論ChatGPT,別的大模型創業公司甚至早在2018年都已經成立了。

算法即人才

然后2024年的字節與大模型像久旱逢甘霖一樣,2024年全年快速構建AI組織。

將DNN用于推薦系統商業變現的字節推薦系統tops人選朱文佳,從今日頭條推薦系統負責人,到今日頭條CEO,再到tiktok產品技術負責人,直接負責字節大模型,一開始叫語雀大模型,再叫seed大模型,然后就成了聞名遐邇的豆包大模型。

另外字節工程團隊洪定坤和產品技術負責人朱俊開始負責Flow的技術工程和產品技術,飛書的齊俊元開始負責Flow的產品。這些產品的底層模型統一調用豆包大模型的底層自然語言理解能力。

還有張楠負責的剪映、即夢AI等開始調用豆包大模型的語義理解和語義生成能力。

2024年的字節是算法年,算法主要是由人才構建,人才上自己構建1:3高密度AI大模型算法人才。

例如:挖面壁智能大模型負責人,挖阿里通義千問大模型負責人,挖零一萬物大模型負責人等等,來構建字節大模型的算法底座。

字節跳動搜尋AI人才的方式可以用狩獵式斂才。

算力即資金

六、字節跳動數據中心基建:從 0 到 100 的 AI 戰略布局

1. 資本開支與戰略決心

在互聯網科技巨頭的資本競賽中,字節跳動展現出了遠超預期的投入力度。與 BAT 三家 2024 年總計約 1000 億人民幣的資本開支相比,字節跳動僅在 2024 年就達到了 800 億人民幣。而 2025 年,其資本開支預算更是飆升至近 1600 億人民幣,彰顯了其在 AI 領域大規模布局的堅定決心。

2. 資金分配與業務布局

  1. AI 算力采購:其中約 900 億人民幣將用于 AI 算力的采購,國內計劃投入 400 億人民幣,國外(主要是東南亞地區)投入 500 億人民幣,以構建強大的 AI 計算能力基礎。
  2. IDC 基建與網絡設備招標:其余 700 億人民幣則分配給 IDC 基建以及網絡設備如光模塊、交換機的招標,國內 500 億人民幣,國外 200 億人民幣,旨在打造自主可控的大規模數據中心集群。

3. 發展歷程與戰略轉型

此前,字節跳動主要依賴外部采購算力,機房資源多來源于第三方。然而,如今公司決定全面開啟自主大規模興建 AI 數據中心的征程,從 IDC 基礎設施建設入手,積極開展大規模集群建設,并全面推進光模塊、交換機等設備的招標工作,標志著字節跳動在 AI 數據中心領域從無到有、從依賴到自主的重大戰略轉型。

4. 領導重視與未來展望

字節跳動創始人張一鳴親自掛帥,全力推動這一戰略布局,展現出對 AI 領域的 “All in” 決心,不惜重金投入,旨在打造領先同行的競爭優勢。從博通 2027 年的自研 ASIC 計劃及數量來看,字節跳動未來的 AI 數據中心規模預計將達到百萬卡級別。目前雖處于起步階段,僅采購數萬至數十萬張卡進行算力堆砌,但這一跨越性的舉措已預示著字節跳動將在 CSP 類型的產業中掀起巨大波瀾,引領行業的未來發展趨勢。

同時字節跳動也是Nvidia中國區最大的客戶,如圖:

N卡即Nvidia的系列卡,字節主要用來做預訓練,接下來數據中心的構建字節主要是用來做推理,推理的還是會有越來越多的國產GPU,例如:華為、天數智芯等提供的算力支撐。

七、字節跳動數據中心基建的進展如下:

1. 國內進展

  • 和林格爾算力中心:2024 年 11 月,和林格爾新區國土空間規劃委員會原則通過了火山引擎內蒙古和林格爾算力中心一期 A 項目規劃設計方案審查事宜,該中心作為字節跳動緊抓國家 “新基建” 發展戰略及全國一體化大數據中心協同創新體系算力樞紐建設機遇的重點項目,正穩步推進前期規劃工作.
  • 張家口數據中心:字節跳動在國內有張家口數據中心,并且還在不斷加大投入,進行相關設施建設與技術升級等,以滿足日益增長的業務需求.

2. 海外進展

  • 馬來西亞:2024 年 6 月,字節跳動計劃在馬來西亞投資 100 億林吉特(約合 21 億美元)建立一個區域人工智能中心,并追加 15 億林吉特投資用于擴建其在馬來西亞柔佛州的現有數據中心設施.
  • 泰國:據 2024 年 10 月消息,字節跳動旗下 BytePlus 正在考慮 2025 年在泰國建立一個數據中心,以提供云計算和人工智能服務.
  • 愛爾蘭:2020 年 8 月,字節跳動旗下 TikTok 計劃在愛爾蘭建設一座數據中心,投資額約 5 億美元,用于存儲歐洲用戶在該 App 上產生的數據信息,數據中心將在未來 18 到 24 個月內投入運營,創造數百個新崗位.
  • 美國弗吉尼亞:字節跳動在美國弗吉尼亞建有數據中心,為其在北美地區的業務提供數據存儲和處理支持.
  • 新加坡:字節跳動在新加坡也設有數據中心,并且部分數據有在新加坡備份,保障數據的安全性和業務的穩定運行

八、數據即產品

1. 大模型

字節有豆包大模型,Flow大模型,seed大模型等等,目前看字節基座大模型有被豆包大模型兼并的可能性。

  • 豆包通用模型 pro:字節跳動自研 LLM 模型專業版,支持 128k 長文本,全系列可精調,具備更強的理解、生成、邏輯等綜合能力,適配問答、總結、創作、分類等豐富場景;
  • 豆包通用模型 lite:字節跳動自研 LLM 模型輕量版,對比專業版提供更低 token 成本、更低延遲,為企業提供靈活經濟的模型選擇;
  • 豆包·角色扮演模型:個性化的角色創作能力,更強的上下文感知和劇情推動能力,滿足靈活的角色扮演需求;
  • 豆包·語音合成模型:提供自然生動的語音合成能力,善于表達多種情緒,演繹多種場景;
  • 豆包·聲音復刻模型:5 秒即可實現聲音 1:1 克隆,對音色相似度和自然度進行高度還原,支持聲音的跨語種遷移;
  • 豆包·語音識別模型:更高的準確率及靈敏度,更低的語音識別延遲,支持多語種的正確識別;
  • 豆包·文生圖模型:更精準的文字理解能力,圖文匹配更準確,畫面效果更優美,擅長對中國文化元素的創作;
  • 豆包·Function call 模型:提供更加準確的功能識別和參數抽取能力,適合復雜工具調用的場景;
  • 豆包·向量化模型:聚焦向量檢索的使用場景,為 LLM 知識庫提供核心理解能力,支持多語言。

對9款豆包大模型家族,字節不強調參數、不強調數據和語料,直接把模型能力在場景里做了垂直細分,這個決策因素是有應用和沒有應用的區別,更本質的是有數據和沒數據的區別。

有用戶反饋、有數據反饋,字節能夠根據用戶和數據的反饋去做更精準的場景和服務。

字節在 AI 大模型上,是數據邏輯,根據不同的數據鏈反饋,決定產品或者模型的下一步動作。

2. 字節跳動大模型產品

大模型承載著這家「App 工廠」的大模型產品思路,字節內部 50 多個業務已經大量使用豆包大模型進行 AI 創新,包括抖音、番茄小說、飛書、巨量引擎等,用以提升效率和優化產品體驗。

另外字節跳動也基于豆包大模型打造了一系列 AI 原生應用,包括 AI 對話助手「豆包」、AI 應用開發平臺「扣子」、互動娛樂應用「貓箱」,以及星繪、即夢等 AI 創作工具。

AI大模型的APP工廠依然是在做數據,AI原生的扣子、豆包、即夢、星繪都在做數據。

相反,如果只做基礎模型,不做服務升級,場景反饋、用戶數據反饋會越來越少,模型能力的差別就會拉開。

【布局】

在抖音短視頻的浪潮中,字節跳動曾乘風破浪,盡享流量紅利帶來的無限榮華。然而,時代的車輪滾滾向前,AIGC 大模型的浪潮洶涌而至,字節跳動深知,曾經的輝煌如過眼云煙,若不能在這新的浪潮中再次崛起,往昔的榮耀將轉瞬即逝。

如今,字節跳動懷揣著對未來的篤定與渴望,決心在 AIGC 領域復刻抖音的傳奇。就如同嘉里中心香格里拉酒店近期的景象一般,以往晚上十點半仍有半數蛋糕剩余,而如今,因那棵如 AIGC 大模型般閃耀的圣誕樹所營造的圣誕集市氛圍,蛋糕一日三茬皆被搶購一空,三樓餐廳從下午兩點營業至晚上十點,預約需提前一周,一樓卡座亦一席難求。這圣誕樹象征著 AIGC 大模型賦予字節跳動的新機遇與無限可能,它是字節跳動續寫輝煌、永葆榮耀的關鍵所在,是開啟下一個流量盛世與商業傳奇的魔法鑰匙。

專欄作家

連詩路AI產品,公眾號:AI產品有思路。人人都是產品經理專欄作家,《產品進化論:AI+時代產品經理的思維方法》一書作者,前阿里產品專家,希望與創業者多多交流。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pixabay,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!