字節(jié)AI為何兇猛:重啟App工廠,爭(zhēng)搶“豆包”,連模型也要賽馬
本文介紹了字節(jié)跳動(dòng)在AI領(lǐng)域的快速發(fā)展,特別是其AI對(duì)話產(chǎn)品“豆包”的推出和在應(yīng)用商店的優(yōu)異表現(xiàn),分析了字節(jié)在AI產(chǎn)品上的賽馬機(jī)制和產(chǎn)品開(kāi)發(fā)策略。
2023年8月18日,字節(jié)跳動(dòng)旗下AI對(duì)話產(chǎn)品Grace,更名為「豆包」。
在百模大戰(zhàn)一波又一波密集的“重磅發(fā)布”中,這條當(dāng)時(shí)看著毫不起眼的消息,悄然開(kāi)啟了字節(jié)大模型的多重宇宙。
從時(shí)間線來(lái)看,字節(jié)跳動(dòng)的確晚了。相比于當(dāng)時(shí)反應(yīng)迅速的百度和阿里,沒(méi)有發(fā)布基礎(chǔ)模型的字節(jié),彼時(shí)并無(wú)法靠「豆包」來(lái)說(shuō)服質(zhì)疑它的觀眾們。
據(jù)字節(jié)內(nèi)部人士透露,2023年年初,集團(tuán)內(nèi)部才剛剛開(kāi)始訓(xùn)練基礎(chǔ)模型,而后,字節(jié)跳動(dòng)明確了戰(zhàn)略方向,之后字節(jié)開(kāi)始高舉高打,內(nèi)部的組織架構(gòu)以及外部策略都開(kāi)始進(jìn)行了大變革。
11 月 27 日,也就是確認(rèn)字節(jié)將放棄游戲業(yè)務(wù)的同一天,字節(jié)跳動(dòng)傳出已成立了一個(gè)新 AI 部門 Flow。
緊接著,字節(jié)系各類AI 應(yīng)用如流水線上的產(chǎn)品一般,快速涌向市場(chǎng)。據(jù)硅星人統(tǒng)計(jì),2024年至今,字節(jié)在國(guó)內(nèi)外推出包括「豆包」在內(nèi)的20余款A(yù)pp,從集成式的聊天助手,到圖像、視頻、音樂(lè)等效率工具,加速滲透到教育、辦公助手、開(kāi)發(fā)平臺(tái)、代碼生成等行業(yè),而且,這些應(yīng)用的表現(xiàn)亮眼,一個(gè)個(gè)在AI應(yīng)用大亂斗里殺出重圍。
今年3月「豆包」的下載量和月活躍用戶開(kāi)始雙雙登頂。而據(jù)a16z發(fā)布的全球 Top 100 AI 應(yīng)用榜單顯示,字節(jié)系的Cici、Coze、Gauth、Hypic、CapCut五款產(chǎn)品名列前茅。與此同時(shí),字節(jié)依然不斷在海外推出新的產(chǎn)品進(jìn)行試點(diǎn)。
10月份,這種勢(shì)頭仍在繼續(xù),據(jù)Sensor Tower10月份最新數(shù)據(jù)免費(fèi)榜前10中,Gauth排名第六、TikTok排名第七、CapCut排名第九。
這些都是令所有AI應(yīng)用創(chuàng)業(yè)者眼饞的成績(jī)。字節(jié)AI究竟為何能如此兇猛?
01 重啟“APP工廠”
字節(jié)系A(chǔ)I產(chǎn)品全線突飛猛進(jìn)的同時(shí),許多人越來(lái)越明顯感到一絲熟悉的味道——“APP工廠”回來(lái)了。
在移動(dòng)互聯(lián)網(wǎng)時(shí)期,“App工廠”的打法是字節(jié)快速開(kāi)疆?dāng)U土的重要策略之一。公開(kāi)數(shù)據(jù)顯示,2018 年-2020 年,也就是字節(jié)增長(zhǎng)最為迅速的幾年間,它自研和收購(gòu)了大量的項(xiàng)目,其中在App Store上線的應(yīng)用就有約140個(gè),占其成立以來(lái)的七成。
期間,字節(jié)通過(guò)批量生產(chǎn),在今日頭條和抖音之后,也成功推出了剪映、懂車帝、皮皮蝦、番茄小說(shuō)、輕顏相機(jī)等爆款。
從2023年11月,APP工廠在AI時(shí)代重啟了,字節(jié)陸續(xù)密集上線了眾多APP。經(jīng)硅星人整理如下表:
值得注意的是,其中海內(nèi)外產(chǎn)品幾乎一比一對(duì)應(yīng),一部分國(guó)內(nèi)產(chǎn)品如豆包、剪映復(fù)制到國(guó)外;另一部分則是在海外高排名的產(chǎn)品復(fù)制回國(guó)內(nèi)。
在整理的過(guò)程中我們發(fā)現(xiàn),不少產(chǎn)品的名字在幾個(gè)月內(nèi)頻繁變動(dòng),比如對(duì)標(biāo)星野的AnyDoor,早期進(jìn)入國(guó)內(nèi)時(shí)名為「話爐」,在今年4月份名稱改為「貓箱」,「河馬愛(ài)學(xué)」改名為「豆包愛(ài)學(xué)」等等。
這背后是字節(jié)系產(chǎn)品對(duì)于AI產(chǎn)品命名和定位的思考。
彼時(shí)大模型產(chǎn)品的命名常常引經(jīng)據(jù)典,與文心、通義、混元、星火、天工相比,「豆包」聽(tīng)起來(lái)土味十足。“當(dāng)時(shí)準(zhǔn)備將Grace推向市場(chǎng)的時(shí)候,內(nèi)部一致認(rèn)為必須要改名,要做中國(guó)市場(chǎng),英文名限制太大。陸陸續(xù)續(xù)起了100多個(gè)名字,有一部分有硬傷直接被Pass了,剩下的做了一些田野調(diào)查,有負(fù)面關(guān)聯(lián)又淘汰了一部分,最終是朱駿拍板定了「豆包」這個(gè)名字?!?/p>
豆包團(tuán)隊(duì)的人員告訴我們:“我們私底下討論過(guò),豆包這個(gè)詞在中國(guó)的滲透率差不多80%-90%,沒(méi)有硬傷。字節(jié)內(nèi)部起名字有一整套的流程,再經(jīng)歷田野調(diào)查,這個(gè)名字有沒(méi)有什么負(fù)面關(guān)聯(lián)。”
相比于創(chuàng)業(yè)公司和其他互聯(lián)網(wǎng)大廠,字節(jié)的優(yōu)勢(shì)在于成熟的產(chǎn)品方法論,來(lái)保證產(chǎn)品的水平在60分以上,形成穩(wěn)定的產(chǎn)出。
而在場(chǎng)景的選擇上,目前根據(jù)我們整理的結(jié)果發(fā)現(xiàn),字節(jié)系產(chǎn)品其實(shí)并沒(méi)有真正在開(kāi)拓新的場(chǎng)景,它其實(shí)很少“教育市場(chǎng)”,而是更多“順應(yīng)市場(chǎng)”,在已經(jīng)被部分驗(yàn)證的場(chǎng)景下進(jìn)行產(chǎn)品的迭代和優(yōu)化。同時(shí),海外市場(chǎng)更多承擔(dān)新產(chǎn)品孵化地的角色,產(chǎn)品在國(guó)內(nèi)和國(guó)外是隔離的,通常一側(cè)上線,完成市場(chǎng)和用戶數(shù)據(jù)分析后再在另一側(cè)上線類似產(chǎn)品。
簡(jiǎn)單地說(shuō),它的策略就是復(fù)制小爆款,成為大爆款。
比如「豆包」雖然推出得晚,但上線便集齊了對(duì)話、Agent、語(yǔ)音通話等當(dāng)時(shí)分散在不同產(chǎn)品中的大模型功能,「貓箱」完全對(duì)標(biāo)「星野」、「星繪」對(duì)標(biāo)「妙鴨」、「海綿音樂(lè)」對(duì)標(biāo)「Suno」,在此基礎(chǔ)上,結(jié)合用戶體驗(yàn)對(duì)產(chǎn)品進(jìn)行迭代。
哪些產(chǎn)品要放棄,哪些產(chǎn)品又要繼續(xù)投入資源?答案依然是,數(shù)據(jù)。
字節(jié)跳動(dòng)有專門負(fù)責(zé)產(chǎn)品增長(zhǎng)的團(tuán)隊(duì)。這個(gè)團(tuán)隊(duì)構(gòu)建了一個(gè)強(qiáng)大的數(shù)據(jù)監(jiān)測(cè)系統(tǒng),他們會(huì)花大價(jià)錢去買市面上的數(shù)據(jù),盡可能監(jiān)控所有產(chǎn)品,用來(lái)指導(dǎo)研發(fā)。
基于信息差的實(shí)驗(yàn)+地毯式孵化+數(shù)據(jù)增長(zhǎng),形成了一條新的AI APP生產(chǎn)線。
02 爭(zhēng)奪“豆包”,模型也賽馬
App工廠的背后,是字節(jié)式的賽馬機(jī)制。
“Grace是2022年我們團(tuán)隊(duì)開(kāi)發(fā)的,在字節(jié)內(nèi)部使用的產(chǎn)品,員工可以用它來(lái)學(xué)習(xí)一下內(nèi)部資料?!倍拱跏紙F(tuán)隊(duì)的同學(xué)告訴硅星人:“到了2023年年初,字節(jié)內(nèi)部有好幾個(gè)團(tuán)隊(duì)還有自發(fā)組成的新團(tuán)隊(duì),都在嘗試新產(chǎn)品,但我們團(tuán)隊(duì)因?yàn)樽龅迷纾挟a(chǎn)品雛形,公司開(kāi)始計(jì)劃基于原來(lái)的框架推一個(gè)移動(dòng)端的產(chǎn)品?!?/p>
「豆包」誕生初期,賽馬并沒(méi)有那么激烈,隨著AI產(chǎn)品戰(zhàn)略逐漸明確,內(nèi)部也逐漸開(kāi)始了新一輪的賽馬。
據(jù)硅星人了解,目前字節(jié)內(nèi)部形成了多輪賽馬制:
第一階段,創(chuàng)新產(chǎn)品中心負(fù)責(zé)前期孵化、產(chǎn)品創(chuàng)意、內(nèi)部審核以及完成產(chǎn)品的前期打造,到產(chǎn)品測(cè)試上線。在這個(gè)階段幾乎不會(huì)有流量支持,靠產(chǎn)品自身的形態(tài)吸引自然用戶;
進(jìn)入第二階段的產(chǎn)品,開(kāi)始可以拿到一部分初始預(yù)算進(jìn)行外部推廣,由專門負(fù)責(zé)增長(zhǎng)的團(tuán)隊(duì)負(fù)責(zé)拉新留存,進(jìn)行產(chǎn)品排名,數(shù)據(jù)表現(xiàn)好結(jié)合內(nèi)部分析,從創(chuàng)新產(chǎn)品中心進(jìn)入到具體的產(chǎn)品組;
而第三階段,成型的產(chǎn)品開(kāi)始進(jìn)行大規(guī)模推廣,如「貓箱」、「星繪」從去年年底開(kāi)始在抖音投流以及通過(guò)KOL推廣。
早期產(chǎn)品生產(chǎn)內(nèi)部架構(gòu)
“有點(diǎn)內(nèi)部創(chuàng)業(yè)的意思吧,項(xiàng)目做好了團(tuán)隊(duì)內(nèi)部分獎(jiǎng)金,大家都希望能獲得更好的資源,但產(chǎn)品這邊的競(jìng)爭(zhēng)其實(shí)比較良性,畢竟大家并不交叉。”
不過(guò),和移動(dòng)互聯(lián)網(wǎng)時(shí)期的模式不同的是,當(dāng)時(shí)所有的產(chǎn)品都是基于個(gè)性推薦算法團(tuán)隊(duì)生長(zhǎng),而如今,在今天的AI產(chǎn)品們底下的模型層,字節(jié)其實(shí)并沒(méi)有達(dá)到統(tǒng)一。
產(chǎn)品層,豆包已經(jīng)是一個(gè)統(tǒng)一的品牌,所有產(chǎn)品向豆包靠攏。但在模型層,“豆包”更像是一個(gè)代號(hào),究竟誰(shuí)能成為“豆包”,更像是一場(chǎng)爭(zhēng)奪行動(dòng)。
舉個(gè)例子,9月24日,火山引擎一口氣發(fā)布了兩款視頻生產(chǎn)模型,但對(duì)外并沒(méi)有展示詳細(xì)解釋兩款模型的差異,我們發(fā)現(xiàn)PixelDance和Seaweed在發(fā)布前,在Github上發(fā)布過(guò)對(duì)應(yīng)的模型細(xì)節(jié),它們分別屬于兩個(gè)團(tuán)隊(duì),但最終均被冠以“豆包”之名對(duì)外發(fā)布。
從內(nèi)部結(jié)構(gòu)來(lái)看,模型和算法歸屬于模型算法團(tuán)隊(duì)Seed,由朱文佳(曾任TikTok產(chǎn)品技術(shù)負(fù)責(zé)人)負(fù)責(zé);2023年11月成立的Flow團(tuán)隊(duì)主要負(fù)責(zé)打造C端產(chǎn)品,在最新的人事調(diào)動(dòng)中顯示,朱文佳為整體業(yè)務(wù)負(fù)責(zé)人、朱駿(原Music.ly創(chuàng)始人、原TikTok負(fù)責(zé)人)為產(chǎn)品負(fù)責(zé)人、洪定坤為技術(shù)負(fù)責(zé)人,向下包括豆包、AI教育、社區(qū)、國(guó)際化四個(gè)部門,同時(shí)PC端和移動(dòng)端也分為兩條業(yè)務(wù)線;而豆包大模型to B的商業(yè)化業(yè)務(wù)主要由火山引擎對(duì)外提供,并通過(guò)API的方式接入飛書。
Seed團(tuán)隊(duì)由原來(lái)的搜索團(tuán)隊(duì)、AILab團(tuán)隊(duì)、AML團(tuán)隊(duì)聯(lián)合而成,但實(shí)際上,這幾個(gè)團(tuán)隊(duì)都在暗自較勁。
“現(xiàn)在的豆包更像是一個(gè)統(tǒng)一的出口,連接用戶。豆包產(chǎn)品后端連接了多個(gè)模型測(cè)試,是一個(gè)訓(xùn)練場(chǎng),通過(guò)API的結(jié)果反饋來(lái)評(píng)測(cè)模型效果,但一時(shí)間很難有取舍。”上述內(nèi)部人士講道。
在GitHub和HuggingFace上面,字節(jié)的各類視頻和圖像模型,都分屬于各個(gè)小團(tuán)隊(duì),包含有4款不同功能的視頻模型。
根據(jù)公開(kāi)資料和介紹,我們整理了各個(gè)模型的功能,發(fā)現(xiàn)目前主流視頻模型的能力散落在了各個(gè)模型里,比如視頻編輯、運(yùn)動(dòng)筆刷、端到端視頻生成等等,也有在Github上評(píng)分較高的開(kāi)源模型,顯示測(cè)試效果比已在國(guó)內(nèi)發(fā)布的PixelsDance要更好。
比如MagicVideo的V2版本是目前開(kāi)發(fā)者評(píng)價(jià)字節(jié)旗下最可用的一款文生視頻模型,V2版本采用了模塊化式生產(chǎn)流程,第一模塊從文本到圖像、第二模塊從圖像到視頻生產(chǎn)關(guān)鍵幀、第三模塊從視頻到視頻擴(kuò)展、第四模塊視頻幀插值,平滑過(guò)渡。目前整體的生成效果、色彩和審美高于Pika1.0和Gen2.0。
有算法工程師就分析道:“如果幾個(gè)模型的能力加起來(lái),其實(shí)會(huì)比現(xiàn)在公開(kāi)發(fā)布的版本更好,至少能達(dá)到可靈的效果,但是現(xiàn)在發(fā)布版本比較一般,可能也是內(nèi)部賽馬資源沒(méi)有談妥的結(jié)果?!?/p>
字節(jié)AI產(chǎn)品今天的突飛猛進(jìn),是其賽馬機(jī)制下,一套屢試不爽的產(chǎn)品開(kāi)發(fā)方法論加持的結(jié)果。但與移動(dòng)互聯(lián)網(wǎng)時(shí)代字節(jié)的“生產(chǎn)體系”很不同的是,今天在底層的模型側(cè),字節(jié)也在進(jìn)行著賽馬。
字節(jié)可能寄希望于它也像應(yīng)用一樣,百花齊放后篩選出最強(qiáng)的那一個(gè),但同時(shí)它也客觀上帶來(lái)著資源無(wú)法集中的問(wèn)題。尤其是在一個(gè)最需要大力出奇跡的時(shí)刻,這可能也會(huì)帶來(lái)新的挑戰(zhàn)。
作者:Yoky
本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號(hào):【硅星人Pro】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!