字節跳動的AI野心
當前,國內的生成式AI行業還處于群雄逐鹿的混亂狀態,其中,字節跳動的系列動態展示了其在AI領域布局的“野心”。如何解讀和分析?我們不妨來看看作者的闡述。
在5月15日的火山引擎大會上,字節跳動將自研的“云雀”大模型統一改名為“豆包”大模型,并一次發布了9個大模型產品。
毫無疑問,當前的國內生成式AI行業還處于群雄逐鹿的混亂狀態,競爭格局高度不穩定,字節跳動在技術上并不屬于最領先的(就連是否屬于第一集團都還有爭議);但是,憑借自己的消費端產品開發經驗、內容數據儲備、以及管理層的重視,它已經在國內生成式AI市場占據了舉足輕重的地位。
我認為字節跳動的AI野心相當龐大:它想建立一個以消費端(C端)應用為基礎,橫跨C端和B端(企業端)的“大而全”的體系,然后以此為支點,進一步打入云計算等技術基建生態。相比之下,阿里是希望以云計算為基礎、以B端為突破口,對C端不是特別重視;百度是搖擺于B端和C端之間,兩邊好像都取得了一些成果,但兩邊都沒有做好;騰訊則尚未形成清晰統一的AI戰略,或許形成了但是沒有對外公開;至于華為的主要精力則是集中在硬件相關生態,對于AI應用層的實際投入有限。
基于從各種渠道獲得的信息,我們可以確信,字節跳動賦予了AI相當高的戰略定位,聚集了很多資源,并確定了未來一段時間的打法:
- 字節跳動在AI技術及產品方面聚集了大批精兵強將,其中包括抖音和TikTok當年的一些靈魂人物,這是它所能拿出的最強有力的陣容了。
- 字節跳動的AI業務可以說是應用驅動的,其C端應用發展非???,數量多、垂類覆蓋廣,大有當年做“移動APP工廠”的架勢。
- 豆包大模型設置了極低的價格,對于國內所有大模型創業公司而言是一個嚴峻沖擊,不過我們尚不知道這種沖擊的實際效果如何。
字節跳動大模型的負責人是朱文佳,曾任TikTok產品技術負責人。2023年11月成立的Flow(AI應用)部門負責人是朱駿,是原Music.ly創始人、原TikTok負責人;Flow移動產品負責人是陸游,曾任抖音社交負責人。不久前從抖音調任剪映的張楠(女),其重要任務也是依托AI去改造剪映產品。上述陣容不僅是字節跳動最拿得出手的精兵強將,在整個中國互聯網行業也堪稱豪華。對于其他互聯網大廠而言,派出一線大將主管AI大模型是常見的,但是在AI應用層堆積這么多大將就顯得太奢侈了。
有人會問:為什么不把這些大將用于抖音等“旗艦業務”,而要用于前途未卜的AI業務?答案很簡單:因為抖音不再需要那么多人了,對于業務領導者的素質要求也有很大改變。
上面列舉的張楠、朱駿、朱文佳、陸游等人,幾乎全是產品向人才,即所謂“打江山的人”;現在抖音大局已定,沒什么江山可以打了,要打也是作為防御一方而不是進攻一方。在用戶滲透率見頂、產品功能和技術不需要激進迭代的情況下,抖音最需要的是商業化人才,即“從打下的江山上收錢的人”。
過去一年多在抖音內部地位上升的人,例如新任本地生活業務負責人浦燕子,基本都來自張利東麾下,而張利東是整個中國互聯網行業最成功的商業化負責人之一。抖音的商業化已經非常成功了,在此基礎上若還想深挖,就要對領導團隊進行改組,使其從“產品驅動”進一步轉向“商業化驅動”。AI技術及其應用,恰恰是吸納那些從抖音退下來的“產品型人才”的最佳場所。
字節跳動的生成式AI業務從一開始就是應用驅動的。作為大模型負責人,朱文佳對朱駿雖然沒有實線匯報關系,但仍然存在虛擬匯報關系(這在字節跳動內部相當常見);在大模型統一改名“豆包”之后,Flow應用部門對AI大模型開發的影響力可能進一步加強。在其他互聯網大廠,大模型研發團隊可能具備相當高的自主性,乃至“自下而上”推動應用建設;在字節跳動,“自上而下”的邏輯則占據主導地位,應用團隊獎其需求傳導到了基礎研發團隊,由此形成高度實用的組織決策模式。
迄今為止,字節跳動已經推出了11款AI應用;其中,豆包是國內用戶最多的AI獨立應用,其MAU可能已達到2000萬量級。需要指出的是,這并不意味著豆包大模型(原名云雀大模型)的使用量是全國最大的,因為阿里的通義千問、百度的文心一言均通過網頁端和API擁有上億級別的客戶,其API調用次數也遠遠高于豆包。但是如果只比較獨立APP,豆包的用戶優勢是無可爭議的——這就是字節跳動一貫的打法,以高效率的移動應用迭代去占領新興市場。
我們不難看出,同樣是在戰略上高度重視生成式AI的大廠,字節跳動與阿里的打法完全不同。后者以阿里云為基礎,先建立一個涵蓋閉源和開源大模型、具備成熟開發環境和開發工具的完整生態,以B端客戶為主攻方向,與現有應用融合時也是優先考慮釘釘這樣的To B應用。前者則以豆包等C端APP為基礎,先建立一個廣闊的、用戶眾多的、覆蓋各種垂類的AI移動APP生態,然后再逐步擴大對B端的影響力。5月15日的火山引擎發布會,在一定程度上體現了字節跳動對目前的C端AI進展比較滿意,計劃加強對B端的進攻了。
豆包大模型最重要的特點是價格低廉:與類似水平的國產通用大模型相比,其Token價格要低95%以上。如果這個價格是真實的、不限量的,那么對于國內大模型創業公司而言,簡直是滅頂之災!請注意以下事實:
- 在現有的Token價格水平上,如果考慮到訓練成本攤薄的因素,幾乎所有國產大模型在財務上都是虧損的。
- 由于國產大模型太多,價格戰愈演愈烈,有的大模型甚至是邊際虧損的:不考慮訓練成本攤薄,只考慮推理成本,毛利率仍然是負數。
- 受到國內經濟形勢以及人力成本低廉的影響,B端客戶對大模型的價格相當敏感,即使技術水平比較優越的大模型也賣不出更高的價格。
- 雖然AI創投看起來很熱鬧,但是雷聲大雨點小,創業公司拿到的錢很少(其中很大一部分還以算力形式支付),根本沒有本錢打價格戰。
假如豆包真的打穿了大模型的“地板價”并且堅持執行下去,其他互聯網大廠肯定也會跟進,那么國產大模型創業賽道可能迎來一場浩劫。只有大廠才能在這種不計成本的消耗戰當中幸存,絕大多數創業公司難逃垮掉或被整合的命運!這就是用C端應用思維做B端產品的可怕之處,至于這套思維在長期是不是可持續,那又是另一個問題了。反正字節跳動燒得起錢,其他大廠也跟得起,只有小公司受傷的世界達成了?
至于豆包大模型的技術水平如何,倒不是一個特別重要的問題。很多人會疑惑,字節跳動生成式AI部門的人員背景相當龐雜,其中僅有極少數具備真正的AI技術背景,而且是“應用驅動”的——這是否天然不利于大模型技術開發?不過,在國內現有環境下,哪怕豆包大模型的技術水平不領先,也不影響其業務應用在短期的蓬勃發展。我們需要意識到:
- 與國內最先進的一些大模型(名字就不點了)相比,豆包的最新版本可能有10%左右的效率差距。但是對于C端用戶而言,這種差距不太明顯;對于B端用戶而言,巨大的價格優勢足以彌補這一點技術差距。
- 國內大模型創業公司在產品、商務、二次開發等層面上,普遍處于“草臺班子”階段,能夠把大模型研發做好已屬不易。無論面向C端還是B端用戶,與字節跳動等武裝到牙齒的大廠相比,它們的天然劣勢十分明顯。
- 國內部分大模型的領先,并不是OpenAI那種劃時代意義的領先,而是在小地方當老大而已。與GPT-4相比,國產大模型作為一個整體的落后幅度很大。既然如此,豆包與它們的短期技術差距也不是什么大不了的事情。
字節跳動的AI野心能否成功,取決于國內生成式AI應用的發展大勢:它最早取得突破、實現良性循環的領域,如果是B端,那么阿里無疑將取得較大優勢,百度也有機會;如果是C端,那么字節跳動的優勢將相當明顯。在前一種場景下,國內大模型創業公司或許還能通過對垂直應用的理解和定制開發能力,占據一席之地;在后一種場景下,成熟的互聯網大廠將會一手遮天,AI將不會促進行業“再平衡”,而只會加固極少數巨頭的地位。
還有一個問題,不僅對字節跳動很重要,對整個行業都很重要,那就是算力問題。我在上文刻意忽略了這個問題,因為我不知道怎么解答。所有國內互聯網大廠都儲備了一定量級的AI訓練及推理算力;具體到字節跳動,不僅自身有較大的算力儲備,還從阿里云租用了大量算力。可是如果AI應用真能取得上億級別的MAU,乃至像抖音那樣成為頭部C端應用,目前全國的算力儲備都是遠遠不夠的。許多用戶已經注意到了,一些國內AI聊天應用經常出現提問需要排隊的現象,這就是算力不足的一個體現。這種算力瓶頸是不能依靠砸錢去解決的,因為供應商已經不再收錢了。
在可見的未來,如果我們還是無法以合理的成本解決算力問題,那么生成式AI在國內的C端應用的道路將會很窄,因為推理算力可能只夠滿足少數專業化的B端客戶的需求(價格也會被推得很高)。這樣的問題顯然不是字節跳動或任何一家互聯網大廠所能解決、所應該考慮的。我希望它能得到妥善解決,盡管我完全不知道怎么解決。
作者:怪盜團團長裴培
微信公眾號:互聯網怪盜團(ID:TMTphantom),互聯網行業觀察者及研究者。
本文由人人都是產品經理合作媒體@互聯網怪盜團 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!