猛攻AI,字節(jié)還有幾張牌?

1 評論 562 瀏覽 0 收藏 18 分鐘

本文介紹了字節(jié)跳動在大模型行業(yè)的新動作,包括發(fā)布全模態(tài)AI模型和探索AI硬件,以及其在視頻生成賽道和AI生態(tài)構(gòu)建中的策略和挑戰(zhàn)。

近日,大模型行業(yè)再掀“價格戰(zhàn)”,阿里云宣布旗下通義千,問的多款商業(yè)化再次大幅降價,早在今年5月,大模型行業(yè)已經(jīng)進(jìn)行了一輪降幅接近90%的價格戰(zhàn)?!鞍倌4髴?zhàn)”行至此處,大家都清楚最終能夠留下來的通用大模型或不超過5個。

對于字節(jié)跳動(以下簡稱“字節(jié)”)這一“新晉”互聯(lián)網(wǎng)大廠而言,其在大模型領(lǐng)域的布局并不算早,其他大廠的大模型紛紛面世,字節(jié)的AI智能助手“豆包”才姍姍來遲,但憑著“大力出奇跡”的拼勁,“豆包”已經(jīng)成為了國內(nèi)用戶最多的原生 AI 應(yīng)用。

近日,字節(jié)再帶來了兩大新動作,一則,其在近日的AI創(chuàng)新巡展中一口氣發(fā)布了視頻生成模型、音樂模型和同聲傳譯模型,全面覆蓋語言、語音、圖像、視頻等全模態(tài);另外,字節(jié)正在探索自己開發(fā) AI 硬件,首款產(chǎn)品或是智能耳機(jī)。

從大模型B端的價格戰(zhàn),到大模型C端的應(yīng)用創(chuàng)新,再到大模型生態(tài)的流量戰(zhàn),字節(jié)在大模型行業(yè)不曾錯過任何一個“可能”,在大模型卷向下半場之際,字節(jié)手里還有哪些“好牌”?

01 視頻生成賽道,字節(jié)后發(fā)而至

今年6月,快手自研的視頻生成大模型“可靈”正式上線;8月,字節(jié)旗下文生視頻應(yīng)用“即夢”也后發(fā)而至。

9 月,字節(jié)旗下火山引擎更一舉發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed 兩款大模型,這兩款模型目前已在即夢 AI 內(nèi)測版小范圍測試。

不過,從目前的輿論偏向來看,“即夢”生成的內(nèi)容在某些特定的底圖和描述詞之下表現(xiàn)更佳,但更多時候,“可靈”視頻中的物體動態(tài)和光影會更自然。另外,二者生成的AI視頻風(fēng)格顯然有著差別, “即夢”更擅長動畫風(fēng),而“可靈”則更影像風(fēng)。

兩種風(fēng)格孰優(yōu)孰劣目前還不好說,但造成這種差異背后,并不只是大模型的技術(shù)原因,還跟字節(jié)與快手平臺的布局有關(guān)。

一方面,快手在視頻生成模型有先發(fā)優(yōu)勢。雖然“可靈”、“即夢”都是受到了SORA的啟發(fā)而“匆忙”面世,推出時間也相差不遠(yuǎn),但兩者在集團(tuán)中的地位卻并不相同。

“可靈”源于快手于2023年10月就籌備的靜態(tài)圖片生成Gif表情包的工具,而快手董事長程一笑也將其上升為集團(tuán)戰(zhàn)略項目,并給予了最大支持。相較之下,在快手推出“可靈”時,字節(jié)還在忙著進(jìn)行大模型價格戰(zhàn),彼時其最重要的對手是阿里、騰訊、百度。

今年5月,字節(jié)率先宣布旗下豆包通用模型的輸入價格降至最低為0.0008元/千tokens,并聲稱已經(jīng)擊穿了大模型行業(yè)的最低價,隨后,阿里、百度、騰訊紛紛跟隨,帶動大模型行業(yè)卷向“價格戰(zhàn)”。

幾家大廠官宣“降價”幾乎沒有太多時間差,《市界》曾透露,率先降價后火山引擎的銷售人員便開始積極接觸客戶、推介產(chǎn)品,由此可以推測,爭奪B端市場才是字節(jié)彼時的最高級別戰(zhàn)略。

而且,彼時豆包的勢頭也很好。根據(jù)QuestMobile數(shù)據(jù),2024年6月在中國大語言模型應(yīng)用中,豆包APP月活用戶達(dá)到2,750萬,排名第一,相較之下,字節(jié)應(yīng)用層的其他AI應(yīng)用如貓箱、星繪等均存在感不高,誰是戰(zhàn)略重點也一目了然。

另一方面,兩者對視頻生成模型的布局有所不同。字節(jié)將“即夢”作為一個單獨的移動應(yīng)用,獨立于視頻編輯工具剪影之外;而快手則選擇直接將“可靈”搭載于其視頻剪輯平臺快影上,兩者使用的便捷程度有所不同,在用戶積累、生成視頻數(shù)量上自然也有差異。

據(jù)快手高級副總裁蓋坤披露,目前已有超過 260 萬人使用過快手的視頻生成大模型可靈 AI,并累計生成超 2700 萬個視頻。

而字節(jié)“即夢”目前尚未公布相關(guān)的用戶數(shù)據(jù),不過在蘋果App Store的“攝影與錄像”下載量排行榜中,“即夢”排在第33,“快影”則排在第11。從生成視頻質(zhì)量來看,根據(jù)博主闌夕的分享,在Meta的AI視頻論文里,快手的可靈在主流競品的雙盲測試對比中基本是表現(xiàn)最好的那個,甚至好過了還沒公開的Sora。

但字節(jié)看起來似乎不算太著急,“可靈”在3個月內(nèi)已經(jīng)進(jìn)行了9次迭代,而字節(jié)旗下火山引擎現(xiàn)在才帶來了兩款全新的視頻生產(chǎn)模型。

字節(jié)的“淡定”,或是因為按目前科技公司本身的算力儲備與資金實力來看,發(fā)布一個大模型的難度并沒有想象中那么高,關(guān)鍵是能否擁有高質(zhì)量數(shù)據(jù)場景,以及能否擁有足夠的差異化。

從這點來看,快手與字節(jié)同為短視頻平臺,兩者在文生視頻賽道都有著相同的視頻數(shù)據(jù)優(yōu)勢。此外,字節(jié)還具有更龐大的短視頻用戶規(guī)模以及更多待挖掘的應(yīng)用場景,因此,推動AI生態(tài)構(gòu)建與擴(kuò)容才是字節(jié)的當(dāng)務(wù)之急。

02 AI+硬件,字節(jié)布局流量通道

近日,字節(jié)的另一新動作便是探索AI硬件。據(jù)《晚點LatePost》報道,字節(jié)正在探索將大模型與硬件結(jié)合,第一款產(chǎn)品或為智能耳機(jī)。

早在今年5月,《36氪》曾報道稱字節(jié)正在加速AI硬件方向的探索,其中一條產(chǎn)品線為智能耳機(jī),在此之前,字節(jié)已經(jīng)收購了耳機(jī)品牌Oladance。

字節(jié)在硬件方面的探索已是駕輕就熟。早在2018年,字節(jié)便收購了錘子科技堅果手機(jī)團(tuán)隊和部分專利使用權(quán),并發(fā)布了堅果手機(jī)、TNT顯示器以及音箱等周邊產(chǎn)品。

不過,辦公硬件市場強(qiáng)敵環(huán)伺,于是字節(jié)從2020年開始聚焦教育硬件賽道,啟動了動“大力教育”品牌,并發(fā)布了智能學(xué)習(xí)燈、教育平板、詞典筆等多款產(chǎn)品。

只是,即便字節(jié)曾計劃以每年百億元的規(guī)模投資教育行業(yè),但盲目跟風(fēng)再加上“雙減”政策的影響,這次字節(jié)依然沒能“大力出奇跡”,目前大力教育官網(wǎng)也僅剩智能學(xué)習(xí)燈一款產(chǎn)品的身影。

2021年,字節(jié)斥資90億元收購國內(nèi)VR出貨量第一的廠商PICO,并在研發(fā)、營銷、運(yùn)營等方面投入數(shù)百億元,但字節(jié)的“硬件野望”再一次破滅,去年P(guān)ICO多次裁員,目前僅保留少部分硬件團(tuán)隊。

但即便如此,字節(jié)還是“屢敗屢戰(zhàn)”,旗下豆包大模型目前已經(jīng)與眾多硬件廠商展開合作,在5月的2024春季火山引擎 FORCE 原動力大會上,其展示了機(jī)器狗、學(xué)習(xí)機(jī)、學(xué)習(xí)機(jī)器人三款與 AI 硬件合作的產(chǎn)品。

在智能終端方面,榮耀、OPPO等均宣布與豆包大模型達(dá)成合作;在智能汽車聯(lián)盟方面,豆包大模型也先后與吉利、長城、蔚來、廣汽等多家車企達(dá)成深度合作。

事實上,“軟硬件協(xié)同”已在互聯(lián)網(wǎng)行業(yè)發(fā)展中經(jīng)歷過數(shù)次輪回,比如PC電腦、智能手機(jī)、智能穿戴、智能家居等。在萬物互聯(lián)的趨勢下,硬件是軟件落地的載體,也是用戶流量通向生態(tài)的通道,而AI硬件的發(fā)展路徑,也不過是軟件側(cè)的平移。

因此,相中AI硬件的大廠也并不只有字節(jié)。據(jù)悉,美團(tuán)正在研發(fā)一款名為“俏魚”的AI業(yè)務(wù),并和兒童穿戴設(shè)備廠商“小天才”達(dá)成合作;科大訊飛發(fā)布了三款A(yù)I耳機(jī),加碼AI辦公;百度、華為等在智能終端早有布局的大廠,也在積極構(gòu)建自己的AI硬件生態(tài)。

目前來看,各大模型廠商在AI硬件的布局還是略有雷同,教育、辦公、生活依然是AI硬件落地的主要場景。但對于大廠們來說,有了連接物理世界的入口,才能形成從內(nèi)容到流量,到應(yīng)用和硬件的閉環(huán),這也是AI生態(tài)發(fā)展的基礎(chǔ)。

只不過,這一發(fā)展路徑也并非“萬試萬靈”,字節(jié)此前多次在硬件層面折戟,意味著硬件雖然是個“筐”,但不能什么都往里裝。

一方面,硬件的發(fā)展往往有自己的節(jié)奏,更容易受到市場成熟度的挑戰(zhàn),單純通過軟件業(yè)務(wù)恐怕難以在短期內(nèi)催熟硬件產(chǎn)品。以PICO為例,AR頭顯固然有足夠噱頭,但在穿戴不便、不適的問題難以解決之前,還是很難做到大量普及。

另一方面,硬件是服務(wù)于功能的,但在當(dāng)前大模型應(yīng)用拉不開差距的前提下,即便大量補(bǔ)貼硬件,用戶也不見得愿意只為“某個軟件”付費(fèi),這也意味著大模型企業(yè)必須要把應(yīng)用打磨得足夠差異化,才能跑通AI+硬件的模式。

所以,硬件雖然是流量的載體,但也不僅只是“載體”,硬件要能夠為大模型提供更便捷的調(diào)用觸點,給用戶帶來更便捷的調(diào)用形式,這才是“軟硬融合”的契合點。

03 虎口奪食,字節(jié)也在整合生態(tài)

當(dāng)然,字節(jié)能否在AI硬件領(lǐng)域上再進(jìn)一步,目前仍有待市場測試,但可以肯定的是,字節(jié)的野心并不只在此處,目前,其也試圖與阿里、百度等大廠短兵相接,搶奪AI生態(tài)話語權(quán)。

除了進(jìn)一步提升大模型能力、打磨AI應(yīng)用,以及推出AI硬件之外,字節(jié)還推出了智能體開發(fā)平臺“扣子”以及 AI 編程助手“豆包MarsCode”。

在B端市場,火山引擎總裁譚待表示,豆包大模型已經(jīng)在其內(nèi)部的50多個業(yè)務(wù)中進(jìn)行了真實的實踐驗證,同時還在30多個行業(yè)外部企業(yè)實現(xiàn)深度共創(chuàng),自今年7月發(fā)布以來,平均每家企業(yè)客戶日均Tokens使用量呈22倍的速度增長

雖然,字節(jié)并非傳統(tǒng)的“BAT”巨頭,甚至旗下豆包大模型還比其他大廠的模型晚到了幾個月,但如今字節(jié)也在按照自己的節(jié)奏布局AI生態(tài),其也有自己的牌面。

首先,得益于字節(jié)豐富的業(yè)務(wù)場景積累,其能夠更好打磨大模型應(yīng)用。目前,字節(jié)的業(yè)務(wù)場景涵蓋了短視頻、社交媒體、在線教育、電商等眾多領(lǐng)域,這些多元化的業(yè)務(wù)場景為豆包大模型的研發(fā)和訓(xùn)練提供了海量的數(shù)據(jù)和豐富的應(yīng)用場景。

事實上,字節(jié)在大模型領(lǐng)域的打法策略也與其他大廠略有不同,其更看重C端的體驗,更傾向先打磨C端產(chǎn)品,等到模型能力具備競爭優(yōu)勢后再拓展B端市場。

這或許也跟字節(jié)在C端場景的布局有關(guān),畢竟旗下的大模型乃至AI產(chǎn)品,終究要優(yōu)先服務(wù)于旗下的抖音、今日頭條等流量型APP,但這也讓字節(jié)在多模態(tài)大模型領(lǐng)域走得更快。

其次,流量也是字節(jié)的優(yōu)勢。如果說AI生態(tài)的構(gòu)建需要創(chuàng)作者和使用者雙方流量的共同注入,那么字節(jié)的AI生態(tài)在使用場景和流量引入方面顯然也更具優(yōu)勢。

據(jù)Unique Capital報告顯示,今年7月,字節(jié)旗下CapCut和Doubao在全球人工智能應(yīng)用下載超越了OpenAI的ChatGPT,斬獲全球第一。

字節(jié)旗下抖音、今日頭條等明星產(chǎn)品已經(jīng)成為流量的重要入口,通過龐大的用戶規(guī)模和精準(zhǔn)的數(shù)據(jù)分析能力,字節(jié)也能進(jìn)一步提升大模型的使用體驗,并進(jìn)一步發(fā)展多模態(tài)大模型。

近日,字節(jié)旗下火山引擎除了發(fā)布了視頻生成模型、音樂模型、同聲傳譯模型三款新模型外,還對通用語言模型、文生圖模型、語音模型進(jìn)行了全面升級。

不過,字節(jié)充沛流量支持背后,其也要付出不少代價。有業(yè)內(nèi)人士透露,豆包大模型僅在6月上旬,就投放了超過一億元的廣告,而且在大模型的廣告戰(zhàn)中,抖音完全傾向了自家大模型,這意味著字節(jié)也在用抖音的廣告收入來換取豆包的用戶增長。

“流量”固然是字節(jié)獨有的“好牌”,但“燒錢換增長”這樣的套路卻難以持續(xù),字節(jié)在跑馬圈地后如何快速轉(zhuǎn)化并找到能落地的商業(yè)模式,將會成為字節(jié)AI生態(tài)發(fā)展的關(guān)鍵。因此,火山引起發(fā)布兩款豆包視頻生成模型時,譚待才會表示“從一落地就開始考慮商業(yè)化”。

最后,則是在“云服務(wù)”市場的加速發(fā)力。對于深入B端服務(wù)市場的企業(yè)而言,云服務(wù)無疑是互聯(lián)網(wǎng)行業(yè)最為重要的賽道之一。據(jù)Canalys預(yù)計,2026年中國的云基礎(chǔ)設(shè)施市場規(guī)模將達(dá)到850億美元,五年復(fù)合年增長率為25%。

但在B端市場,字節(jié)要面對的則是阿里云、騰訊云、華為云等主流云廠商,僅這三大云服務(wù)商所占的市場份額就已經(jīng)過半。

而且,阿里、騰訊、華為等早已經(jīng)找到各自擅長的細(xì)分市場,比如阿里的零售行業(yè);騰訊的文娛、金融行業(yè),字節(jié)想在其中占據(jù)一席之地并不容易。

所以,字節(jié)當(dāng)前“C端強(qiáng),B端弱”的現(xiàn)狀,也會成為其在AI生態(tài)中快速落子的障礙,相較于阿里、騰訊等大廠,字節(jié)很難依托現(xiàn)有業(yè)務(wù)領(lǐng)域在商用領(lǐng)域形成大模型應(yīng)用的規(guī)模效應(yīng)。

或是因為如此,字節(jié)才會在近年通過硬件拓展教育、辦公的不同垂直賽道,希望能夠找到新的突破點。

但如果字節(jié)想要繼續(xù)“大力出奇跡”,打破業(yè)界及客戶對于大廠生態(tài)的固有認(rèn)知,光成為“實用主義者”還不夠,字節(jié)還需要找到屬于自己的應(yīng)用賽道,拿出具有競爭力的優(yōu)勢,成為更專業(yè)的大模型方案解決者,方能實現(xiàn)彎道超車。

在當(dāng)下的大模型市場,無論是B端還是C端,每一條賽道都擠滿了競爭對手,“流量”這一招雖然厲害,但也不是無所不能,回歸到產(chǎn)品應(yīng)用和生態(tài)建設(shè)之上,能否讓垂直行業(yè)開發(fā)者和應(yīng)用者以更低成本、更低門檻獲得更接地氣的產(chǎn)品和服務(wù),才是關(guān)鍵。

作者:楷楷
本文由人人都是產(chǎn)品經(jīng)理作者【伯虎財經(jīng)】,微信公眾號:【伯虎財經(jīng)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. AI 快速的發(fā)展,解決了我們生活中的許多問題,字節(jié)布局流量通道必須開通

    來自遼寧 回復(fù)