AI視頻新戰(zhàn)場(chǎng):字節(jié)對(duì)決快手、反擊Sora

0 評(píng)論 149 瀏覽 0 收藏 14 分鐘

字節(jié)跳動(dòng)以性價(jià)比策略切入市場(chǎng),掀起價(jià)格競(jìng)爭(zhēng),但高性能模型仍保持付費(fèi)門檻。B端市場(chǎng)對(duì)豆包視頻大模型的接納度有待觀察,其商業(yè)變現(xiàn)與用戶場(chǎng)景適配性成為主要考驗(yàn)。

一場(chǎng)由Sora引發(fā)的AI視頻生成競(jìng)賽,如今迎來新的競(jìng)爭(zhēng)者!

9月24日,2024火山引擎AI創(chuàng)新巡展深圳站上,字節(jié)跳動(dòng)的兩款A(yù)I視頻模型—豆包視頻生成-PixelDance、豆包視頻生成-Seaweed發(fā)布,并面向企業(yè)市場(chǎng)開啟邀測(cè)。

距離Sora已經(jīng)橫空出世已經(jīng)超過7個(gè)月,這段時(shí)間國(guó)產(chǎn)視頻大模型的發(fā)布此起彼伏,圍剿Sora在商業(yè)語境中似乎成為參與玩家的共有使命。

字節(jié)在七個(gè)月之后,才選擇正式蹚入這條沸騰之河,而此時(shí)在其面前,不止有Sora,一眾國(guó)產(chǎn)大模型弄潮兒,還有一個(gè)抖音眼熟的名字—快手。

老對(duì)手,新領(lǐng)域,可靈AI的影響力正在被加速釋放,在這一點(diǎn)上,字節(jié)如坐針氈,畢竟強(qiáng)如Sora,仍是外敵,而快手AI,早已殺到城下。

追逐使命還是修筑護(hù)城河,囊外還是安內(nèi),答案藏在視頻大模型里—字節(jié)不做選擇題。

Part.1 字節(jié)殺入,Sora遭遇圍堵

無論戰(zhàn)局多么復(fù)雜,源頭都能追溯到Sora。

2024年2月,OpenAI公布的Sora AI視頻生成模型成為全世界的焦點(diǎn),憑借提供提示詞描述或者靜態(tài)圖片,Sora就能生成超高畫質(zhì)、質(zhì)感直逼電影的畫面,最高能達(dá)到1分鐘視頻的體量,直接震撼了國(guó)產(chǎn)大模型行業(yè)。

隨后,國(guó)產(chǎn)廠商集體發(fā)力視頻大模型,才有圍堵Sora的大趨勢(shì)?!渡墒紸I商業(yè)落地白皮書》顯示,當(dāng)前有53%的中國(guó)企業(yè)已開始有組織地進(jìn)行生成式AI布局。

這意味著,很多中國(guó)企業(yè)已意識(shí)到生成式AI技術(shù)對(duì)于自身發(fā)展的重要性,并將在其中投入資源和精力。

而自今年5月起,國(guó)內(nèi)達(dá)到類Sora級(jí)別的 AI 視頻模型技術(shù)陸續(xù)公布,生數(shù)、智象未來(HiDream.ai)等腰部企業(yè)輪番登場(chǎng),智譜AI推出視頻生成模型“清影”、愛詩科技發(fā)布視頻生成產(chǎn)品PixVerse V2、生數(shù)科技上線視頻生成模型Vidu扎堆七月亮相,整個(gè)賽道熱鬧非凡。

但一眾視頻大模型追趕Sora的過程,有一家的產(chǎn)品可謂一鳴驚人,它就是6月6日開啟邀測(cè)的快手可靈 AI 視頻生成模型。

快手可靈剛一推出,就憑借參數(shù)博得了市場(chǎng)的關(guān)注:視頻分辨率高達(dá)1080p,時(shí)長(zhǎng)最高可達(dá)2分鐘(幀率30fps),單次文生視頻時(shí)長(zhǎng)已增至10秒,指標(biāo)全部位于業(yè)績(jī)前列。

工具從來都是輔助,而快手可靈俘獲用戶的速度之快,讓人始料不及。在快手光合創(chuàng)作者大會(huì)上,官方透露的數(shù)據(jù)為:超過 160 萬人使用過快手的視頻生成大模型可靈AI,累計(jì)生成超 1600 萬條視頻。

口碑、熱度、性能俱佳,可靈AI成為目前國(guó)內(nèi)排名最高的視頻生成類AI應(yīng)用,自然是水到渠成。

對(duì)手收獲掌聲,字節(jié)五味雜陳。實(shí)際上,字節(jié)在AI大模型的布局比快手還早。2023年8月,該公司上線首個(gè)大語言模型“豆包”及多模態(tài)大模型BuboGPT。其抖音云雀大模型通過首批《生成式人工智能服務(wù)管理暫行辦法》備案,面向公眾開放;字節(jié)跳動(dòng)基礎(chǔ)模型發(fā)力語言和圖像兩種模態(tài)方向。而在AI應(yīng)用層,字節(jié)跳動(dòng)不僅已去年11月成立新AI部門Flow,還已推出三款A(yù)I對(duì)話類產(chǎn)品,包括豆包、扣子和Cici。

但是,需要注意的是,字節(jié)AI產(chǎn)品對(duì)平臺(tái)內(nèi)容的加持是否得到市場(chǎng)認(rèn)可,還需要進(jìn)一步驗(yàn)證,而在B站等內(nèi)容平臺(tái)中,用AI二創(chuàng)視頻已經(jīng)成為賽道,同時(shí)也降低了創(chuàng)作者門檻,為平臺(tái)擴(kuò)充內(nèi)容提供了有力支撐。

抖快之爭(zhēng)向來是短視頻賽道的焦點(diǎn),而當(dāng)對(duì)手手握超級(jí)武器后,字節(jié)自然如坐針氈,本次隆重推出的兩款視頻模型,既是與Sora一爭(zhēng)高下,更是與快手的軍備競(jìng)賽,攘外安內(nèi)的字節(jié),接下來勢(shì)必動(dòng)作頻頻。

Part.2 不拼參數(shù)拼場(chǎng)景,誰來買單?

當(dāng)前,視頻大模型最能直觀打動(dòng)人,就是參數(shù),但本次字節(jié)推出視頻大模型,卻反其道而行之,到目前為止字節(jié)仍未透露兩款產(chǎn)品可以生成的最大時(shí)間長(zhǎng)度。

如此重要的內(nèi)容沒有公布,原因可能只有一個(gè):還有其他更重要的東西需要被市場(chǎng)了解。字節(jié)相關(guān)人士在介紹本次模型的特點(diǎn)時(shí),多次強(qiáng)調(diào)其為多場(chǎng)景而生,其中三個(gè)核心功能更是頗為驚艷。

精準(zhǔn)語義理解上,豆包AI視頻生成能夠遵從復(fù)雜的用戶提示詞,形成多個(gè)主體、人、物之間的互動(dòng)畫面。

畫面展現(xiàn)上,豆包AI視頻具有逼真的動(dòng)態(tài)與絲滑的運(yùn)鏡,并具備變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語言能力,靈活控制視角,同時(shí)保持主體、風(fēng)格和氛圍的一致性。

畫質(zhì)上,大模型支持包括黑白、3D 動(dòng)畫、2D 動(dòng)畫、國(guó)畫等多種風(fēng)格,包含1:1、3:4、4:3、16:9、9:16、21:9 六個(gè)比例,適配于各種終端,以及電影、手機(jī)豎屏等不同畫幅,質(zhì)感優(yōu)秀,格調(diào)出眾。

實(shí)際上,豆包視頻大模型在多場(chǎng)景上的發(fā)力,也正是字節(jié)大模型商業(yè)化的設(shè)計(jì)構(gòu)想,電商、城市文旅、音樂 MV、微電影、短劇等應(yīng)用場(chǎng)景,都是豆包·視頻生成模型助力客戶實(shí)現(xiàn)降本提效和創(chuàng)意合規(guī)的主戰(zhàn)場(chǎng)。

可以說,豆包視頻大模型聚焦ToB業(yè)務(wù)的商業(yè)邏輯十分清晰,而下一步則是依靠?jī)r(jià)格殺出重圍。早在今年 5 月,火山引擎推出的豆包大模型把價(jià)格降至最低每千 token 低于一厘錢,比行業(yè)便宜99.3%,燃起了大模型廠商的價(jià)格戰(zhàn)。

字節(jié)視頻大模型相關(guān)人士曾透露當(dāng)下價(jià)格與市場(chǎng)份額之間的關(guān)系:價(jià)格降十分之一,量就可能漲十倍。這種量?jī)r(jià)關(guān)系下,對(duì)于先期獲得市場(chǎng)的大模型廠商來說,勢(shì)必要跟進(jìn)低價(jià)策略。

以豆包語言模型為例,據(jù)官方披露,截至 9 月,豆包語言模型的日均 tokens 使用量超過 1.3 萬億,多模態(tài)數(shù)據(jù)處理量也分別達(dá)到每天 5000 萬張圖片和 85 萬小時(shí)語音。

這就是低價(jià)的魔力,但需要注意的是,慘烈的價(jià)格戰(zhàn)中,各方拿出手的基本是偏輕量化的模型版本,壓箱底的高性能模型并沒有參與,這多少說明了大模型廠商的態(tài)度:給點(diǎn)甜頭嘗嘗,但要好的,得買單。

B端會(huì)不會(huì)為豆包視頻大模型買單,還需要觀察。但從以往大模型的落地來看,B端市場(chǎng)的需求適配用時(shí)并不會(huì)太短,而降本增效的核心訴求如何滿足,考驗(yàn)的不僅是廠商大模型的能力,更是用戶自身對(duì)業(yè)務(wù)邏輯梳理打磨的能力。換言之,大模型這份收入,很難掙。

Part.3 AI驅(qū)動(dòng),打破版權(quán)壁壘

抖音的長(zhǎng)視頻野望,可以靠AI視頻大模型內(nèi)容生成來作為支撐。

隨著流量進(jìn)入存量周期,短視頻平臺(tái)用內(nèi)容留存用戶,成了當(dāng)務(wù)之急,2018年短視頻用戶規(guī)模增長(zhǎng)率為107.0%,2020迅速降低到15.2%,而抖音DAU破6億后,出現(xiàn)了增長(zhǎng)放緩的態(tài)勢(shì)。

老對(duì)手快手的情況更為明顯,據(jù)快手2024年一季度財(cái)報(bào)顯示,快手實(shí)際月活人數(shù)為6.97億,較上一季度環(huán)比下降0.4%,呈現(xiàn)流失趨勢(shì),二季度平均月活為6.92億,再次下探。

這可能才是視頻大模型最需要解決的問題:內(nèi)容創(chuàng)作賦能,保住用戶規(guī)?;颈P。

在豆包視頻大模型發(fā)布前,《山海奇鏡之劈波斬浪》和《三星堆:未來啟示錄》就是抖音和快手在AI內(nèi)容領(lǐng)域的官方嘗試,前者屬于AI科幻短劇,后者則是AI奇幻短劇。

官方作品具有引導(dǎo)意義,但要想撬動(dòng)更多內(nèi)容創(chuàng)作者加入賽道,還需要更多行動(dòng)。

不過,AI內(nèi)容創(chuàng)作這一點(diǎn)上,抖音與快手態(tài)度趨同:鼓勵(lì),但反對(duì)低質(zhì)。今年6月,快手電商發(fā)布了使用AIGC能力直播的倡議公告,鼓勵(lì)商家/達(dá)人和老鐵們進(jìn)行良好互動(dòng),但明確了流量不會(huì)傾斜,避免低質(zhì)內(nèi)容。來到9 月 8 日,抖音則公布了關(guān)于“發(fā)布特定內(nèi)容需主動(dòng)添加標(biāo)識(shí)”的公告,鼓勵(lì)創(chuàng)作者尊重事實(shí)、發(fā)布客觀真實(shí)信息,同時(shí)對(duì)于特定信息,應(yīng)以“內(nèi)容標(biāo)識(shí)”的形式提供充分的說明,降低用戶的理解成本。

但事實(shí)上,創(chuàng)作者和用戶顯然更關(guān)注AI創(chuàng)作帶來的娛樂性,“容嬤嬤喂紫薇吃香腸”“唐僧啃雞腿、吃漢堡”“悟空掏手槍”“爾康失態(tài)”等無腦爆改短視頻風(fēng)靡全網(wǎng),以腦洞、爆笑等元素獲得了粉絲的關(guān)注,抖音上,相關(guān)話題“當(dāng)AI擴(kuò)圖卷土重來”登上熱榜,截至目前共有3.9億次播放。

對(duì)于抖音來說,這是個(gè)不錯(cuò)的開始,內(nèi)容拓展后,粉絲粘性提高、收入提升、制作成本下降,都是AI視頻大模型帶來的優(yōu)勢(shì),當(dāng)然抖音更大的期待,還包括規(guī)避版權(quán)費(fèi)風(fēng)險(xiǎn)。

兩年前,愛奇藝、優(yōu)酷、騰訊視頻等長(zhǎng)視頻平臺(tái),70多家影視機(jī)構(gòu)、數(shù)百名藝人先后兩次公開發(fā)布“聯(lián)合聲明”,呼吁短視頻平臺(tái)和公眾賬號(hào)生產(chǎn)運(yùn)營(yíng)者尊重原創(chuàng)、保護(hù)版權(quán),強(qiáng)調(diào)未經(jīng)授權(quán),不得使用影視作品侵權(quán)創(chuàng)作,這份聲明中明確指出將對(duì)侵權(quán)行為依法追責(zé)。矛頭直指抖音等短視頻巨頭。隨后,抖音與騰訊更是因《云南蟲谷》和《亮劍》等作品,互告對(duì)方侵權(quán)。

和解發(fā)生在短劇爆火后,長(zhǎng)短視頻巨頭為了進(jìn)軍新市場(chǎng)握手言和,互相借助優(yōu)勢(shì)成為新趨勢(shì)。但從長(zhǎng)遠(yuǎn)看,抖音短視頻二創(chuàng)還依賴原創(chuàng)視頻素材,風(fēng)險(xiǎn)并未化解,而隨著AIGC內(nèi)容的開啟,抖音在版權(quán)側(cè)至少可以安心落地,二創(chuàng)的素材庫也更加豐富安全,確實(shí)是抖音樂得所見。

從這個(gè)角度看,字節(jié)的視頻大模型確實(shí)任重而道遠(yuǎn)了。

參考資料:

1、《快手蓋坤:可靈AI已生成視頻超1600萬條,用戶超160萬人》,新京報(bào)

2、《抖音快手激戰(zhàn)人工智能大模型》,億邦動(dòng)力

3、《豆包進(jìn)擊,字節(jié)版Sora“雖遲但到” 火山引擎總裁譚待:一落地就開始考慮商業(yè)化》,每日經(jīng)濟(jì)新聞

4、《AI生成視頻,究竟有多癲狂?》,無限智能

作者丨蕭維 編輯丨蕨影

本文由人人都是產(chǎn)品經(jīng)理作者【科技新知】,微信公眾號(hào):【科技新知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!