AI會(huì)改變視頻行業(yè)的生態(tài)位格局嗎?
在數(shù)字技術(shù)的浪潮中,AI正以其獨(dú)特的魔力重塑著視頻行業(yè)的生態(tài)位。從OpenAI的Sora到中國的"ChatGPT視頻",AI視頻生成工具的涌現(xiàn),不僅點(diǎn)燃了創(chuàng)新的火花,也引發(fā)了行業(yè)對(duì)未來的無限遐想。正如傳媒1號(hào)所探討的,這些技術(shù)是否將成為視頻制作的超級(jí)導(dǎo)演,改變內(nèi)容創(chuàng)作的游戲規(guī)則?讓我們一同探索AI如何在視頻行業(yè)中掀起革命性的波瀾。
今年2月,OpenAI推出的人工智能文生視頻大模型Sora橫空出世,它不僅能夠根據(jù)文字指令創(chuàng)造出既逼真又充滿想象力的場景,還可以生成一鏡到底且長達(dá)1分鐘的視頻。然而,在一舉點(diǎn)燃AI視頻賽道后,Sora卻高開低走,遲遲沒有上線,變成了遙不可及的「期貨」。
在Sora靜默的半年多里,大洋彼岸的中國AI創(chuàng)企和互聯(lián)網(wǎng)巨頭紛紛入場,推出多款「中國造Sora」。
視頻ChatGPT時(shí)代來了。
一、視頻ChatGPT時(shí)代
在剛剛過去的夏天,愛詩科技、生數(shù)科技、智象未來、Morph Studio、智譜AI、Minimax等AI創(chuàng)企都推出了公眾可用的AI視頻生成工具。
7月24日,愛詩科技全球同步發(fā)布了「 PixVerse V2 」。相較于V1,升級(jí)版引入了自研的時(shí)空注意力機(jī)制,增強(qiáng)了空間和時(shí)間感知能力,使得視頻生成更長、更一致、更有趣。
7月26日,智譜發(fā)布「清影」,8月6日宣布背后的模型CogVideoX-2B開源。
7月30日,生數(shù)科技發(fā)布「VIDU」,初步打入動(dòng)漫影視圈。
……
除了AI創(chuàng)企,互聯(lián)網(wǎng)大廠阿里、字節(jié)、快手、騰訊、昆侖萬維、美圖等也都入場「攪局」。
字節(jié)跳動(dòng)旗下剪映于5月推出的AI創(chuàng)作平臺(tái)「即夢」,已擁有文生圖、文生視頻、圖生視頻等功能。9月24日,字節(jié)又發(fā)布了兩款視頻生成大模型——豆包視頻生成-PixelDance和豆包視頻生成-Seaweed。接入豆包模型技術(shù)的即夢AI將會(huì)進(jìn)一步加速視頻生成的落地與規(guī)?;瘧?yīng)用。
快手于7月推出的「可靈AI」后來者居上,在全球現(xiàn)象級(jí)爆紅??伸`海外版的訪問量,從零開始,持續(xù)保持3個(gè)月的增長,8月環(huán)比增長591.54%,9 月成為出??偘?Top1,月訪問量達(dá) 1765 萬,在全球AI視頻生成賽道排名僅次于Luma AI。
相較于其他模型只能生成幾秒至十幾秒的視頻,可靈生成的最長視頻可達(dá)3分鐘。另外,在技術(shù)路線、訓(xùn)練數(shù)據(jù)質(zhì)量等方面,可靈也有出色的表現(xiàn),它還能真實(shí)還原物理運(yùn)動(dòng)規(guī)律,是最接近Sora的國內(nèi)視頻生成大模型。
數(shù)據(jù)來源:東吳證券研報(bào)
視頻時(shí)長逐漸增加、分辨率和幀率不斷提升、對(duì)復(fù)雜指令的理解和遵循更加到位、多個(gè)主體間的交互能力增強(qiáng)、鏡頭語言的切換愈加平滑……國內(nèi)AI視頻大模型正加速迭代成長,不僅能支持更加豐富的風(fēng)格和題材類型,譬如黑白、3D 動(dòng)畫、2D 動(dòng)畫、國畫等,而且適配于越來越多不同終端的畫幅比例,包括電影、手機(jī)豎屏等。
AI視頻大模型似乎分分鐘化身超級(jí)導(dǎo)演,它會(huì)重塑視頻制作行業(yè)嗎?支持其發(fā)展的背后動(dòng)力是什么?
算力,是大模型發(fā)展的一個(gè)驅(qū)動(dòng)性因素。
視頻數(shù)據(jù)量的龐大,意味著需要更多的算力來處理。Sora的訓(xùn)練算力需求是 GPT-4 的 4.5 倍,推理算力需求則接近 400 倍。
視頻編解碼技術(shù)同樣也是硬件層面的核心技術(shù)。
視頻編碼的目的是將視頻數(shù)據(jù)壓縮成更小的文件,便于存儲(chǔ)和傳輸;而解碼則是將壓縮的視頻還原成可以播放的格式。這兩者的效率直接影響視頻的質(zhì)量、存儲(chǔ)空間的需求、網(wǎng)絡(luò)傳輸?shù)乃俣纫约霸O(shè)備播放視頻的流暢度。
字節(jié)跳動(dòng)旗下的火山引擎去年就推出了自研的視頻轉(zhuǎn)碼專用芯片,一臺(tái)視頻編解碼芯片服務(wù)器的轉(zhuǎn)碼能力,相當(dāng)于百臺(tái)CPU服務(wù)器的算力。在同等視頻壓縮效率下,它的成本可以節(jié)省 95% 以上。智譜也自研了三維變分自編碼器結(jié)構(gòu),將原視頻空間壓縮至2%大小,大福降低訓(xùn)練成本和難度,并開發(fā)了負(fù)面標(biāo)簽來識(shí)別和排除低質(zhì)量視頻。
如果說這些硬件技術(shù)為模型提供「體力」,那么數(shù)據(jù)、用戶和場景則決定了大模型的「智力」和「財(cái)力」。
數(shù)據(jù)是訓(xùn)練視頻大模型的基礎(chǔ)。
抖音、快手作為全國最大的短視頻平臺(tái),具有大量的用戶、持續(xù)更新的短視頻數(shù)據(jù),以及多年以來積累的視頻標(biāo)簽和分發(fā)技術(shù),這些是其他公司難以企及的。
用戶數(shù)決定了模型和產(chǎn)品迭代的速度。
短視頻是單用戶使用時(shí)長最高的娛樂模式,承載了最大數(shù)量的用戶體量。2024年 6 月短視頻 MAU 達(dá) 10 億人,單用戶每月平均使用時(shí)長達(dá) 61 小時(shí),大幅領(lǐng)先于在線視頻、手游、在線音樂、在線閱讀。短視頻行業(yè)占據(jù)了行業(yè)超九成的流量。
場景決定了盈利能力和商業(yè)模式的持續(xù)性。內(nèi)容行業(yè)具有供給驅(qū)動(dòng)需求的特點(diǎn),好用的內(nèi)容創(chuàng)作工具將先吸引創(chuàng)作者、再吸引用戶。創(chuàng)作者天然地流向更低門檻、更好用、更便捷的創(chuàng)作平臺(tái),而內(nèi)容消費(fèi)者則天然地流向更有趣、更豐富的內(nèi)容供給平臺(tái)。因此,抖音和快手作為「中介」,首先吸引了創(chuàng)作者,從而吸引了更多消費(fèi)者。
字節(jié)和快手原本就有運(yùn)營多年的剪輯工具,分別為「剪映」和「快影」。通過引入AI 功能,吸引更多用戶創(chuàng)作,提升用戶使用時(shí)長。根據(jù) QuestMobile 數(shù)據(jù),2024 年剪映、快影的月人均使用時(shí)長分別為 50.2 分鐘和 45.2 分鐘,分別同比增長了 7.1%和 15.3%。更多的用戶時(shí)長意味著率先開啟商業(yè)化變現(xiàn),更早啟動(dòng)商業(yè)飛輪運(yùn)轉(zhuǎn)。
二、AI視頻的商業(yè)化
對(duì)于 AI 產(chǎn)品,商業(yè)化至關(guān)重要。在多數(shù)互聯(lián)網(wǎng)產(chǎn)品的成本構(gòu)成中,相當(dāng)大的一部分為包含云服務(wù)在內(nèi)的相對(duì)固定的運(yùn)營成本,而這部分成本會(huì)隨著用戶規(guī)模的擴(kuò)大逐漸攤薄。然而,AIGC 產(chǎn)品則不同,用戶每進(jìn)行一次交互,比如與 ChatGPT 對(duì)話或者用 Firefly 生成圖片,都會(huì)在云端運(yùn)算一次,從而產(chǎn)生相應(yīng)的成本。用戶使用得越頻繁,成本就越高。
「在 AIGC 時(shí)代,如果不能第一天就向用戶收費(fèi),就可能永遠(yuǎn)收不到用戶的錢?!?/p>
回顧人工智能的發(fā)展史,從20世紀(jì)50年代人工智能技術(shù)誕生至今,先后四次引發(fā)大規(guī)模的關(guān)注,分別是專家系統(tǒng)時(shí)代、機(jī)器學(xué)習(xí)時(shí)代、深度學(xué)習(xí)時(shí)代和大模型時(shí)代。前三個(gè)時(shí)代,由于數(shù)據(jù)、算力、場景落地和投資回報(bào)等方面的原因,沒能形成AI產(chǎn)業(yè)的商業(yè)閉環(huán)。而基于通用性、涌現(xiàn)性、強(qiáng)算力的特征,大模型時(shí)代最有望形成商業(yè)閉環(huán)。
以短劇為代表的短視頻,就是AI 率先實(shí)現(xiàn)商業(yè)化的切入口。
一方面, AI 短劇有助于開辟新題材路徑搶占內(nèi)容競賽優(yōu)勢,助力短劇生產(chǎn)降本增效、縮短創(chuàng)作周期、提高資金利用率。另一方面,短劇的單集時(shí)間短、制作周期短、市場需求大、創(chuàng)作類型相對(duì)固定,更有利于對(duì) AI 大模型和應(yīng)用進(jìn)行快速驗(yàn)證,來自創(chuàng)作團(tuán)隊(duì)的反饋有助于大模型技術(shù)優(yōu)化。
在傳統(tǒng)影視領(lǐng)域,奇幻和科幻類型因特效成本高昂、制作周期漫長而發(fā)展受限,而這正是 AI 視頻生成技術(shù)所擅長的領(lǐng)域。
今年7月,抖音和快手分別推出《三星堆:未來啟示錄》、《山海奇鏡之劈波斬浪》兩部AI生成短劇,都是科幻題材。在平臺(tái)的帶動(dòng)下,兩部短劇播放量迅速破億,還吸引了不少創(chuàng)作者開始嘗試AI視頻生成。這代表著當(dāng)前生成式 AI 技術(shù)所能呈現(xiàn)的最佳影視效果,也反映了 AI 短劇的商業(yè)化潛力。華策影視表示,今年 9-10 月將推出兩部 AI 創(chuàng)作的微短劇。海外也有了 AI 微短劇商業(yè)化的案例,例如 Beelble AI 和DreamFlare AI。
目前 AI 已經(jīng)能實(shí)現(xiàn)短時(shí)間的動(dòng)畫制作(生成動(dòng)畫短片和微短劇、自動(dòng)化角色和場景設(shè)計(jì)),AI 虛擬拍攝(創(chuàng)造虛擬背景和環(huán)境,可以節(jié)省外景成本、縮短拍攝周期)、AI換臉、AI 生成虛擬人物、AI 視頻搜索等。
AI視頻生成技術(shù)的普及有望推動(dòng)從「拍攝視頻」逐步轉(zhuǎn)變?yōu)椤概臄z+AI 生成」并行模式。傳統(tǒng)模式下,影視行業(yè)拍攝制作成本高昂,導(dǎo)致產(chǎn)能受限、存貨周轉(zhuǎn)率低、前期投入風(fēng)險(xiǎn)高昂。AI技術(shù)的引入可以顯著降低制作成本、提高制作效率、提升影視內(nèi)容產(chǎn)出、提高存貨周轉(zhuǎn)率,并讓影視投資風(fēng)險(xiǎn)更加可控。以削減人員成本為例,傳統(tǒng)影視制作行業(yè)通常牽涉規(guī)模龐大的人員團(tuán)隊(duì),例如一個(gè)劇組可能多達(dá)上百人,倘若采用 AIGC 技術(shù),從前期劇本創(chuàng)作到后期的剪輯,人員數(shù)量能夠縮減超 2/3。
據(jù)東吳證券研報(bào),在人機(jī)共創(chuàng)模式下,AI可降低影視制作成本約 43%;在全 AI 模式,AI可降低影視制作成本約95%以上。中國 AI 視頻生成的行業(yè)潛在空間為 947~5858 億元,其中 C端、B端市場空間分別為 2673 億元、505 億元。
隨著生成式 AI 的發(fā)展,創(chuàng)建高質(zhì)量的視頻變得更加簡單,普通人在社交媒體上輸出高質(zhì)量的視頻內(nèi)容成為可能。這會(huì)帶來新的商業(yè)機(jī)會(huì)和應(yīng)用場景。
人類天然具有表達(dá)的欲望。網(wǎng)文創(chuàng)作平臺(tái)讓更多人成為兼職作家,擁有出書和改編的機(jī)會(huì)。而正如火山引擎總裁譚待所說,「視頻正迅速崛起為人類的第二語言,其豐富的表達(dá)手段和效果遠(yuǎn)超傳統(tǒng)文字,為我們提供了更多元、更生動(dòng)的交流方式?!?/p>
過去幾十年,內(nèi)容行業(yè)的大趨勢是,內(nèi)容創(chuàng)作門檻逐步降低,內(nèi)容創(chuàng)作者數(shù)量逐步增加,內(nèi)容生產(chǎn)機(jī)制從 PGC 轉(zhuǎn)變?yōu)?PGC+UGC 共存?;仡櫧?20 年的互聯(lián)網(wǎng)發(fā)展歷程,在視頻創(chuàng)作生態(tài)的初期,以 PR、FC、達(dá)芬奇為代表的傳統(tǒng)工具延續(xù)其專業(yè)屬性,一直服務(wù)于小眾人群。在視頻生態(tài)興起時(shí),以會(huì)聲會(huì)影等工具為代表的國產(chǎn)桌面工具開啟了平民化時(shí)代。直到以剪映為主要代表的新興互聯(lián)網(wǎng)工具出現(xiàn),才真正開啟了視頻的個(gè)人化表達(dá),并徹底引爆創(chuàng)作生態(tài)。視頻創(chuàng)作工具是視頻內(nèi)容生態(tài)發(fā)展的關(guān)鍵驅(qū)動(dòng)力。
短視頻平臺(tái)為普通人創(chuàng)造了表達(dá)的機(jī)會(huì),讓普通人的生活也能「被看見」。而AI 視頻技術(shù)的普及,將更大程度地賦能普通用戶。這個(gè)時(shí)代不再是傳統(tǒng)意義上的用戶被動(dòng)接受視頻內(nèi)容,而是通過智能化和個(gè)性化的手段,讓用戶能夠更主動(dòng)地參與、創(chuàng)造和定制實(shí)時(shí)、沉浸的視頻體驗(yàn)。讓更多內(nèi)容消費(fèi)者轉(zhuǎn)變?yōu)閮?nèi)容創(chuàng)作者,釋放創(chuàng)意和靈感的價(jià)值。
1號(hào)結(jié)語
字節(jié)和快手都將 AI 視頻放在未來發(fā)展的戰(zhàn)略定位??焓挚伸`一個(gè)月完成三次模型升級(jí),上演「狂飆式進(jìn)化」。為了尋求AI 輔助創(chuàng)作的突破,剪映也已成為字節(jié)的P0 級(jí)項(xiàng)目。
抖、快之所以高度重視剪輯軟件,不僅是為了創(chuàng)收,更多的考慮是爭奪用戶流量。
在移動(dòng)互聯(lián)網(wǎng)流量增長接近天花板的背景下,AIGC 成為存量流量競爭的焦點(diǎn)。AI視頻技術(shù)的普及,將讓用戶從內(nèi)容消費(fèi)者轉(zhuǎn)變?yōu)閮?nèi)容生產(chǎn)者,內(nèi)容供給的爆發(fā)意味著用戶注意力將成為更加昂貴和稀缺的資產(chǎn)。
或許誰能率先擁抱 AI,誰就能擁有更多、更穩(wěn)定的用戶流量。
參考文獻(xiàn)
1.《中國版Sora哪家強(qiáng)?實(shí)測8款視頻生成大模型,結(jié)果意外》
https://mp.weixin.qq.com/s/PzBtretxJpRa_NnrxZwXjQ
2.《字節(jié)視頻大模型殺死比賽!無縫鏡頭切換,運(yùn)鏡技巧拉滿,音樂創(chuàng)作和翻譯自由也實(shí)現(xiàn)了》
https://mp.weixin.qq.com/s/D02xfcTLY3HGY-HO55H3bQ
3.《從威爾?史密斯鬼畜吃面到「Her」,這些幕后技術(shù)正在推動(dòng)AI視頻時(shí)代的到來》
https://mp.weixin.qq.com/s/EOyGYRNZZyr1fLccph7Myg
4.東吳證券研報(bào):國產(chǎn)AI視頻大模型應(yīng)用落地先行,行業(yè)空間、降本幅度、競爭格局探討
本文由人人都是產(chǎn)品經(jīng)理作者【茯苓】,微信公眾號(hào):【傳媒1號(hào)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!