驚人突破!AI視頻生成技術(shù)竟成2024年YYDS,揭秘行業(yè)內(nèi)部的罕見(jiàn)挑戰(zhàn)與危機(jī)

0 評(píng)論 1034 瀏覽 0 收藏 6 分鐘

2024年,AI視頻生成技術(shù)迎來(lái)了爆炸性的發(fā)展,成為了科技圈和投資界的熱門話題。這項(xiàng)技術(shù)以其巨大的潛力和廣泛的應(yīng)用前景,吸引了無(wú)數(shù)企業(yè)和研究者的目光。然而,隨著技術(shù)的飛速發(fā)展,行業(yè)內(nèi)部的挑戰(zhàn)和危機(jī)也逐漸顯露。

在一個(gè)充滿不確定性的AI時(shí)代,我們似乎又站在了一個(gè)分叉路口前,選擇哪條路,成了擺在每個(gè)AI從業(yè)者和企業(yè)面前的難題。

AI視頻生成,這個(gè)曾經(jīng)被認(rèn)為遙不可及的技術(shù),現(xiàn)在卻成了眾多廠商競(jìng)相追逐的香餑餑。

而我,作為一個(gè)見(jiàn)證了AI技術(shù)從起步到蓬勃發(fā)展的觀察者,對(duì)這一現(xiàn)象有著自己的一些看法。

首先,讓我們回顧一下這個(gè)現(xiàn)象的背景。

自從OpenAI Sora的問(wèn)世,再到快手的可靈全量上線,視頻生成技術(shù)無(wú)疑成了2024年最火熱的AI話題。

大廠們紛紛開(kāi)始你追我趕,從4月至今,視頻生產(chǎn)模型如雨后春筍般涌現(xiàn)。

國(guó)內(nèi)的“大模型六小虎”(智譜、月之暗面、MiniMax、百川智能、階躍星辰、零一萬(wàn)物)也在這個(gè)關(guān)鍵的決策點(diǎn)上搖擺不定。

我的觀點(diǎn)是,視頻生成技術(shù)之所以能引起如此大的關(guān)注,一方面是因?yàn)槠浼夹g(shù)潛力巨大,另一方面則是因?yàn)槭袌?chǎng)對(duì)于新故事的渴望。

在語(yǔ)言模型迭代放緩的當(dāng)下,視頻生成模型似乎成了那個(gè)更有希望的AI應(yīng)用新方向。

但這個(gè)方向并不是沒(méi)有風(fēng)險(xiǎn),高昂的成本和尚未成熟的技術(shù)路線,都讓這個(gè)領(lǐng)域的前景充滿了不確定性。

就拿我自己的經(jīng)歷來(lái)說(shuō),我曾經(jīng)參與過(guò)一個(gè)基于AI的視頻生成項(xiàng)目。

我們團(tuán)隊(duì)投入了大量的時(shí)間和資源,試圖打造一個(gè)能夠根據(jù)文本描述生成視頻內(nèi)容的模型。

雖然最終我們?nèi)〉昧艘恍┏晒?,但這個(gè)過(guò)程中的挑戰(zhàn)和困難也讓我們深刻認(rèn)識(shí)到,視頻生成技術(shù)的復(fù)雜性和成本。

技術(shù)層面的挑戰(zhàn)。

視頻生成模型需要處理大量的數(shù)據(jù),包括圖像、音頻和視頻等多種形式。

這不僅要求模型具備強(qiáng)大的數(shù)據(jù)處理能力,還需要能夠理解和生成復(fù)雜的場(chǎng)景和動(dòng)作。

而這些,都需要大量的算力和數(shù)據(jù)支持。

據(jù)Meta的數(shù)據(jù),Movie Gen用了6144張H100進(jìn)行訓(xùn)練,視頻模型參數(shù)達(dá)到30B(300億)。

這樣的資源投入,對(duì)于大多數(shù)初創(chuàng)公司來(lái)說(shuō),無(wú)疑是一個(gè)巨大的門檻。

市場(chǎng)接受度的問(wèn)題。

雖然視頻生成技術(shù)看起來(lái)很酷,但用戶是否真的愿意為之買單,還是一個(gè)未知數(shù)。

目前,視頻生成領(lǐng)域的頂級(jí)模型幾乎都選擇了閉源,這意味著玩家們需要投入真金白銀去試錯(cuò)。

而一旦開(kāi)始商業(yè)化,付費(fèi)已是必選項(xiàng)。

但用戶是否愿意為這種新型的內(nèi)容生成方式買單,還需要市場(chǎng)的檢驗(yàn)。

內(nèi)容生態(tài)的構(gòu)建。

視頻生成技術(shù)的發(fā)展,離不開(kāi)一個(gè)健康的內(nèi)容生態(tài)。

這意味著,除了技術(shù)本身,還需要構(gòu)建一個(gè)能夠持續(xù)產(chǎn)生優(yōu)質(zhì)內(nèi)容的生態(tài)系統(tǒng)。

這不僅需要技術(shù)的支持,更需要內(nèi)容創(chuàng)作者、平臺(tái)和用戶的共同參與。

快手的可靈就是一個(gè)典型的例子,它通過(guò)懷舊照片等一系列策劃,成功吸引了大量用戶的關(guān)注。

監(jiān)管和倫理的問(wèn)題。

視頻生成技術(shù)的發(fā)展,也帶來(lái)了一些監(jiān)管和倫理上的挑戰(zhàn)。

比如,如何確保生成的內(nèi)容不侵犯他人的版權(quán),如何防止技術(shù)被用于制造虛假信息等。

這些問(wèn)題的解決,需要政策制定者、技術(shù)開(kāi)發(fā)者和社會(huì)各界的共同努力。

總的來(lái)說(shuō),視頻生成技術(shù)的發(fā)展,既充滿了機(jī)遇,也充滿了挑戰(zhàn)。

對(duì)于企業(yè)和創(chuàng)業(yè)者來(lái)說(shuō),選擇是否進(jìn)入這個(gè)領(lǐng)域,需要慎重考慮。

而對(duì)于我們這些觀察者來(lái)說(shuō),更應(yīng)該保持理性和客觀的態(tài)度,既要看到技術(shù)發(fā)展帶來(lái)的積極影響,也要關(guān)注其可能帶來(lái)的風(fēng)險(xiǎn)和挑戰(zhàn)。

在這個(gè)充滿變數(shù)的AI時(shí)代,只有不斷學(xué)習(xí)和適應(yīng),才能把握住時(shí)代的脈搏。

作者:產(chǎn)品視界,公眾號(hào):產(chǎn)品視界

本文由 @產(chǎn)品視界 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Sora視頻截圖

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!