只需一段話,「一鍵生成」短視頻的工具來了

2 評論 9502 瀏覽 22 收藏 14 分鐘

前段時間,輸入關鍵詞或者一句話可以一鍵生成圖片的AIGC技術引起了人們的熱議。現(xiàn)在,還出現(xiàn)了「一鍵生成短視頻」的AIGC工具!這有沒有讓你燃起了成為up主的激情?未來,這項技術將帶來更多百花齊放的內(nèi)容,還是恰恰相反?又將帶來了哪些機會或隱患?一起來看看吧。

抖音和快手火了之后,短視頻成為人們「殺時間」最高效的工具。但直到微信視頻號推出后,人們才認真思考,短視頻可能不僅是網(wǎng)紅和「土味」大片的舞臺,自己或許也能「分一杯羹」。

「現(xiàn)在學做短視頻還晚嗎?」估計不少人在搜索引擎問過這個問題。畢竟,不像公眾號,只要有身份證、會寫字就行。做短視頻至少需要背景樂、視頻素材、配音、字幕等一系列因素。就算是像「半佛仙人」那樣僅有鬼畜表情包的視頻,也需要創(chuàng)作者有簡單粗暴的邏輯,和精彩的「貫口」能力。

而這些挑戰(zhàn),攔住了大部分想投身短視頻事業(yè)的人。不過,隨著 AIGC 技術的逐漸成熟,現(xiàn)在,只需要輸入一個單詞,就能生成配音、背景樂、圖片兼?zhèn)涞亩桃曨l——一家叫 QuickVid 的網(wǎng)站,集成了大部分 AIGC 工具,滿足了人們「一鍵生成短視頻」的幻想。

QuickVid 是怎么做到的?現(xiàn)在的短視頻網(wǎng)紅和 UP 主們,是不是馬上就要被淘汰了?

01 自動生成短視頻的魔法

QuickVid 做視頻,人如其名,真的很「Quick」。用戶只需在 QucikVid 網(wǎng)站輸入提示語、描述清楚想要創(chuàng)建的視頻主題,QuickVid 就開始全自動生產(chǎn)短視頻。當你按下「提交」鍵,QuickVid 做了以下事情:

只需一段話,「一鍵生成」短視頻的工具來了

在QuickVid官網(wǎng)輸入提示詞Cat后,所展示的工作流程。|截圖來源:https://www.quickvid.ai/

基于給出的提示,QucikVid 先利用 GPT-3 的生成文本功能生成短視頻腳本,再從腳本中自動提取或手動輸入的關鍵字,基于這些關鍵字從免費的 Pexels 庫中選擇背景視頻,同時疊加由 DALL-E 2 生成的圖像,并調(diào)用 Google Cloud 的文本轉(zhuǎn)語音 API 來添加來自 YouTube 免版稅音樂庫的合成畫外音和背景音樂。

有了這些基本骨架,QuickVid 生成的就是典型的 YouTube、TikTok 上的短視頻。

在 QucikVid 輸入 Cat 作為提示詞,會自動生成短視頻,看起來散裝的 QuickVid 生成的短視頻質(zhì)量并不差,甚至還有點熟悉,一瞬間會讓你想到生活中的很多場景。你甚至分辨不出來這段視頻到底是機器做的,還是人做的。

科技評論者「評論尸」精辟地評論,「現(xiàn)階段的幾個技術應用的組合,確實可以徹底改變?nèi)祟惾粘5膬?nèi)容消費習慣:ChatGPT,AI 作畫,meme 和短視頻?!?strong>

QuickVid 這樣的工具所生成的短視頻正是人們現(xiàn)在所喜歡的內(nèi)容,「以動態(tài)表情包+AI 語音合成配音為主的??梢栽?Tiktok 和抖音反復流行」。

也正是由于其工作原理,QuickVid 自動生成短視頻的質(zhì)量并不穩(wěn)定。一個例子是背景視頻的相關性,由于 QuickVids 目前僅限于 Pexels 目錄,隨機選擇的背景視頻常常只是與主題稍微沾邊;另一方面,DALL-E 2 生成的圖像也顯示了當前文本到圖像生成技術的局限性,比如文本亂碼和比例失調(diào)。

創(chuàng)始人 Habib 表示,QuickVid「每天都在測試和修補」。Daniel Habib 是一名自學成才的開發(fā)者,曾在 Meta 從事 Facebook Live 和視頻基礎設施相關工作,他在短短幾周內(nèi)就開發(fā)出了 QuickVid 這樣一款短視頻生成器。

盡管如此,QuickVid 還是讓我們看到了現(xiàn)有技術下生成式短視頻的一種可能。畢竟,相比現(xiàn)有大公司,沒有包袱的初創(chuàng)公司在產(chǎn)品上更大膽,因為幾乎沒有試錯成本。

結合現(xiàn)有的 AI 技術,利用大量空鏡短視頻的重復、模板格式,QuickVid 解決了必須自己生成鏡頭的問題。

那么,QuickVid 這樣的產(chǎn)品,會成為 Meta、谷歌等巨頭,為簡化短視頻制作而開發(fā)的新功能嗎?還是像很多生成式 AI 應用一樣,不過是曇花一現(xiàn)的「玩具」?

02 當創(chuàng)作者開始比拼「念咒語」

如果 Stable Difussion(一款 AI 圖片生成器)和 Jasper(一款 AI 文案生成器)的出現(xiàn),讓藝術創(chuàng)作者和營銷人員這樣特定領域的人看到了 AI 的生產(chǎn)力,那么 QuickVid 則進一步釋放了像抖音、快手等短視頻平臺上普通用戶的生產(chǎn)力。短視頻已經(jīng)搶占了人們余暇時間的絕大部分注意力,QuickVid 使得短視頻創(chuàng)作有更低的門檻,它會給人們帶來什么樣的影響?

QuickVid 的創(chuàng)建者 Daniel Habib 表示,QuickVid 是為了幫助創(chuàng)作者跟上受眾的需求。通過為創(chuàng)作者提供快速輕松地制作優(yōu)質(zhì)內(nèi)容的工具,幫助創(chuàng)作者增加內(nèi)容輸出、降低創(chuàng)作倦怠與靈感枯竭的風險,滿足粉絲「不斷增長」的需求。

聽上去,Daniel Habib 似乎為 QuickVid 找到了絕佳的使用場景,切中了短視頻創(chuàng)作者的痛點和剛需。但 QucikVid 真的可以幫助創(chuàng)作者滿足受眾的需求嗎?

當生成短視頻的門檻降低到只輸入提示詞后,短視頻的數(shù)量的確可以想要多少就有多少。但不得不考慮另一個問題。

過去,短視頻制作的每個環(huán)節(jié)——寫腳本、拍素材、剪輯甚至配音,都可以區(qū)別競爭對手玩出花樣、贏得流量;現(xiàn)在有了 QucikVid,大家比拼的就只剩輸入的提示詞了。當競爭規(guī)則變成誰念的「咒語」可以更容易讓機器理解時,真的可以讓創(chuàng)作者的內(nèi)容脫穎而出嗎?

恐怕相反,更有可能發(fā)生的是本就擁擠的短視頻平臺,充斥著同質(zhì)化內(nèi)容和垃圾內(nèi)容。

對于垃圾內(nèi)容的泛濫,Habib 認為,「短視頻平臺的算法,而不是 QuickVid,最適合確定視頻的質(zhì)量,制作低質(zhì)量內(nèi)容的人『只會損害自己的聲譽』」。聲譽受損自然會抑制人們使用 QuickVid 創(chuàng)建大規(guī)模的垃圾內(nèi)容。換句話說,「如果人們不想看你的視頻,那么這些視頻就不會在 YouTube 等平臺上獲得分發(fā)和傳播,而且,制作低質(zhì)量的內(nèi)容也會讓人們以負面的眼光看待你的賬號?!?/p>

更迫切的問題在于,QucikVid 面臨著所有 AIGC 應用的共同挑戰(zhàn)。

首先是生成式 AI 應用無法根除的「有毒」內(nèi)容,即虛假有害或價值觀不正確的短視頻。

目前,GPT-3 依舊會散布虛假信息,特別是關于新近發(fā)生的事件,因為這些事超出了其知識庫的范圍。而由 GPT-3 改進而來的 ChatGPT 被證明有可能使用性別歧視和種族主義語言。盡管 OpenAI 有「過濾器」相關技術來阻止這些有毒內(nèi)容,但效果并不理想。

依托于 GPT-3 的 QuickVid 當然也不可避免地會生成有毒內(nèi)容。對于那些使用 QuickVid 制作資訊視頻的人來說,是令人感到擔憂的。

對此,Habib 表示,QuickVid 依靠 OpenAI 的過濾器來完成大部分的審核工作,并聲稱用戶有義務手動審查 QuickVid 創(chuàng)建的每個視頻,以確?!敢磺卸荚诜煞秶鷥?nèi)」。但這似乎站不住腳,如果真的如 Habib 所言,抖音快手這樣的短視頻平臺早就可以省去繁重、昂貴的人工審核工作。而現(xiàn)實是,永遠有下一個有毒視頻在路上,靠所有人的自覺性并不可能。另一個困境是版權問題。

圍繞人工智能生成內(nèi)容的版權狀況是模糊的,至少目前是這樣。例如,美國專利商標局(USPTO)最近撤銷了對人工智能生成的漫畫的版權保護,稱受版權保護的作品需要人類作者。

當被問及美國專利商標局(USPTO)的決定會如何影響 QuickVid 時,Habib 說,這只涉及AI產(chǎn)品的「可專利性」,而不是創(chuàng)作者利用內(nèi)容賺錢的權利。

他指出,創(chuàng)作者很少為視頻提交專利,更多只是靠短視頻賺錢。比起專利,他們更關心在自己賬號發(fā)布高質(zhì)量的內(nèi)容,這將有助于擴大他們賬號的影響力。他認為,QuickVid 用戶保留有將創(chuàng)作內(nèi)容用于商業(yè)的權利,有權在 YouTube 等平臺上將其貨幣化(用這樣的內(nèi)容賺錢)。

其他的法律挑戰(zhàn)還可能影響 QuickVid 的 DALL-E 2 集成,進而影響其生成圖像疊加的能力。

近日,微軟、GitHub 和 OpenAI 被提起集體訴訟,指控它們違反版權法,允許代碼生成系統(tǒng) Copilot 在不提供授權的情況下復制部分授權代碼。(Copilot 是由 OpenAI 和微軟旗下的 GitHub 聯(lián)合開發(fā)的。) 這起案件對 DALL-E 2 這樣的生成藝術 AI 也有影響,它也被發(fā)現(xiàn)從訓練過的數(shù)據(jù)集中復制和粘貼圖像。

Habib 并不擔心,他認為生成式 AI 的潘多拉魔盒已經(jīng)打開。他說:「如果明天出現(xiàn)另一場訴訟,OpenAI 消失了,還有幾個替代方案可以為 QuickVid 提供動力?!顾傅氖穷愃?DALL-E 2 的系統(tǒng) Stable Diffusion。QuickVid 已經(jīng)在測試利用 Stable Diffusion 生成頭像圖片。

在應用層的創(chuàng)新消停多年后,ChatGPT 的橫空出世讓人們看到了「把應用層重做一遍」的可能。生成式 AI 革新的局面下,短視頻自動生成器的出現(xiàn)可能是最具想象力的工具,畢竟,短視頻是當前商業(yè)化能力最強的媒介形式。

如何利用 AIGC 降低人們創(chuàng)作的門檻,如果說其應用之前還停留在繪畫和文字階段,現(xiàn)在,視頻無疑是 AIGC 即將攻克的下一個「堡壘」。QuickVid 只是 AIGC 沖向視頻堡壘的第一個游騎兵,其身后是即將呼嘯而至的「千軍萬馬」。

更重要的是,堡壘中的平臺、用戶和監(jiān)管層,面對新技術和新工具,將會采取怎樣的措施,來維持「創(chuàng)作普惠」及「無用內(nèi)容泛濫」的平衡狀態(tài)。

作者:宛辰;編輯:靖宇;微信公眾號:極客公園(ID:geekpark)

來源:https://mp.weixin.qq.com/s/vQunuRyRMfhuF2cv6ETscw

本文由 @極客公園 授權發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. mark

    來自廣東 回復
  2. 人工智能真能取代大部分人工

    來自上海 回復