一句話生成一分鐘視頻?元宇宙的救星果然是AI

0 評(píng)論 2304 瀏覽 3 收藏 12 分鐘

今天凌晨Sora模型發(fā)布后,不光是AI圈子炸了,在元宇宙相關(guān)的圈子里也引起了大范圍的討論。AI,這次真的一夜之間成為了元宇宙世界的救星。

作為一個(gè)在公眾視野中起起落落的概念,元宇宙所承載的對(duì)未來(lái)虛擬世界無(wú)限的想象總讓人感覺(jué)若即若離:

構(gòu)建一個(gè)生動(dòng)、豐富且充滿互動(dòng)的虛擬環(huán)境是元宇宙概念誕生起就面臨的挑戰(zhàn),成本、技術(shù)、創(chuàng)意等諸多因素都在限制著元宇宙的發(fā)展。

雖然最近一年多以來(lái)AI技術(shù)突飛猛進(jìn),但在協(xié)助元宇宙虛擬世界的構(gòu)建上,一直沒(méi)有太大突破。

但OpenAI最新發(fā)布的視頻生成模型Sora展現(xiàn)出了前所未有的潛力,不論是構(gòu)建虛擬視頻還是虛擬空間,Sora都有了巨大飛躍。

AI,這次真的一夜之間成為了元宇宙世界的救星。

一、能視頻生成,就構(gòu)建元宇宙場(chǎng)景?

對(duì)于這樣一個(gè)顛覆性創(chuàng)新,先不做過(guò)多贅述,直接看療效:

這段視頻的提示詞為:“幾只巨大的猛犸象踏著白雪皚皚的草地走來(lái),它們長(zhǎng)長(zhǎng)的毛毛在風(fēng)中輕輕飄動(dòng),遠(yuǎn)處覆蓋著白雪的樹木和引人注目的雪山,午后的陽(yáng)光灑滿了縷縷云彩,遠(yuǎn)處的太陽(yáng)發(fā)出溫暖的光芒,低相機(jī)視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動(dòng)物,并具有美麗的攝影和景深?!?/p>

這段視頻的提示詞為:“美麗的雪城東京很繁華。鏡頭穿過(guò)熙熙攘攘的城市街道,跟隨幾個(gè)人享受美麗的雪天并在附近的攤位購(gòu)物。美麗的櫻花花瓣隨著雪花在風(fēng)中飛舞?!?/p>

這段視頻的提示詞為:“動(dòng)畫場(chǎng)景的特寫是一個(gè)毛茸茸的小怪物跪在一根融化的紅色蠟燭旁邊。藝術(shù)風(fēng)格是 3D 和現(xiàn)實(shí)的,重點(diǎn)是燈光和紋理。這幅畫的氣氛是一種驚奇和好奇,怪物睜大眼睛、張開嘴巴凝視著火焰。它的姿勢(shì)和表情傳達(dá)出一種天真和俏皮的感覺(jué),就好像它第一次探索周圍的世界一樣。暖色調(diào)和戲劇性燈光的使用進(jìn)一步增強(qiáng)了圖像的舒適氛圍?!?/p>

幾條視頻展示出的AI視頻能力已經(jīng)很明顯:

Sora能夠基于文本描述準(zhǔn)確生成高度逼真的場(chǎng)景,同時(shí)融入豐富的想象元素,打破了以往AI視頻內(nèi)容創(chuàng)造的限制。

首先是長(zhǎng)時(shí)間、一鏡到底的視頻生成。與當(dāng)前市面上的其他AI視頻生成工具相比,Sora能夠生成長(zhǎng)達(dá)一分鐘的視頻,且在整個(gè)視頻過(guò)程中保持高度的一致性和連貫性,克服了此前同類工具的最大缺陷。

同時(shí)Sora還能實(shí)現(xiàn)復(fù)雜場(chǎng)景和角色的準(zhǔn)確描繪。在創(chuàng)造包含多個(gè)角色復(fù)雜場(chǎng)景的同時(shí),Sora能夠較為精確地描繪出動(dòng)作類型、對(duì)象和背景的詳細(xì)信息,甚至一定程度上實(shí)現(xiàn)角色的情感表達(dá)。

去年,這些問(wèn)題還是AI視頻內(nèi)容生成領(lǐng)域面臨的最大挑戰(zhàn)。然而,今年開年不到兩個(gè)月的時(shí)間,Sora就已經(jīng)證明了自己克服這些挑戰(zhàn)的能力。

此外,Sora還有許多令人頗感意外的亮點(diǎn):

首先是其展示出了對(duì)電影拍攝語(yǔ)法的自發(fā)理解,能夠在不同鏡頭之間自然過(guò)渡,推進(jìn)故事的發(fā)展;同時(shí),其對(duì)于動(dòng)物毛發(fā)等細(xì)節(jié)的逼真表現(xiàn),也顯示出其在視頻生成技術(shù)上的細(xì)致入微。

既然Sora可以生成這么多風(fēng)格不同的連貫視頻,那么更進(jìn)一步的虛擬空間、虛擬世界構(gòu)建自然也存在可能。

事實(shí)也確實(shí)如此,而且AI生成虛擬世界這一天的到來(lái),或許會(huì)比想象中更快——正如去年的許多人也不曾預(yù)想到AI視頻內(nèi)容生成的發(fā)展會(huì)如此迅速一樣。

二、元宇宙場(chǎng)景搭建 不再遙遠(yuǎn)

就在發(fā)布Sora的同一時(shí)間,OpenAI發(fā)表了一篇名為《Video generation models as world simulators》(視頻生成模型作為世界模擬器)的論文。

論文揭秘了有關(guān)Sora的更多關(guān)鍵信息,例如 Sora 可以生成任意分辨率和長(zhǎng)寬比的視頻(高達(dá) 1080p)。此外Sora 還能夠執(zhí)行一系列圖像和視頻編輯任務(wù),從創(chuàng)建循環(huán)視頻到及時(shí)向前或向后延伸視頻,再到更改現(xiàn)有視頻中的背景。

其中Sora的“模擬數(shù)字世界”能力對(duì)于元宇宙的發(fā)展將起到關(guān)鍵性作用。

目前,Sora已經(jīng)能夠在像《我的世界》這樣的游戲中渲染世界及其動(dòng)態(tài),并控制玩家角色,在此類虛擬空間構(gòu)建平臺(tái)中,Sora幾乎像一個(gè)數(shù)據(jù)驅(qū)動(dòng)的物理引擎,而非僅僅是一個(gè)創(chuàng)意生成工具。

這表明,通過(guò)Sora驅(qū)動(dòng)虛擬空間的全自動(dòng)搭建已經(jīng)在逐步成為現(xiàn)實(shí)。

從目前的情況來(lái)看,Sora對(duì)元宇宙的顛覆性影響主要體現(xiàn)在兩個(gè)方面:首先,它能夠直接根據(jù)需求生成虛擬視頻,迅速構(gòu)建元宇宙所需的場(chǎng)景;其次,它展現(xiàn)出生成可供深入探索的虛擬空間的潛力。另一方面,其有望直接生成可以深入探索的虛擬空間。

這意味著不論從技術(shù)層面、社會(huì)層面還是文化層面,元宇宙都將進(jìn)入全新的發(fā)展階段。

在技術(shù)層面,對(duì)于元宇宙的建設(shè)者來(lái)說(shuō),快速搭建豐富多樣的虛擬場(chǎng)景變得前所未有地容易。傳統(tǒng)上,創(chuàng)建逼真的虛擬環(huán)境需要大量的時(shí)間、人力和資源投入,而Sora的技術(shù)可以大大簡(jiǎn)化這一過(guò)程,使得元宇宙的擴(kuò)展和多樣化成為可能。

這不僅能夠加速元宇宙的構(gòu)建進(jìn)程,還能夠降低進(jìn)入門檻,讓更多的創(chuàng)作者和開發(fā)者有機(jī)會(huì)參與到元宇宙的構(gòu)建中來(lái)。

同時(shí),在未來(lái)此類技術(shù)將不僅能夠生成靜態(tài)的虛擬場(chǎng)景,還有望直接生成可深入探索的動(dòng)態(tài)虛擬空間。這些空間不僅僅是視覺(jué)上的呈現(xiàn),而是可以與之互動(dòng)、探索和體驗(yàn)的完整虛擬世界。

元宇宙中的空間將不再是簡(jiǎn)單的背景或設(shè)置,而是充滿了物理規(guī)則、動(dòng)態(tài)事件和互動(dòng)元素的生動(dòng)世界。這將極大地豐富用戶在元宇宙中的體驗(yàn),使其不僅僅是觀察者,而是能夠?qū)嶋H參與和影響虛擬世界的發(fā)展。

社會(huì)層面,AI技術(shù)的進(jìn)步將使元宇宙能夠提供高度個(gè)性化的體驗(yàn),根據(jù)每個(gè)用戶的偏好、歷史行為和社交互動(dòng)來(lái)定制內(nèi)容和互動(dòng)。這種個(gè)性化不僅限于內(nèi)容推薦,也擴(kuò)展到元宇宙中的角色、環(huán)境和故事情節(jié)的定制。

同時(shí)這樣的變化還會(huì)催生出新的社交互動(dòng)形式,如AI驅(qū)動(dòng)的虛擬角色與人類用戶之間的互動(dòng),或者通過(guò)如在線演唱會(huì)、教育課程、社交聚會(huì)等虛擬活動(dòng)連接全球用戶。

文化層面,就像自媒體、短視頻時(shí)代對(duì)傳統(tǒng)傳媒形成沖擊一樣,虛擬內(nèi)容創(chuàng)作門檻的降低,無(wú)疑會(huì)進(jìn)一步?jīng)_擊傳統(tǒng)影視業(yè)的發(fā)展,同時(shí),更多個(gè)體和文化背景的人們能夠創(chuàng)作和分享自己的故事,促進(jìn)全球文化的多樣性和交流。

此外,元宇宙社群的真正興起也會(huì)帶動(dòng)全新的虛擬文化興起,這種文化將完全從元宇宙中誕生、發(fā)展和傳播,形成獨(dú)特的文化標(biāo)識(shí)和社區(qū)歸屬感。

三、未來(lái)已來(lái) 但挑戰(zhàn)依然

當(dāng)然,在關(guān)于未來(lái)的暢想越來(lái)越具體的同時(shí),對(duì)于AI構(gòu)建元宇宙時(shí)要面臨的種種問(wèn)題與挑戰(zhàn),也到了亟待解決的時(shí)刻。

首先是技術(shù)準(zhǔn)確性的問(wèn)題,Sora在渲染復(fù)雜場(chǎng)景和細(xì)節(jié)(如食物的咬痕或玻璃破碎的細(xì)節(jié))時(shí)依然存在局限。這種局限性不僅影響生成內(nèi)容的真實(shí)性,也可能限制其在某些應(yīng)用場(chǎng)景(如法醫(yī)分析或科學(xué)研究)中的有效性。

此外模擬現(xiàn)實(shí)世界中的物理規(guī)則對(duì)于AI來(lái)說(shuō)仍然是一個(gè)挑戰(zhàn),這反映了當(dāng)前AI技術(shù)在理解和模擬復(fù)雜自然現(xiàn)象方面的限制。

而除了技術(shù)上的問(wèn)題外,個(gè)人形象濫用對(duì)肖像權(quán)、隱私權(quán)的侵犯;現(xiàn)實(shí)與虛構(gòu)界限的模糊,逐步侵蝕公眾對(duì)信息真實(shí)性的信任;傳統(tǒng)的安全防護(hù)和欺詐檢測(cè)方難以應(yīng)對(duì)更加精細(xì)和逼真的虛假內(nèi)容,從而導(dǎo)致詐騙等案件更加頻發(fā)等,都要求政府、教育機(jī)構(gòu)和技術(shù)公司共同努力,提高公眾對(duì)這類技術(shù)的理解和鑒別能力。

這些問(wèn)題雖然已經(jīng)是老生常談,但面對(duì)技術(shù)的突飛猛進(jìn),如何更好地用規(guī)則來(lái)規(guī)范技術(shù)的發(fā)展,已經(jīng)變得迫在眉睫。

該如何面對(duì)這些進(jìn)步對(duì)社會(huì)、文化和倫理帶來(lái)的深刻影響?如何吸取上一輪元宇宙發(fā)展的失敗教訓(xùn),借助AI真正營(yíng)造一個(gè)開放、包容且充滿多樣性的虛擬世界?

這都需要元宇宙的各個(gè)相關(guān)主體負(fù)責(zé)任地探索與創(chuàng)新,以確保共同打造出一個(gè)既豐富又充滿互動(dòng),同時(shí)安全的元宇宙,賦予其更深層的意義。

AI,這次確實(shí)成為了元宇宙的救星,但元宇宙發(fā)展中要解決的問(wèn)題,卻并沒(méi)有減少。

作者:高樂(lè)

本文由 @元宇宙新聲 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!