Sora要把抖音們團(tuán)滅了
OpenAI推出的全新生成式人工智能模型Sora是這幾天討論最多的話題了,一是說世界將被改變,大佬也紛紛發(fā)言表達(dá)自己的看法,但都沒人能說準(zhǔn)Sora將要顛覆什么。
正月還未過完,科技界便發(fā)生3件大事。
一是英偉達(dá)推出Chat With RTX,將每個(gè)人的電腦變成本地化系統(tǒng)大模型;
二是谷歌AI推出了Gemni1.5版本,與GPT-4相比,可處理超過100萬個(gè)token的輸入窗口;這兩件事似乎與普通人的日常生活還有一定距離。
但第三件事卻刷爆了每個(gè)人的朋友圈——Sora的發(fā)布。它是OpenAI推出的全新生成式人工智能模型。
一、網(wǎng)傳世界將被改變
2月16日凌晨,OpenAI發(fā)布了重磅更新,推出了首個(gè)文生視頻模型Sora。用戶通過文本指令,可使Sora直接生成長(zhǎng)達(dá)60秒的視頻,包含精細(xì)的背景、主體,靈活的多角度鏡頭,以及多個(gè)富有情感色彩的角色。
Sora發(fā)布后短短2天內(nèi),迅速成為全球互聯(lián)網(wǎng)熱議的焦點(diǎn),關(guān)于其將徹底改變影視業(yè)和短視頻行業(yè)的預(yù)測(cè)層出不窮。
Sora還沒有對(duì)公眾開放,據(jù)《MIT Technology Review》報(bào)道,OpenAI目前沒有計(jì)劃向公眾發(fā)布Sora,能夠使用Sora的只有相關(guān)程序人員、安全測(cè)試人員以及經(jīng)過OpenAI挑選的少量創(chuàng)作者和藝術(shù)家。
除了應(yīng)對(duì)監(jiān)管與潛在危害的風(fēng)險(xiǎn),OpenAI的當(dāng)務(wù)之急是將Sora交予視覺藝術(shù)家、設(shè)計(jì)師和電影制作人進(jìn)行測(cè)試??梢钥闯?,這套文生視頻模型將優(yōu)先面向影視相關(guān)行業(yè),OpenAI也希望通過專業(yè)人員的評(píng)估獲得相關(guān)反饋,以推動(dòng)模型進(jìn)步。
此前,生成式AI已逐漸通過利用自動(dòng)化、個(gè)性化和優(yōu)化技術(shù),重塑了媒體、廣告、金融和教育等多個(gè)行業(yè)的運(yùn)作方式,提高了生產(chǎn)效率、優(yōu)化了決策過程。而Sora的誕生意味著AIGC(人工智能生產(chǎn)內(nèi)容)的時(shí)代或許已經(jīng)來臨,Sora這類工具也或許將深遠(yuǎn)地顛覆未來的內(nèi)容創(chuàng)作與商業(yè)格局。
我們注意到OpenAI已經(jīng)更新了48個(gè)由Sora生成的視頻demo,在經(jīng)過我們反復(fù)觀看與分析后得出了以下看法:
1. Sora脫穎而出是因?yàn)樗朔恕拔锢黼y題”
相較于同類產(chǎn)品10秒的創(chuàng)作上限,Sora生成視頻長(zhǎng)達(dá)60秒,其生成內(nèi)容的精細(xì)畫面已經(jīng)達(dá)到與現(xiàn)實(shí)世界難以區(qū)分的程度。此外,Sora生成內(nèi)容的主體與背景環(huán)境的一致性更是令人震撼。
但最關(guān)鍵的地方還是在于Sora對(duì)于世界模型的掌握。通過學(xué)習(xí),Sora能了解現(xiàn)實(shí)世界的運(yùn)行常識(shí)與物理規(guī)律。而以往的擴(kuò)散模型只能實(shí)現(xiàn)文本與3D模型的普通轉(zhuǎn)換,無法直接嵌入在一個(gè)虛擬的物理世界中。
簡(jiǎn)單來說,以往用文生視頻給人的感覺更像是“會(huì)動(dòng)的圖片”,其中視頻背景與主體之間缺乏動(dòng)態(tài)交互,無法跨越“真實(shí)”的門檻。
而以Sora生成的視頻「海盜船在咖啡杯中纏斗」為例,其水面流體動(dòng)力學(xué)以及運(yùn)動(dòng)規(guī)模比例的物理難點(diǎn)都得到解決。
英偉達(dá)高級(jí)研究科學(xué)家 Jim Fan 甚至表示:”Sora 是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的物理引擎“,”是一個(gè)可學(xué)習(xí)的模擬器,或「世界模型」”。
2. Sora的升級(jí)速度會(huì)快得嚇人
Sora這類AIGC工具的能力基于大數(shù)據(jù)訓(xùn)練,和此前的Chat GPT一樣,具有網(wǎng)絡(luò)效應(yīng),這種效應(yīng)使得其迭代進(jìn)化的速度異常迅速,且這種速度無法用摩爾定律來準(zhǔn)確衡量。
但與Chat GPT不同的是,Sora生成的AI內(nèi)容對(duì)普通人來說更為直觀,更容易在大量用戶與從業(yè)者之中獲取反饋。由于短視頻是當(dāng)前世界的主流娛樂方式和信息媒體,其廣泛的信息來源和傳播渠道為Sora的自我學(xué)習(xí)和提升提供了有力支持。
雖然早期Sora也出現(xiàn)過對(duì)物理的錯(cuò)誤理解,如「果汁從杯底灑出」,但這也能表明Sora正在不斷地自主探索物理世界,這種通過糾錯(cuò)與學(xué)習(xí)的升級(jí)方式,更符合未來人們對(duì)“智能”的理解。
所以Sora對(duì)于創(chuàng)作的內(nèi)容理解將不斷升級(jí),綜合水平已經(jīng)大大超越了此前熱門的Runway和Pika,隨著大數(shù)據(jù)的不斷累積,Sora的發(fā)展前景目前看不到盡頭。
360創(chuàng)始人周鴻祎表示,一旦Open AI的人工智能把所有的電影、視頻都看一遍,這就離AGI真的就不遠(yuǎn)了,不是10年20年的問題,可能一兩年很快就可以實(shí)現(xiàn)。
3. 普通人使用Sora的創(chuàng)作質(zhì)量并不會(huì)輸于多數(shù)專業(yè)人士
曾經(jīng),拍攝一張照片需要購(gòu)入昂貴的相機(jī),學(xué)習(xí)調(diào)整各種參數(shù),而沖洗照片則涉及復(fù)雜的化學(xué)試劑和多個(gè)步驟。然而,隨著數(shù)碼相機(jī)和智能手機(jī)的出現(xiàn),每個(gè)普通人都能隨時(shí)隨地拍攝和觀看照片。這使得傳統(tǒng)的攝影師的專業(yè)性逐漸只能通過構(gòu)圖、采光、個(gè)人風(fēng)格等抽象因素來展現(xiàn)。
如今,Sora也將帶來這樣的改變。隨著其大模型的完善和自我學(xué)習(xí)能力的增強(qiáng),Sora能讓一個(gè)完全沒有影視制作和藝術(shù)設(shè)計(jì)經(jīng)驗(yàn)的普通人直接生成一段符合他描述的視頻,而這段視頻所帶來的效果和科幻大片高成本制作的特效不相上下。
這意味著,未來的網(wǎng)文作者在寫作文章的同時(shí),也可能獨(dú)自完成一部小說改編的玄幻短片。而對(duì)于特效制作和虛擬場(chǎng)景搭建的專業(yè)人士來說,如果高成本制作的畫面最終與草根作者的作品相差無幾,這無疑會(huì)給他們帶來不小的壓力。
4. 對(duì)于短視頻創(chuàng)作者而言,真實(shí)的、富有情感的內(nèi)容價(jià)值將無限上升。
短視頻創(chuàng)作者應(yīng)當(dāng)深入思考的是,在Sora等工具推動(dòng)AIGC發(fā)展的背景下,短視頻作為主流的信息獲取渠道,其中必將充斥大量由AI生成的內(nèi)容,而整活、風(fēng)景、敘事等視頻分類更是生成內(nèi)容的“重災(zāi)區(qū)”。
并且隨著AIGC技術(shù)的不斷進(jìn)步,用戶已難以辨別內(nèi)容是否由AI創(chuàng)作,這使得用戶和創(chuàng)作者去區(qū)分內(nèi)容真實(shí)性的重要性降低。
但不論Sora有多么“理解”世界,也無論其生成的視頻內(nèi)容有多么逼真,它們始終是數(shù)字模擬的產(chǎn)物,無法替代真實(shí)拍攝所展現(xiàn)的現(xiàn)實(shí)。因此,為了在未來避免被生成視頻內(nèi)容的洪流所淹沒,短視頻創(chuàng)作者如果專注于真實(shí)拍攝,并通過深入的情感展現(xiàn)來觸動(dòng)觀眾,將會(huì)取得更好的效果。
二、對(duì)Sora的預(yù)測(cè)
自Sora發(fā)布以來,影視行業(yè)首先受到了廣泛關(guān)注。尤其是Sora生成視頻的特效最為驚艷,與好萊塢大片相比也毫不遜色。很多人認(rèn)為Sora能降低影視行業(yè)視覺特效的制作成本,從而改變影視行業(yè)的制作模式和產(chǎn)業(yè)鏈。
我們團(tuán)隊(duì)也迅速將Sora生成的幾段視頻分享給了影視和攝影行業(yè)的從業(yè)者。幾位視效專家表示,對(duì)于寫實(shí)類的視頻,Sora的生成效果并不真實(shí)。普通人可能只會(huì)覺得有點(diǎn)怪,因?yàn)榇蟛糠值氖д鎲栴}都出在光影方面。
對(duì)于Sora生成的CG(計(jì)算機(jī)動(dòng)畫)類小場(chǎng)景視頻,他們表示整體上很到位,甚至目前很多相關(guān)CG制作公司的作品完全不能與Sora相比。
盡管Sora在生成CG方面表現(xiàn)出色,同時(shí)能以極低的成本制作出震撼的60秒視頻內(nèi)容,但一部電影并非由多個(gè)60秒的片段簡(jiǎn)單拼湊而成。
影視行業(yè)往往需要制作宏大且連貫的場(chǎng)景,而目前的Sora還無法滿足這種需求,此外,Sora生成的內(nèi)容在細(xì)節(jié)方面也很難經(jīng)得起專業(yè)的考驗(yàn)。
60s短視頻對(duì)敘事的要求與長(zhǎng)視頻電影完全不同,類似的是,AI可以寫出一個(gè)還不錯(cuò)的段子笑話,但很難寫出幾十上百萬字的優(yōu)秀小說。
我們認(rèn)為,盡管Sora有強(qiáng)大的生成與學(xué)習(xí)能力,但在要求表達(dá)大量?jī)?nèi)容和細(xì)節(jié)的場(chǎng)景時(shí)仍顯得力不從心。目前,Sora還無法完全替代人工來接替影視創(chuàng)作的工作。然而,不可否認(rèn)的是,Sora是一個(gè)出色的概念創(chuàng)意工具。尤其是其在小場(chǎng)景視頻中的優(yōu)勢(shì),預(yù)示著它將對(duì)廣告行業(yè)、創(chuàng)意行業(yè)產(chǎn)生深遠(yuǎn)的影響。
另一個(gè)備受關(guān)注的領(lǐng)域是視頻平臺(tái)。數(shù)據(jù)顯示,目前國(guó)內(nèi)短視頻用戶的規(guī)模在10億以上,其中抖音2022年的年收入達(dá)到了700億美金以上,快手也實(shí)現(xiàn)了900億人民幣的年收入。
然而,面對(duì)這樣一個(gè)龐大的市場(chǎng),在Sora發(fā)布之前,所有的視頻生成工具都未能達(dá)到商業(yè)化或工業(yè)化生產(chǎn)的標(biāo)準(zhǔn)。
與Pika和Runway相比,Sora不僅提供了精美的畫質(zhì),其視頻內(nèi)容也更為豐富多樣,同時(shí)視頻時(shí)長(zhǎng)也增加了十多倍。如果用于短視頻創(chuàng)作,這將極大提升用戶的新鮮感。然而,當(dāng)眾多創(chuàng)作者都選擇利用Sora輸出內(nèi)容從而被動(dòng)“同質(zhì)化”時(shí),如何確保自己的作品質(zhì)量出眾,這才是使用Sora真正的問題。
AIGC的興起降低了整活、追熱點(diǎn)和段子視頻化的門檻,導(dǎo)致單純依賴生成視頻不足以維持創(chuàng)作者的競(jìng)爭(zhēng)力。目前看來,小說、敘事類自媒體可能更能充分發(fā)揮Sora的優(yōu)勢(shì),因?yàn)镾ora尚無法生成具有獨(dú)特調(diào)性和核心創(chuàng)意的視頻。
因此,對(duì)于視頻平臺(tái)的內(nèi)容創(chuàng)作者來說,Sora并不能替代他們自身的創(chuàng)意和靈感,而只能作為輔助工具來提升創(chuàng)作效率和質(zhì)量。
就Sora目前所生成的視頻而言,優(yōu)秀作品主要集中在動(dòng)物、遠(yuǎn)景建筑和幻想場(chǎng)景等領(lǐng)域。這些視頻在過去往往需要?jiǎng)?chuàng)作者支付高昂的版權(quán)費(fèi)用以使用。因此,Sora的出現(xiàn)很可能首先顛覆素材版權(quán)行業(yè)。
Sora的強(qiáng)大生成能力同時(shí)伴隨著對(duì)社會(huì)秩序的潛在巨大破壞力,因此,不可避免地會(huì)吸引一些居心叵測(cè)的人利用其進(jìn)行詐騙、勒索、誹謗等不法行為。
可以預(yù)見的是Sora的正式推出不但要面臨自身的迭代優(yōu)化,還要面臨世界多個(gè)國(guó)家和地區(qū)的嚴(yán)格監(jiān)管,我們認(rèn)為短期內(nèi)OpenAI并不會(huì)向公眾發(fā)布Sora。但無論Sora何時(shí)向用戶發(fā)布,它都將進(jìn)一步證明AI已經(jīng)成為人類社會(huì)不可或缺的一部分。
Sora的出現(xiàn)無疑是AI發(fā)展的一個(gè)巨大成功。它在人類現(xiàn)有知識(shí)基礎(chǔ)和世界模型的基礎(chǔ)之上,疊加了相關(guān)的自我學(xué)習(xí)技術(shù),這無疑是AI發(fā)展的正確道路之一。AI企業(yè)將很容易利用這種模式打造各行業(yè)的超級(jí)工具。
前些年,元宇宙、VR、人工智能等概念風(fēng)起云涌,但始終沒有具象化的產(chǎn)物出現(xiàn)。如今,Meta頭顯已經(jīng)擁有千萬銷量;英偉達(dá)通過AI概念市值達(dá)到了1.7萬億美元;蘋果公司也發(fā)售了自己的頭顯設(shè)備Apple Vision Pro;OpenAI旗下的人工智能產(chǎn)品也在不斷更新?lián)Q代??梢?,一個(gè)圍繞虛擬與人工智能的時(shí)代正以不可逆的架勢(shì)向我們襲來。
作者:張從白,編輯:劉漁
來源公眾號(hào):蔚然先聲,換個(gè)視角理解中國(guó)商業(yè)
本文由 @蔚然先聲 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Pixabay,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!