Sora來臨,它能搶了誰的飯碗?
OpenAI又有“新活”了,2024年初,OpenAI發布了新的視頻生成模型Sora,引起了各行業的廣泛關注。本文分享了Sora與其他視頻生成模型相比具有的優點,并推斷了Sora會對影視行業帶來的影響,快來閱讀吧!
繼ChatGPT后,OpenAI在2024年初又掀起了人們的討論熱情。
2月16日清晨,OpenAI發布了文生視頻AI模型Sora,引爆全球網絡。與以往的文生視頻模型Runway和Pika不同,Sora可以持續地模擬人物、動物和物體,并生成同一角色的多個景別的鏡頭,在整個視頻中保持其外觀和背景。
此外,Sora還可以生成圖片。與以往相比,這些圖片中的細節更清晰,包括臉上的斑點和嘴唇上的細紋,分辨率最高可達2048×2048。
一石激起千層浪,Sora發布后,一眾科技圈大佬紛紛下場討論。馬斯克表示“gg humans”(gg/good games原指游戲結束時玩家互相致意,后引申為“游戲結束”);周鴻祎預言:“這可能給廣告業、電影預告片、短視頻行業帶來巨大顛覆”;前阿里副總裁賈揚清則評價:“真的非常牛”。
“霸榜”近日科技板塊熱點的Sora大模型亮點在哪里?具體來看,這會對影視制作行業起到怎樣的影響?
01 高質量、長時間、多景別
簡單來講,Sora能夠根據文本提示,創建60秒的視頻、擴展現有視頻以及從圖像中生成視頻,視頻中還包含復雜的場景和鏡頭運動。
OpenAI官網展現了多段Sora制作的視頻,身著黑色皮衣、紅色裙子的女子在雨后的夜晚行走在東京市區街道上,女子皮膚毛孔色沉清晰可見,路面積水反映著路燈倒影,視頻真實度十分之高,如果不是偶爾穿幫的左右腿,很難一眼判斷是AI制作的視頻。
在運鏡、構圖等方面,Sora視頻都呈現出大幅度的提升,一舉將AI視頻提升至“next?level” 。
圖源OpenAI
此外,Sora不僅能夠生成完整的60秒視頻,還能延長已生成的視頻。也就是說,給Sora一段視頻,它可以自動生成前面或者后面的視頻。
更離譜的是,Sora可以生成不同機位、不同景別的視頻,并進行剪輯。且在不同的機位下,無論是廣角、中景、近景、特寫,室內還是室外,視頻中人物和背景的關系都一致,不受影響。
圖源OpenAI
也就是說,僅需要一段文字,Sora模型就可以生成一段60s的1080p視頻,包含不同景別鏡頭。不由得讓人感嘆——“真實和虛幻的差別,到底還有多大距離?”
值得注意的是,文生視頻早已存在,根據知名投資機構a16z統計,截至2023年底,市場上共有21個公開的AI視頻模型,例如Google的Lumiere、Stability AI的SVD、以及視頻生成大模型Gen-2的開發商Runway。其中,Runway2023年6月底完成C輪融資后,估值則是超過15億美元。
Sora 公開后,東吳證券對目前主要的視頻生成模型做了對比。他將Sora、W.A.L.T、Gen-2和Emu Video、Pika 1.0、Stable Video六個模型的特點、生成視頻表現等特點進行對比分析。結論是,Sora在生成時長、一致性等方面都有顯著的優勢,具有突破性的語義理解能力。
圖源東吳證券
去年年初,ChatGPT橫空出世,而一年后,Sora就實現了視頻的快速創作,如此快的發展速度令人心驚。畢竟一年前,AI生成視頻還是這樣。
圖源網絡
有B站網友表示:“小時候還想過,未來會不會有這樣一種拍電影的技術,戴上腦機后靠人腦的想象來生成各種各樣壯麗恢宏的電影畫面,誰知這個現實已經不遠了。”
雖然目前Sora還處于測試階段,只面向邀請的制作者和安全專家開放測試(據稱是一些視覺藝術家、設計師和電影制作人)。然而資本端已然聞風而動,CB Insights的數據則顯示,OpenAI目前是世界上最有價值的科技初創企業之一,僅次于字節跳動和SpaceX。
在根據Thrive牽頭的收購要約進行現有股票出售后,當前OpenAI的估值已經達到800億美元以上,達到九個月前的近3倍。
只不過,有人歡喜有人愁,對于一些影視行業從業者和AGI視頻初創公司,Sora的問世很難說是喜事。
02 風暴來襲
Sora發布,最直觀的影響就是AGI視頻創業公司。
曾在2023年熱映影片《瞬息全宇宙》中參與制作的Runway,其 CEO瓦倫祖拉在Sora發布后,在X平臺上發布了兩個字,“Game On.”(競爭開始了)。
圖源X平臺
對于字節跳動來說,Sora的出現無疑是對于剪映的一大威脅。今年,就在Sora問世的一周前,原抖音集團CEO張楠卸任,轉而投入剪映,反映出抖音對于AIGC工具的重視。隨著Sora的不斷發展,剪映如何才能學習Sora并創新,成為了當務之急。
除此之外,Sora類AI模型對于好萊塢以及電影、電視、廣告等領域的影響是最直觀的。
美國行業調查公司CVL Economics,上個月發布的一項對300位好萊塢行業領袖的調查顯示,75%的受訪者承認,生成式AI(工具、軟件、模型)已經促使他們業務部門削減與合并工作崗位,擔憂情緒彌漫在整個好萊塢。
那些掌控著好萊塢行業秩序的大佬預計,未來三年好萊塢總計會有超過20萬人的工作崗位會遭受AI沖擊,尤其是視覺特效、音效師、畫圖師等后期工作崗位。
圖源OpenAI
不過,回顧內容創作的歷史,工具的發展無法阻擋,進步是常態,比起抵制,創作者更要思考哪些環節和內容變得更有價值。
從AI 制作視頻的流程上來看,當前的Sora需要先輸入一段文字,隨后再生成視頻,視頻的原創性還是在依賴著創作者的審美,Sora的工具屬性更加突出。比起原創內容,Sora的優勢更在于,那些需要耗費大量人力物力的特效片段。
所以,也有網友預測,雖然未來視頻制作流程中的剪輯師、特效師等后期崗位會面臨更為嚴峻的處境。但過往那些受限于拍攝成本、拍攝技術的內容,則會更受關注。
理想的情況下,Sora未來能夠代替更多機械、重復的工作,使得創作者可以集中精力于創新的、深度的解讀,給文化消費者們提供更優質的內容。
此外,由于AI的理解內容更加偏向于輸入“關鍵詞”,而非劇本。所以在未來,如何創作出適合AI 理解的劇本,從而生成視頻,也是值得關注的問題。
03 Sora的價值,不止視頻
目前來看,Sora最直觀的影響是視頻制作行業,但他的野心,或者是眾多大模型的野心遠不止于此。
OpenAI官網上,將Sora定位為世界模擬器。OpenAI認為,其能夠有效地模擬物理和數字世界,包括其中的物體、動物和人類等各種因素。根據OpenAI的報告顯示,Sora在理解地球物理世界的規律層面,取得了巨大的進展。
當然,目前的Sora作為一個模擬器當前還存在著一定的缺陷,世界模型仍然不夠完善。在OpenAI發布的48個Sora生成的視頻中,就出現了不少穿幫的畫面。
例如玻璃杯還沒有破碎,但是液體已經流出;人們在沙漠中挖出變形塑料椅子;一個男人在倒著跑跑步機等不符合邏輯的視頻內容。簡單來說,一些對于人類來說約定俗成的因果規律,Sora模型短期內無法推理。
圖源OpenAI
就已有信息來看,目前的Sora仍處于1.0階段,在處理精細的背景時常常出現力不從心的情況,但沒人會否認Sora對于AGI實現路程上的里程碑地位。
AI風口下,Sora的出現讓我們看到了AGI實現的可能,也逼迫著同行業內不斷創新發展。畢竟泡沫過后,贏家只能有一個。
作者:光也
來源公眾號:TopKlout克勞銳(ID:TopKlout),一個集好看和有料于一身的自媒體生態觀察號
本文由人人都是產品經理合作媒體 @TopKlout克勞銳 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!