AI 視頻界的 GPT-3 時刻已來 面對Sora,張一鳴面臨新挑戰(zhàn)?
最近Sora的消息真的太多了,威爾·史密斯直接上場整活,興奮的同行直接拉升了相關(guān)的股價。但在另一些人眼里,就沒那么好過了:字節(jié)調(diào)整了人員安排,AI創(chuàng)業(yè)公司直接都哀鴻遍野了。
Sora的出現(xiàn),將剛過完春節(jié)的我們又拉到了一場新的“科技春晚”中。2 月 16 日,OpenAI 宣布推出首個文生視頻大模型——Sora,該模型可以“根據(jù)文本指令創(chuàng)建逼真且富有想象力的場景”,并且最長可達一分鐘。
這一舉動所帶來的影響絲毫不小于去年GPT-4問世后的爆火,不論是同屬AI賽道的國內(nèi)外公司還是看熱鬧不嫌事大的明星,甚至還有企圖利用信息差賣課的騙子,都讓Sora的熱度居高不下。而Sora所帶來的影響還在持續(xù),可謂是有人歡喜有人愁。
一、威爾·史密斯本尊整活Sora
在Sora出現(xiàn)后,不少科技圈名人都發(fā)出了驚嘆,馬斯克甚至直接在社交平臺上發(fā)布短評“GG humans”。當所有人都在震驚于Sora的強大能力,同時為人類今后所擔憂的時候,有人已經(jīng)看熱鬧不嫌事大的開始“火上澆油”了。
大家還記得那個曾拍攝過《當幸福來敲門》和《黑衣人》等眾多好萊塢大片的巨星威爾·史密斯嗎?今天,全體AI社區(qū)都被威爾·史密斯發(fā)出的這段視頻震驚了!
你以為,上面是一年前的AI視頻,下面是如今的Sora生成的AI視頻?但其實全網(wǎng)都被他騙到了,下方所謂的AI視頻并無OpenAI水印,同時還是由其本人官方賬號發(fā)出的。
所以這就是個由威爾·史密斯本人出鏡表演的視頻,并非Sora生成的AI視頻,有趣的是他還假裝很震驚,配上“形勢已經(jīng)失控了!”的文字,似乎在為人類的未來或是個人隱私所擔憂。只能說不愧是好萊塢巨星,親自上陣,給大伙整了個大活,還結(jié)結(jié)實實騙過了不少網(wǎng)友。
這似乎也從側(cè)面體現(xiàn)了Sora的強大早已在短短幾天內(nèi)深入人心,因此一眾網(wǎng)友才會被威爾·史密斯的整活視頻所欺騙。但其實出于對生成真實人像安全問題的顧慮,OpenAI從未回應(yīng)過這類請求。在已公開的Sora視頻里,最接近可比的是“一個男人吃漢堡”。
可以看到,被咬了一口的漢堡正確出現(xiàn)咬痕,展示了Sora對人與食物互動的理解。這種AI對于物理世界的深度理解還在各個方面有所體現(xiàn),也正是因為這點才會讓人們感到震驚,畢竟此前的Pika等同賽道產(chǎn)品可沒有如此強大的理解能力。
對于Sora的問世,許多人不同于威爾·史密斯的整活,而是發(fā)現(xiàn)了一些不一樣的“商機”。
二、Sora的更多“商機”
很難想象,剛剛問世的Sora能和蘋果Vision Pro進行聯(lián)動。有 github 網(wǎng)友@AndrewMayne將OpenAI案例視頻轉(zhuǎn)化成了適用 Vision Pro空間視頻。
AndrewMayne 創(chuàng)建了兩個視頻軌道,一個用于左眼,一個用于右眼,并根據(jù)視頻移動的方向稍微改變了軌道的時間。這會創(chuàng)建模擬立體 3D 效果,并且僅適用于存在橫向運動的視頻。為了將視頻轉(zhuǎn)換為適用于 Vision Pro 的 Apple Spatial 視頻格式,其使用了 Mike Swansons 的空間視頻轉(zhuǎn)換工具
在蘋果Vision Pro 上的實際體驗也相當不錯,雙目視差帶來的立體感,在海浪的沖擊中帶來更加身臨其境的體驗。在不追求非常細致的視覺效果下,憑借批量化、高效率的 Sora 生成的 AI 視頻可以有效填補空間視頻的空白市場。
而相比于發(fā)掘Sora和Vision Pro之間聯(lián)系的商機,一些心術(shù)不正之人卻找到了利用Sora熱度的“商機”。
沒錯,這個所謂的“商機”就是賣999的限時特價的課程,這都不是普通的“割韭菜”了,這是直接利用信息差進行詐騙了。眾所周知,Sora這個產(chǎn)品在AI視頻領(lǐng)域,說是劃時代的產(chǎn)品也不為過。但是,它只是個”期貨”產(chǎn)品,只有官方、以及極少數(shù)的測試大佬,手握產(chǎn)品權(quán)限,可以試用到。而距離真正能向大眾開放,至少還有2~3個月的時間。
畢竟,從他們的技術(shù)文檔還有整體的節(jié)奏看,離真正的產(chǎn)品化,包括做好安全對齊,還有一段不短的路要走。但是,產(chǎn)品都還沒見到,賣課的,就聞風(fēng)而動了?!癝ora專屬提示詞教程”、“Sora內(nèi)容創(chuàng)作SOP”等等,這些騙子真是不放過任何一個賺錢的“商機”啊。
相比于個人對Sora的震驚或是“利用”,其實真正受到影響的還是AI同行們,只是這些同行中有人歡喜有人愁。
三、Sora發(fā)布后,同行很興奮
Pika Labs成立于2023年4月,同年11月發(fā)布首個產(chǎn)品Pika 1.0。Pika1.0能夠生成和編輯3D動畫、動漫、卡通和電影,并且普通用戶還可以對其進行加工,被視為一款零門檻“視頻生成神器”。
在Sora發(fā)布之前,Runway和Pika都被認為是視頻生成賽道的佼佼者。Sora發(fā)布之后,很多人認為,它憑一己之力已經(jīng)輕松“吊打”且即將“干翻”這兩家新興獨角獸公司,并對創(chuàng)業(yè)者的命運表示擔憂。
然而,他們自己對此卻似乎興奮更多于恐懼。Pika創(chuàng)始人郭文景獨家回應(yīng)稱,“我們覺得這是一個很振奮人心的消息,我們已經(jīng)在籌備直接沖,將直接對標Sora?!惫木斑€透露,目前已經(jīng)在招人了,具體計劃暫時還不能對外透露。
除了Pika外,一些文生視頻的同行也吃到了一波紅利,文生視頻概念股集體漲停。AI相關(guān)投融資也迎來一波小高峰,國內(nèi)大模型創(chuàng)企月之暗面?zhèn)鞒鋈谫Y超10億美元,加拿大AI創(chuàng)企Cohere被曝正洽談5-10億美元新融資,Quora、Sakana等AI創(chuàng)企接連拿下數(shù)千萬美元融資。
據(jù)不完全統(tǒng)計,2023年11月-2024年1月全球共誕生4家AI獨角獸,包括美國AI語音合成公司ElevenLabs、印度AI模型創(chuàng)企Krutrim、法國開源模型創(chuàng)企Mistral AI以及國內(nèi)大模型創(chuàng)企零一萬物。隨著新融資塵埃落定,月之暗面等公司也有望立刻升級為新晉A1獨角獸。前天,ElevenLabs也憑借Al配音版Sora視頻出圈,再吸一波熱度。
除了一些國外同行們吃到了紅利外,其實更多的情況是眾多AI創(chuàng)企的騎虎難下,Sora的橫空出世,對張一鳴來說,亦喜亦憂。
四、Sora讓剪映何去何從?
面對來自Sora的“降維打擊”,AI視頻領(lǐng)域的創(chuàng)業(yè)者中,有的如Runway CEO克里斯托瓦爾·巴倫蘇埃拉一樣,做好了“Game On”的準備,有的如Pika創(chuàng)始人郭文景一樣,開始籌備對標Sora的新產(chǎn)品,也有人如Stability AI CEO埃馬德·莫斯塔克一樣,不由感慨“阿爾特曼真是一個魔術(shù)師”,并將Sora視為AI視頻界的GPT-3時刻。
但對字節(jié)跳動來說,這似乎是個喜憂參半的消息,因為 Sora所處的視頻生成賽道,正是眼下字節(jié)跳動旗下剪映所瞄準的AI創(chuàng)新方向。2月份從抖音轉(zhuǎn)崗剪映后,抖音前CEO張楠即將推出一個AI生圖和視頻的產(chǎn)品。
近日,據(jù)財聯(lián)社報道,在OpenAI發(fā)布Sora之前,字節(jié)跳動就曾低調(diào)推出了一款視頻模型產(chǎn)品Boximator的消息并不屬實。Boximator可以通過文本控制生成視頻中人物或物體的動作,但目前尚不完善且不支持產(chǎn)品落地。
字節(jié)跳動相關(guān)人士回應(yīng)稱,Boximator是視頻生成領(lǐng)域控制對象運動的技術(shù)方法研究項目,目前還無法作為完善的產(chǎn)品落地,距離國外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時長等方面還有很大差距。
正打算在AI生成視頻領(lǐng)域大干一番的張楠,還沒等到產(chǎn)品落地的那一刻,其內(nèi)部再創(chuàng)業(yè)的計劃,便率先遭遇了Sora的當頭一擊。不過若是換一種思路呢?盡管在推出類似文生視頻產(chǎn)品方面落后一步,但對張楠來說,反過來也迎來了一個摸著Sora過河的機會。只是,留給張一鳴和張楠孵化下一個AI視頻生成獨角獸的時間,越發(fā)緊張了。
Sora打了所有人一個措手不及,Pika、剪映等部分同行或許還有追趕的機會,但更多的AI創(chuàng)企則是愈發(fā)的開始走下坡路了。
五、大廠入局讓AI創(chuàng)企再次“哀鴻遍野”
正如此前OpenAI推出GPT商店時引發(fā)AI創(chuàng)企“哀鴻遍野”一樣,此次OpenAI、谷歌、Meta幾乎同一時間接連發(fā)布重磅模型,再次引發(fā)業(yè)界爭論:AI創(chuàng)企還有出路嗎?
這個問題的答案我們目前還不得而知,但能夠確認的是,在一些AI創(chuàng)企砥礪前行的同時,已經(jīng)有一些企業(yè)走上了下坡路。
首當其沖的是明星獨角獸Stability AI,雖然其一直在不斷發(fā)布新模型,但持續(xù)的高管離職、投資者的質(zhì)疑體現(xiàn)了其內(nèi)部管理的混亂。
2023年11月,Stability AI被曝出由于財務(wù)狀況壓力巨大正在尋求出售。此外,其重要投資者美國對沖基金Coatue Management還在10月致信管理層,要求CEO埃馬德·莫斯塔克(Emad Mostaque)辭職。
Stability AI不是唯一被曝考慮出售的AI創(chuàng)企。據(jù)外媒The Information報道,近幾個月來,AI搜索創(chuàng)企Perplexity至少與4家公司討論了收購事宜,企業(yè)級AI助手Writer已與3家尋求收購的公司接洽。
大比例的裁員也是AI創(chuàng)企泡沫破裂的跡象之一。生成式AI獨角獸Jasper、AI語音識別創(chuàng)企Deepgram等首批明星AI創(chuàng)企在近半年紛紛宣布裁員。
下坡路的盡頭是創(chuàng)企的墳?zāi)?。?jù)不完全統(tǒng)計,2023年11月-2024年1月,有4家AI創(chuàng)企宣布關(guān)停。其中有大廠獨立出來的團隊,有明星產(chǎn)品創(chuàng)始人新成立的公司,也有已經(jīng)走過十余年的“老牌”企業(yè)。
六、寫在最后
Apple Vision Pro 帶來了空間計算革命的全新愿景,將人們的現(xiàn)實體驗提升到了一個全新的層次。通過結(jié)合 3D 空間場景與混合現(xiàn)實的內(nèi)容展示形式,它不斷地挑戰(zhàn)和刷新人們對于視覺認知的界限。
從生成式人工智能文字對話工具 ChatGPT、圖像生成器 DALL-E,到視頻生成的王炸 Sora,OpenAI 正在重塑互聯(lián)網(wǎng)內(nèi)容生產(chǎn)形式。
2024注定是不平凡的一年,從硬件到軟件的革新,似乎在迎接更加科幻的時代。在科技飛速發(fā)展的浪潮下,不論是個人還是企業(yè),或許都將迎來天翻地覆的變化。
作者:孫浩南
來源公眾號:元宇宙新聲
本文由 @元宇宙新聲 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!