如何冷靜看待視頻大模型Sora?

0 評論 2261 瀏覽 3 收藏 5 分鐘

Sora出現之后,許多人都在思考它會對影視行業或者其他行業帶來什么影響。這篇文章里,作者分享了他對Sora的觀察和思考,一起來看一下。

我對sora的觀察思考都在這里:

1.Sora剛出來的時候,看到最多的詞匯是“王炸”,“視頻行業完蛋了”,“人類的落日”。在我看來,這絕對不是王炸,最多是“四個3”,因為這僅僅是開端,讓大家過過癮,實際投入生產和商業化的路還很長,另外按照OpenAI的風格,現在醞釀著更強大的可以投入生產的能力。

2.為什么說是一個開端,未來是什么樣子?如果我是視頻生產者,我的使用場景是,投喂幾個圖片或視頻元素,按照我意愿生成一個完整的視頻,比如全員會的開場視頻,需要有公司的logo,有虛擬公司吉祥物的形象,甚至有高管的發言。又比如做一個產品宣傳視頻,需要把我們產品的界面照片輸入進去,比如學習機,自動生成一個學習機的宣傳視頻。

如果Sora能夠做到這一步,原本制作視頻的成本是10天,壓縮成2個小時,才是顛覆行業,視頻從業者的落日。

但現在已經看到Sora的能力,他的描述能力,也就是把腦海中想象的畫面通過文字具象化的能力,很多人類是不具備這種能力的。所以要達到上面說的場景, 只是時間問題。

3.Sora僅僅具備描述能力,缺少的是想象力和共情能力。所以靠想象力產生價值的工作長期還無法取代,比如演員,我們看電影,看的是演員的微表情,性格特征,從而共情,比如賈玲的堅韌,沈騰經歷坎坷的逆風翻盤,沒有賽車手經歷的韓寒拍不出《飛馳人生》。

所以說替代影視行業,時間尚早。冷靜對待自媒體的夸張表達。

4.Sora不是第一個生成視頻的工具,他為什么會火?

從我目前的觀察來看,生成視頻的質量最好。體現在這幾個點:

第一時間比較長,長達1分鐘的超長視頻,內容長度遠遠高于市面上的AI視頻模型。60秒達到了抖音快手的內容要求;

第二視頻內容的連貫性,其他生成的視頻二維效果較好,但是對三維空間以及物體應如何交互沒有內在的理解,導致AI視頻往往會出現人物扭曲和變形。Sora生成的視頻一鏡到底,視頻中的舞龍,背景人物,都達到了驚人的一致性,各種鏡頭隨意切換,人物都是保持了極高的穩定性。

第三是細節表現,人物的眼睫毛惟妙惟俏,舞獅畫面獅頭的麒麟隨風擺動。

5.有的公司假期還沒結束,還沒有正式上班,就開始行動了,重點討論Sora的產品布局。對于組織和個人來說,想抓住這波機會,至少先關注再嘗試,且不能忽視。借用一句話,先看見,再相信。

6.Sora對教育產品有什么影響?或許偽直播,錄播課是不是都可以成為過去式了?

只需要知識點的輸入,就能生成一個生動形象的而且是真實的主講老師講課視頻。

對于教研老師的能力或許是操控AI的能力了。

說到最后,人類遠古經歷石器時代、青銅時代、鐵器時代。有的工具在人類手上始終是靜止的工具,有的工具在人類手上變成神奇的魔法棒。

作者:靈魂工程,微信公眾號:靈魂工程(linghun1949)

本文由@靈魂工程 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自 Sora 官網演示視頻截圖

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!