如果你是Sora的產品經理,你會如何設計這款產品?

0 評論 2331 瀏覽 26 收藏 10 分鐘

OpenAI發布了文生視頻模型Sora,這是一幫純技術的成需要發布的大模型。但如果是從產品經理的角度設計的大模型,會不會不一樣。這篇文章,我們考慮技術特性、應用場景、操作流暢度和個性化定制程度這幾點,分別展開來聊聊。

Sora的出現,引發一眾討論熱潮,但這款未正式發布的跨時代AI產品,還無法讓我們直觀感受到它的操作界面和使用效果。

那身為一名產品經理,我不禁好奇,這款產品會給人什么樣的交互體驗?如果我是它的產品經理,我會如何設計?

是像DALL-E 3那樣直接融入ChatGPT里?還是像Pika那樣單獨的輸入框和調試界面?又或者干脆做成剪映那種一站式視頻生成和編輯器?

AI產品設計,要同時考慮技術特性、應用場景、操作流暢度和個性化定制程度這幾點,下面我分別展開來聊聊。

一、技術特性

采用Diffusion Transformer架構的Sora,特點在于能夠處理和生成具有復雜動態和空間關系的高質量視頻。因此產品設計要重點考慮如何有效調整模型性能,控制它的泛化能力。利用Transformer的特性來提高視頻的質量和多樣性。

因此從產品設計上,提供高清分辨率、多場景模版、多鏡頭選擇肯定是Sora和其他視頻有差異化的配置參數。

與此同時,考慮到過度復雜的參數配置導致的過擬合問題,這類配置的選擇也要控制邊界,限制約束條件,不能讓用戶通過自然語言來隨意控制。

二、應用場景

Sora的應用范圍非常廣泛,因此,在產品設計時,應考慮如何將Sora應用到如影視制作、游戲開發、教育教學、產品演示、內容營銷等更多領域,從而擴大其市場影響力,覆蓋到更多元的職業類型。

舉個例子,影視制作就是官方指定的Sora應用場景之一。OpenAI曾公開表示,通過使用Sora,視覺藝術家、設計師和電影制作人可以獲得關于如何推進模型對創意專業人士最有幫助的反饋。

但對產品經理而言,這樣的定位更要求產品設計風格面向專業人士而不是普世大眾。也許我們的界面,不應該只提供一個對話框,而是要以更貼近鏡頭語言、電影腳本那樣的風格來給用戶輸入提示。就像DALL·E3的提示詞生成器那樣,明確規定用戶要按:場景、人物角色、形象描述、背景介紹、表現說明那樣的格式來撰寫提示詞。以劇本撰寫為例,一個劇本通常由5個主要元素組成:時間、地點、人物、行為、對話。那我們的界面設計,就應該要求用戶完善這些設定,才能享受到一部精彩的劇作。

當然,不同行業Sora提供的能力范圍也要有區別,比如在游戲領域,游戲開發者就可以利用Sora制作游戲中的角色動畫和場景效果,提供更逼真豐富的游戲體驗。從這個角度看,就無需復雜的腳本設定,只考慮如何把技術融入到游戲設定中就可以了。

三、操作流暢度

設計一個用戶友好、操作簡便的Sora視頻生成界面,首先要確保界面的設計遵循人機界面的友好性和操作便利性原則

具體來說,可以考慮以下幾個方面:

第一,簡化操作流程:剛剛我有提到,Sora使用過程中,用戶必須對想要顯示的內容進行詳細描述,包括場景、人物、動作和整體基調等。這意味著在設計界面時,應盡量減少用戶的輸入工作量,提供清晰、直觀的選項和反饋,以幫助用戶快速完成描述和設置,這時候就可以融入AI Copilot角色來輔助用戶撰寫內容。

第二,增強視覺體驗:通過合理的排版和配色,使用戶能夠直觀地了解頁面內容,并享受到視覺上的美感。這不僅能提升用戶體驗,還能增加工具吸引力。我個人推薦類似GPTs那樣的布局。既可以自然語言交互,又支持輸入框配置參數,還可以直接預覽,方便直觀。

第三,靈活的編輯功能:Sora需要允許用戶靈活地編輯和更改生成的場景。因此,在設計界面時,應考慮到用戶可能會有不同的需求和偏好,提供多種編輯選項,如調整視頻的長度、添加或刪除場景元素等,以滿足用戶的個性化需求。

第四,實時預覽和反饋機制:在生成視頻之前,用戶可以預覽生成的視頻。這樣的設計可以讓用戶更好地理解生成效果,并根據預覽結果做出相應調整。同時,也應該提供一個反饋機制,讓用戶知道他們的描述被Sora理解了多少,以及哪些部分沒有得到很好的表現。還能避免無效的patch資源浪費。

第五,易于學習和使用:Sora的使用,對普通大眾而言上手門檻可能會較高。因此,在設計界面時,應確保所有的指示和說明都是清晰易懂的,避免復雜的術語或難以理解的概念。增加示意圖和解釋說明手冊就是個很好的設計。

四、個性化定制程度

就像上面提到的,面向專業人士的設計,相比普通C端,區別就在于可個性化定制的范圍。對Sora而言這可能是關鍵環節,也需要認真設計。具體可以分下面幾個維度來考慮:

第一,提供可調節的視頻長度和分辨率,以及各種模板和主題:Sora需要允許用戶根據特定需求和偏好定制他們的視頻,包括視頻長度和分辨率的調節,以及提供各種模板和主題,從而滿足不同場景和需求

第二,利用用戶數據生成個性化視頻:作為企業級用戶,可以基于用戶數據,讓Sora生成針對不同用戶群體的定制視頻,從而提高營銷活動的針對性和最終售賣的轉化率

第三,支持生成支持多設備多尺寸內容的能力:由于Sora訓練的視頻是全尺寸,它也就支持為多樣化設備定制內容的能力,從產品設計上也要支持多設備屏幕預覽功能。

第四,視頻風格定制:視頻風格也是AIGC產品的標配,卡通、寫實、科幻、幽默,用戶都可以根據自己的需求和喜好,輸入特定的文本信息,讓Sora生成符合預期的視頻內容,也給用戶提供了充分發揮想象力的空間,這也是平臺型產品的標準設計思路。

五、總結一下

總的來講,我覺得sora的設計,不應該只局限在某個功能、某個界面上,更應該綜合考慮技術實現、使用人群、實現目的和用戶反饋。

這個過程肯定不是一蹴而就,尤其目前作為一款視頻生成工具,sora還有大量不完善的地方,比如物體動作表現遲緩不自然、視頻無聲音、仍舊存在幻覺問題等等。就連已經很成熟的GPT4,OpenAI仍舊在使用過程中用各種方法收集用戶反饋。

這也是身為產品經理要特別關注的。

希望這篇文章能對你有所啟發。

專欄作家

申悅,微信公眾號:互聯網悅讀筆記(ID:pmboxs),人人都是產品經理專欄作家,前360產品總監,起點學院優秀導師。

本文原創發布于人人都是產品經理。未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!