AI視頻生成的場景痛點(diǎn)及產(chǎn)品功能設(shè)想(7000字)

1 評論 237 瀏覽 0 收藏 31 分鐘

本文深入探討了AI視頻生成技術(shù)在不同用戶群體中的應(yīng)用場景、痛點(diǎn)需求,以及產(chǎn)品功能的未來設(shè)想。文章從C端普通用戶、C端專業(yè)用戶和B端用戶三個角度出發(fā),詳細(xì)分析了他們的核心需求,并提出了一系列創(chuàng)新的產(chǎn)品功能構(gòu)想。

本文分四個部分:

  1. 核心用戶畫像、場景及痛點(diǎn)需求分析
  2. (重點(diǎn))視頻生成產(chǎn)品的功能形態(tài)設(shè)想:從C端普通用戶、C端專業(yè)用戶及B端用戶(以電商廣告為例)三方面,分別闡述P0和P1級功能思考
  3. 視頻生成產(chǎn)品中,AI產(chǎn)品經(jīng)理的價值及核心工作是什么
  4. “廣告營銷類”AI視頻生成產(chǎn)品mapping匯總(含優(yōu)劣勢分析及優(yōu)秀視頻案例捕捉)

核心觀點(diǎn)包括:

  • 激發(fā)AI視頻長期需求:目標(biāo)用戶應(yīng)關(guān)注原本不拍、不剪視頻的普通大眾。在短劇、生活記錄類視頻的基礎(chǔ)上,利用AI制作動效,可能是AI視頻的長期需求。
  • Tob廣告營銷類視頻:包含視頻素材生成、端到端視頻生成兩類,重點(diǎn)在于設(shè)計好Agent工作流,并針對不同產(chǎn)品品類訓(xùn)練、調(diào)優(yōu)模型。
  • 優(yōu)先將常用功能做出差異:先開發(fā)、優(yōu)化常用功能,做出差異化亮點(diǎn)(如對口型、人物一致性),再融入其他功能,最終覆蓋完整視頻創(chuàng)作流程。
  • AI視頻新奇玩法模塊化:封裝AI視頻新奇玩法為單個功能,如老照片動效功能、續(xù)寫梗圖劇情功能。用Agent工作流來增加視頻成功的概率,并在功能上增加用戶引導(dǎo)。

一、視頻生成產(chǎn)品的用戶、使用場景及需求

1.1 C端用戶

普通用戶

低制作門檻:無專業(yè)剪輯知識,也不愿花大量時間成本學(xué)。

滿足獵奇心理:制作趣味視頻(如老照片動效),分享給家人、朋友。

專業(yè)視頻制作師

創(chuàng)意需要:對視頻質(zhì)量有較高要求,希望AI能激發(fā)創(chuàng)意。

提效需求:交付有截止日期,希望AI能在保證質(zhì)量的前提下,加速視頻制作。

合規(guī)性和版權(quán)問題:廣告視頻需遵守嚴(yán)格的合規(guī)要求,特別是素材版權(quán)問題。

1.2 B端用戶(以電商廣告用戶為例)

用戶畫像:理解業(yè)務(wù)需求,清楚需要的內(nèi)容樣式。但不擅長制作精美的視頻,核心關(guān)注視頻的轉(zhuǎn)化效果。

用戶需求:

預(yù)算限制:傳統(tǒng)視頻拍攝和制作成本高,視頻制作有預(yù)算額度。

內(nèi)容質(zhì)量高:需能展示產(chǎn)品賣點(diǎn)、符合品牌營銷策略,還需具備傳播性和營銷效果。

快速大量生產(chǎn):需要在短時間內(nèi)制作、測試不同風(fēng)格的視頻。例如:美國的黑五期間,店家可能需要上千條視頻素材,而傳統(tǒng)視頻制作流程復(fù)雜,難快速大量生產(chǎn)。

二、個人對AI視頻產(chǎn)品形態(tài)的思考

2.1 針對C端普通用戶

普通用戶對AI視頻的消費(fèi)需求,可能帶來AIGC內(nèi)容平臺型機(jī)會(類抖音),但現(xiàn)實(shí)情況是:針對短期獵奇需求,大部分用戶沒用起來。很多人更愿付費(fèi)購買“老照片動效成品”,而不是自己使用即夢、Runway等工具。

長期來看,用戶對AI視頻容易失去新鮮感。當(dāng)前AI視頻更多像動態(tài)PPT,鏡頭間不夠連貫,質(zhì)量不如生活實(shí)拍效果,更難與影視類的作品相比。用戶更想看的是優(yōu)質(zhì)的、記錄生活的,能引起情感共鳴的內(nèi)容。

如何破局?

第一階段:讓普通用戶,方便的用起來AI新奇功能(類似老照片動效),對應(yīng)功能P0-1、2、3。

第二階段:激發(fā)、滿足長期需求,讓用AI輔助視頻創(chuàng)作成為長期現(xiàn)狀,對應(yīng)功能P0-4。

普通用戶難用起來的原因:

  • 缺乏基礎(chǔ)了解:不清楚AI能力,覺得復(fù)雜高深,沒有很強(qiáng)的嘗試意愿。
  • 不了解AI本質(zhì)是預(yù)測和概率:有的用戶試了一次效果不理想,就覺得功能不行,不再使用。
  • 現(xiàn)有產(chǎn)品功能有使用門檻:視頻生成Prompt撰寫,AI精準(zhǔn)生圖,視頻可控性功能(如首尾幀、動態(tài)筆刷)都有一定的學(xué)習(xí)成本。產(chǎn)品大多也要付費(fèi)、申請內(nèi)測等。

解決方案

核心是給予用戶引導(dǎo)及例子。從Prompt擴(kuò)寫、功能模塊化、給例子促靈感三個角度考慮。

整體思路優(yōu)先開發(fā)技術(shù)較為成熟,但仍需改進(jìn)的功能,做出差異化亮點(diǎn)(如對口型和人物一致性),再融入其他功能,最終覆蓋完整視頻創(chuàng)作流程。

P0級功能設(shè)想

P0-1:Prompt模板化、提供擴(kuò)寫

背景:不同產(chǎn)品推薦的Prompt格式和支持的內(nèi)容不完全一致。例如,都支持風(fēng)格描述,但支持的具體風(fēng)格不同,這可能是由訓(xùn)練視頻的文本描述格式不一致導(dǎo)致

具體功能:在產(chǎn)品里內(nèi)嵌Prompt模板或提供Prompt擴(kuò)寫功能。用戶只需填空,例如【主體】+【動作描述】+【環(huán)境背景】+【風(fēng)格】+【畫面質(zhì)量】。每項給出產(chǎn)品支持的種類及含義,如風(fēng)格選項及效果演示。如下實(shí)例嵌入產(chǎn)品中:

AI對完成prompt擴(kuò)寫并生成視頻后,用戶如不滿意,可選擇讓AI在保持用戶輸入主體上,多次隨機(jī)生成完整prompt,并提供視頻效果。用戶可再做二次加工。

作用:降低用戶使用門檻。用戶有時只對于畫面主體有想法,但怎樣演繹效果更好,可能需要AI通過多次擴(kuò)寫prompt給到靈感,充分挖掘視頻生成能力。

P0-2:AI視頻新奇玩法功能化

背景:用戶對文生視頻、圖生視頻這樣的功能名詞,感知不如「老照片互動」、「我來設(shè)計梗圖后續(xù)劇情」這類具體能做什么的名詞強(qiáng)。目前,用戶往往需要搜索教程才會使用。

具體功能:

將AI視頻新奇玩法封裝為一個個功能。例如老照片動效、電視劇梗圖(如容嬤嬤喂小燕子吃雞腿)。用Agent工作流來增加視頻成功的概率,并在功能上做用戶引導(dǎo),提醒用戶可能需要多試幾次、有合規(guī)風(fēng)險等。

以老照片互動為例,通過人像摳圖、背景融合等工作流節(jié)點(diǎn),提升功能效果,給予用戶操作教程指導(dǎo),可能介紹哪些互動關(guān)鍵詞,能讓視頻效果更好。

P0-3:靈感探索站

背景:僅有產(chǎn)品使用教程不夠,用戶需要更多案例來引導(dǎo)創(chuàng)作。

具體功能:提供大量新奇,好玩的素材樣例。同時提供案例背后的模板,用戶可直接套用,或在此基礎(chǔ)上做二次創(chuàng)作。類似Morph studio的功能(下圖)。

作用:完整故事的制作依舊比較復(fù)雜,二創(chuàng)相對容易很多。同時靈感探索站本身也可以是AIGC視頻內(nèi)容消費(fèi)平臺。

P0-4:AI輔助視頻剪輯

背景:為避免用戶過了新鮮勁后,就不再看AI視頻的情況。找到并激發(fā)AI視頻的長期需求很重要。應(yīng)關(guān)注原本不拍、不剪視頻的普通大眾,因AI降低了操作難度而開始使用。用AI制作動效或視頻圖層,是可能存在的長期需求。

具體功能:AI制作動效或者視頻圖層

作用:實(shí)現(xiàn)目標(biāo)用戶的破圈,AI(虛擬)+現(xiàn)實(shí)視頻的結(jié)合。既用到了AI視頻能力,又滿足了普通用戶消費(fèi)“真實(shí)生活內(nèi)容”的需求。

P1級功能設(shè)想

P0的需求,核心目的是讓普通用戶能夠用起來。而P1的需求,是能讓普通用戶覺得AI視頻生成好用,實(shí)現(xiàn)可能還需技術(shù)進(jìn)步。關(guān)于“好用”,我理解包括:功能多樣明了(對應(yīng)功能P1-1)、更簡便的可控(對應(yīng)功能P1-2)以及流程簡化(對應(yīng)功能P1-3)。

P1-1 融合多種視頻技術(shù)

背景:當(dāng)下AI視頻技術(shù)種類繁多,例如數(shù)字人、對口型、表情控制、圖+人跳舞、換臉、視頻生成等。不同的技術(shù)對應(yīng)不同產(chǎn)品、模型。但對于普通用戶來說,可能會覺得都是視頻。

具體功能:將多種AI視頻技術(shù)融合到同一產(chǎn)品內(nèi),統(tǒng)一整合,用戶提出需求后,引導(dǎo)用戶具體使用某個功能。

P1-2 視頻內(nèi)容定向修改

通過輸入Prompt調(diào)整視頻內(nèi)元素。每次用戶輸入修改指令后,跳出詳細(xì)的Prompt讓用戶確認(rèn)

除修改視頻內(nèi)人物、物體外,還可通過Prompt修改對話腳本,加上用克隆的原聲重新配音及對口型等功能,類似Vozo。

現(xiàn)有的視頻內(nèi)容難以支持定向修改,往往一點(diǎn)效果不好就必須重新生成,導(dǎo)致視頻抽卡的時間、算力成本高、整體體驗不佳(可能受限于現(xiàn)用的 DIT – Diffusion Transformer 框架,視頻是一次性完整生成的)

P1-3 視頻端到端全自動生成

用戶只需輸入幾個關(guān)鍵詞(如故事主題、風(fēng)格、劇情特色等),系統(tǒng)就能生成一個故事腳本。用戶調(diào)整或確認(rèn)腳本內(nèi)容后,擴(kuò)寫每一幕場景Prompt。再生成視頻,視頻默認(rèn)風(fēng)格、人臉一致,人物對話、旁白有音效,且對好口型等。真正做到山姆奧特曼所說“電影變成了游戲”,技術(shù)上可能還有距離。

2.2 針對C端專業(yè)視頻制作師

P0級功能設(shè)想

專業(yè)設(shè)計師、剪輯師,已有成熟的視頻生產(chǎn)、剪輯工具,因此需要解決”專業(yè)設(shè)計師為何要用AI視頻產(chǎn)品”的問題,在AI生成質(zhì)量尚未達(dá)到非常高水平的背景下,關(guān)鍵詞是“提效和可控”。

P0-1 更多細(xì)項常用功能:

例如風(fēng)格、人臉保持一致,在當(dāng)前視頻制作工作流中,單個的視頻只有幾秒,為劇情連貫,需抽圖實(shí)現(xiàn)人臉、風(fēng)格一致。如能一鍵定義人臉、風(fēng)格,能省不少時間。類似Pixverse V2的加場景功能(人像、風(fēng)格一致性)以及MOKI的風(fēng)格、角色選擇功能。

其他常用功能有很多,例如視頻內(nèi)定向換臉,對口型功能,鏡頭平移但物體不變形等等,目的都是為了提效。

P0-2 更多內(nèi)容元素可控:

除了上面內(nèi)容元素可控外,還包括視頻風(fēng)格、運(yùn)鏡、幀率、清晰度、表情、背景、光影、圖層、音頻等等也可控,最終不需綠幕就能實(shí)現(xiàn)近似專業(yè)影視效果。

當(dāng)前AI視頻一大痛點(diǎn)是對物理世界的規(guī)律和Prompt的理解不足。增強(qiáng)視頻的可控性,可一定程度上解決這些問題。同時也能幫助提效,避免頻繁抽卡。視頻各項元素越精細(xì)化可控,制作效率越高,專業(yè)制作人更可能使用。

這些常用功能看起來已有很多產(chǎn)品在做,但核心是做出差異化,有不同實(shí)現(xiàn)方法或者更好模型效果。在完成亮點(diǎn)功能的MVP后,再考慮其他P1級功能,逐步完善產(chǎn)品。例如,可控性方面,Runway做橫縱斜方向的運(yùn)動筆刷,Pixverse功能上支持以箭頭設(shè)定運(yùn)動方向,尋夢則預(yù)告實(shí)現(xiàn)對圖層的控制。

另外,這些功能或許應(yīng)從海外專業(yè)用戶開始付費(fèi)推廣。當(dāng)前AI生成視頻產(chǎn)品有算力成本,而海外用戶付費(fèi)意愿較高,類似Midjourney、Pixverse等產(chǎn)品,優(yōu)先在Discord版推出并收集用戶反饋。先向海外專業(yè)用戶推廣,再相應(yīng)調(diào)整定價策略、產(chǎn)品功能,更有助于實(shí)現(xiàn)正向ROI。

P1級功能設(shè)想

覆蓋AI視頻生成全流程:包括生成劇本-生成分鏡表-生成圖片提示詞-挑選圖片-圖生視頻-挑選視頻-剪輯視頻等等,用戶可對每個步驟做進(jìn)一步修改,例如分鏡表中調(diào)整某一幕的運(yùn)鏡,視頻效果也相應(yīng)調(diào)整。

支持功能協(xié)作:允許多人對一條工作流進(jìn)行加工,并提供權(quán)限控制。

素材管理、剪輯功能:便于組織和管理各類素材。支持強(qiáng)大的剪輯功能,類似剪映、Pr。

專業(yè)用戶在生成完整視頻作品時,需要大量視頻相關(guān)工具(包括劇本生成、補(bǔ)幀、高清化等等),可以將這些功能融合進(jìn)產(chǎn)品。

此外,一個大的作品背后是大量素材(圖片、短片),以及多人的協(xié)作(P1-1、2)和專業(yè)的剪輯,需要素材管理和剪輯功能。

2.3 針對B端用戶(以電商廣告為例)

對于B端用戶來說,視頻創(chuàng)作效率與質(zhì)量至關(guān)重要,視頻需真實(shí)還原商品,體現(xiàn)商品賣點(diǎn),符合品牌調(diào)性。然而,當(dāng)前生成式視頻在可控性、時長上存在短板,容易出現(xiàn)AI痕跡。商拍廣告流量成本又較高。因此,普遍更多使用質(zhì)量可控、能快速大量生成的數(shù)字人、混剪和相冊類視頻,較少使用Sora類視頻生成。

ToB視頻生成的核心內(nèi)容包括“視頻素材生成”以及“端到端視頻生成”,核心都在于設(shè)計好Agent工作流,并針對不同產(chǎn)品類型訓(xùn)練和調(diào)優(yōu)模型。

P0級功能設(shè)想

雖然視頻生成技術(shù)還不成熟,但在tob領(lǐng)域也有應(yīng)用,視頻在吸引客戶的效果上,很多時候比圖片更好,但需要運(yùn)動幅度小,時長短,效果可控。

動態(tài)微視頻:將圖生視頻的能力固化為功能,用戶可上傳圖片,生成動態(tài)微視頻。

要實(shí)現(xiàn)這部分能力,需要更好的Prompt擴(kuò)寫功能及Agent工作流(融合好運(yùn)動筆刷效果)。

端到端混剪視頻生成
通過用戶提供的宣傳關(guān)鍵點(diǎn)、圖片、視頻素材,生成相應(yīng)的腳本文案、字幕、動效。工作流包括:產(chǎn)品亮點(diǎn)素材挖掘、配樂選擇和模板選擇等。例如試衣視頻,涉及摳圖、上身、更換背景、生成動效等步驟,根據(jù)商品類別提供多種混剪模板,生成凸顯產(chǎn)品亮點(diǎn)的混剪視頻。

需設(shè)計好Agent工作流,通過Agent來增加每個步驟的成功概率,可能需要對不同品類的商品,做定向模型訓(xùn)練。例如,介紹椅子時,先介紹面料、人體工學(xué),從功能到整體,最后細(xì)節(jié)展示,而這套流程可能不適用于鞋類或衣服。

同時,需要根據(jù)用戶反饋,持續(xù)迭代模型及產(chǎn)品。例如,針對衣服的宣傳,如果褶皺飄動效果不自然,可能在調(diào)優(yōu)模型時,需要補(bǔ)充優(yōu)質(zhì)的衣服褶皺、飄動數(shù)據(jù)。

P1級功能設(shè)想

后鏈路數(shù)據(jù)監(jiān)控,記錄不同視頻內(nèi)容帶來的品牌增粉,下載,注冊等。

產(chǎn)品能讓視頻附帶營銷關(guān)鍵信息,例如地理位置、留資鏈接等。

視頻多賬號管理,批量分發(fā)視頻功能。

后鏈路數(shù)據(jù)的效果監(jiān)控,以及讓視頻附帶營銷關(guān)鍵信息對轉(zhuǎn)化非常重要。此外,商家和公司往往有多個自媒體賬號,可能由不同員工負(fù)責(zé),需有效管理這些賬號,確保視頻內(nèi)容符合品牌調(diào)性。

三、在視頻生成產(chǎn)品中,AI產(chǎn)品經(jīng)理的價值及核心工作是什么

我認(rèn)為核心工作是:找到在當(dāng)前AI技術(shù)能力下,以前滿足不了(或不夠好),但今天能滿足(或能更好)的功能點(diǎn)。具體包括:

找到限制條件下最優(yōu)解
當(dāng)前的一些視頻功能,需要同時兼顧算力消耗、質(zhì)量、用時三個維度,用戶希望生成用時少的基礎(chǔ)上,保持高質(zhì)量。這需要產(chǎn)品經(jīng)理做出取舍。

需求挖掘和功能設(shè)計
AI產(chǎn)品經(jīng)理依舊需確定要實(shí)現(xiàn)什么功能,這個新的功能可能是由數(shù)據(jù)集、Agent工作流、RAG等等實(shí)現(xiàn)的。但更重要的是明確為什么要這個功能。一切以需求為核心,這也意味著,并不一定要完全AI來實(shí)現(xiàn),更多應(yīng)關(guān)注用戶需求怎樣能被更好的滿足。

模型能力的提升
具體包括:(1)針對目標(biāo)場景,清楚模型哪里還不夠好 (2)清楚可以給技術(shù)側(cè),怎樣的支持幫助調(diào)優(yōu)

通過專業(yè)的視頻評測方法,例如VBench,結(jié)合不同用途人群的反饋來調(diào)優(yōu)模型。廣告設(shè)計師、自媒體、影視設(shè)計師對視頻模型能力,關(guān)注重點(diǎn)可能不同,包括:人物質(zhì)量,動作連貫性,商品效果不佳(褶皺,擺動不自然)等。在確定最先應(yīng)解決的問題后,才能針對提升模型效果。

識別到問題后,除和開發(fā)溝通算法架構(gòu)的提升外,也需考慮訓(xùn)練數(shù)據(jù)的質(zhì)量問題。比如訓(xùn)練數(shù)據(jù)里的Prompt沒有描述清視頻里的多主體,才導(dǎo)致多主體表現(xiàn)效果不佳。增補(bǔ)優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)的同時,也考慮調(diào)優(yōu)數(shù)據(jù)造、挖、洗這整一條數(shù)據(jù)加工流程。

四、“廣告營銷類”AI視頻生成產(chǎn)品mapping匯總(含優(yōu)劣勢分析及優(yōu)秀視頻案例捕捉)

筆者匯總了在AI視頻生成領(lǐng)域內(nèi)的,廣告營銷相關(guān)的各種產(chǎn)品(37個),根據(jù)其核心功能和特性進(jìn)行了分類,并做了優(yōu)劣勢分析。

這些產(chǎn)品的詳細(xì)信息,筆者已整理成表格Excel

根據(jù)這些產(chǎn)品的核心功能,主要對以下4類:視頻大模型、數(shù)字人、多種類AI視頻組合、端到端解決方案,挑了部分產(chǎn)品在本文做簡要介紹。

4.1 視頻大模型

以Sora為典型代表,僅輸入簡單文字提示或者圖片,就可通過模型生成視頻,以下選取了在各項評測中,排名較高的產(chǎn)品。

4.1.1 Pixverse

核心功能包括:

多種生成方式:支持圖生視頻、文生視頻、圖+提示詞生視頻,適用于創(chuàng)作故事和制作廣告。

動態(tài)筆刷:通過在圖片上畫箭頭,用戶可自定義物體移動方向。圖生視頻憑借類似功能,能實(shí)現(xiàn)比文生視頻更好的穩(wěn)定性。

風(fēng)格設(shè)置:用戶可選擇視頻風(fēng)格,包括寫實(shí)風(fēng)格、動漫風(fēng)格、3D風(fēng)格等。

角色一致性控制:可通過上傳角色的照片,較好的控制視頻一致性。該功能對于影視類廣告、劇情類廣告效果很重要。

4.1.2 Pixeling千象

一款全中文、易上手的AIGC創(chuàng)作平臺和社區(qū)。注重用戶友好和簡單操作,幫助用戶零基礎(chǔ)輕松使用一站式功能。核心功能包括:

文生視頻、圖生視頻、運(yùn)動幅度設(shè)置、視頻橫縱比設(shè)置、鏡頭控制等。

電商百寶箱(E象):提供了專門為電商設(shè)計功能組,包括商品視頻模板和多種實(shí)用的電商圖片處理工具。

4.2 多種類AI視頻組合

4.2.1 布爾向量(BOOLV)

將出海、海外電商用戶可能用到的許多功能,都集成到同一個產(chǎn)品上,提供從商品鏈接到視頻生成,再到效果分析的全鏈路支持。

核心功能包括:

電商鏈接一鍵生成視頻:用戶可通過輸入電商平臺(如 Shopify、Amazon等)商品鏈接,快速生成相關(guān)視頻。

多種視頻生成方式:支持從圖片、腳本、博客內(nèi)容和模板生成視頻,并提供視頻增強(qiáng)功能。這里與視覺大模型不同點(diǎn)在于,布爾向量的成品更像是各類模板視頻、移動相冊圖的排列組合。

提供方便簡潔的視頻剪輯工具。

提供視頻效果分析工具,商家可憑借效果數(shù)據(jù),更好的調(diào)整和優(yōu)化視頻內(nèi)容。

產(chǎn)品優(yōu)勢

場景適配度高:BOOLV專門面向電商用戶。模型本身對電商場景和品類做了微調(diào),在功能上,覆蓋了許多海外電商用戶“生成營銷內(nèi)容場景”。

穩(wěn)定性高:由于視頻依賴于模板和圖片輕微移動、鏡頭平移,布爾向量的視頻穩(wěn)定性和一致性更高。

形式多樣:布爾向量和廣州美院合作,制作了大量針對各類場景,有藝術(shù)氣息的模板,并支持多種元素(如音樂、字幕、特效、貼紙)的組合,使得視頻內(nèi)容更加豐富有趣,效果不單一。

4.2.2 其他同類產(chǎn)品

Creatify:能夠自動分析產(chǎn)品信息,并生成腳本。提供了多樣化的語音選項和數(shù)字人。

特看:不僅提供視頻制作功能,還包含視頻效果數(shù)據(jù)監(jiān)控和各類榜單(如達(dá)人榜、商品榜、視頻榜、話題榜),商家可結(jié)合這些榜單效果,判斷爆款商品、視頻類型。此外,支持AI直播相關(guān)功能。

這類產(chǎn)品由于功能更加豐富,不局限于某一種技術(shù)路線。且覆蓋了出海電商視頻制作中各場景需求,使得電商視頻制作效率大大提升。

4.3 數(shù)字人

Heygen

核心功能包括:

數(shù)字人克?。河脩艨缮蟼髯约旱穆曇艉彤嬅妫瑏砜寺∫粋€數(shù)字化的自己。這使得個人和企業(yè)能快速生成與自身形象相符的數(shù)字人。

允許用戶通過上傳照片,或選擇預(yù)設(shè)模板來生成數(shù)字人。支持語言翻譯,保持口型一致。

優(yōu)勢:

操作簡單快捷:技術(shù)相比視覺大模型來說更成熟,不需要許多后期剪輯技巧,用戶可輕松創(chuàng)建適用各種場景的商業(yè)視頻。

多語言支持和本地化:提供換語言及調(diào)整口型功能,有非常大的用戶群體。本地化的內(nèi)容對營銷效果來說,可以極大的增加可信度和營銷效果。

劣勢:

產(chǎn)品價格高:生成1分鐘的視頻需要2美金。與傳統(tǒng)拍攝方案相比,價格不算高。但由于算力消耗方面的考慮,HeyGen編輯視頻的過程無法預(yù)覽效果,用戶在制作過程中需要反復(fù)調(diào)整,會重復(fù)支付費(fèi)用。

AI感比較明顯:雖然Heygen的產(chǎn)品能力在數(shù)字人領(lǐng)域,已處于領(lǐng)先的狀態(tài),但數(shù)字人技術(shù)的局限性依舊存在,視頻不夠生動、聲音略機(jī)械、肢體動作較少、缺乏情感等等,長時間看到同類視頻后,用戶容易發(fā)現(xiàn)不是真人。對消費(fèi)者來說形式依舊偏單一。

數(shù)字人類產(chǎn)品非常多,包括用D-ID、Elai、奇妙元等。總體而言,通過數(shù)字人技術(shù),可較低成本的,短時間內(nèi)制作出大量營銷視頻,如果視頻中需要人做產(chǎn)品介紹,而商家自己又不想出鏡,是可以大體滿足需求的。

4.4 端到端解決方案

FancyTech

與其他同類產(chǎn)品的不同點(diǎn)在于,不提供視頻生成工具,而是轉(zhuǎn)向提供結(jié)果。FancyTech聯(lián)合創(chuàng)始人Morgan表示,傳統(tǒng)SaaS訂閱費(fèi)并不能免除提供商與客戶持續(xù)互動的責(zé)任,這使得服務(wù)交付成為業(yè)務(wù)的重要組成部分,避免過多的產(chǎn)品定制化。

根據(jù)布爾向量CEO王慶描述:

“現(xiàn)有電商商家主要分為兩類,一類用戶是研發(fā)能力很弱,相對比較傳統(tǒng),但他們業(yè)務(wù)體量可能很大;第二類客戶的話相對比較年輕,然后他們有比較好的研發(fā)能力。這兩類客戶商業(yè)模式不太一樣。

針對第一類客戶來說,他們更多是希望你能做交付。因為缺乏研發(fā)能力,做部署化 SaaS 和交付就會比較好。第二類客戶會更加希望做共創(chuàng)。比如給到 API,在業(yè)務(wù)流的某一個環(huán)節(jié)給到支撐。

FancyTech類的服務(wù),可以滿足第一類客戶的需求。我相信隨著技術(shù)的不斷升級,用戶結(jié)合相應(yīng)產(chǎn)品制作視頻的成本不斷降低,會有越來越多的第二類客戶。

作者:產(chǎn)品經(jīng)理@Sean ,過去4個月,他mapping了行業(yè)內(nèi)所有AI視頻相關(guān)產(chǎn)品和公司。

來源微信公眾號:hanniman

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。

題圖來自Sora生成視頻截圖

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 這篇文章深入探討了AI視頻生成技術(shù)的多種應(yīng)用場景,從普通用戶到專業(yè)視頻制作師,再到B端的電商廣告,分析得很全面。AI視頻的未來看起來真的很令人興奮!

    來自北京 回復(fù)