攻陷直播間的數(shù)字人,天花板在哪里?

3 評論 2708 瀏覽 15 收藏 18 分鐘

隨著AIGC的發(fā)展,數(shù)字人直播市場的熾熱化競爭,其中也包括騰訊、百度、科大訊飛、硅基智能、風(fēng)平智能、閃剪、元分身,APP端秒播、剪映等等眾多互聯(lián)網(wǎng)大廠、創(chuàng)業(yè)公司、老牌AI公司和一些此前做智能客服營銷的數(shù)字服務(wù)商,都在競爭分蛋糕(盡管在后續(xù)的差異化競爭中,各大公司更顯神通,都在找不同業(yè)務(wù)領(lǐng)域的破局機會)。在這繁榮的背后,數(shù)字人領(lǐng)域的相對不透明性成為了備受關(guān)注的焦點。眾多品牌的產(chǎn)品定價和效果充滿變數(shù)。

本篇文章作為一個數(shù)字人從業(yè)者和產(chǎn)品經(jīng)理,總結(jié)沉淀的一些思考。

數(shù)字人賽道的狂飆,從破圈到繁榮,經(jīng)歷過哪些發(fā)展階段?現(xiàn)在他的效果怎么樣?是否解決了企業(yè)帶貨直播的痛點?有什么樣的商業(yè)邏輯?

一、數(shù)字人賽道狂飆:從破圈到繁榮 what/why/how

1.1 什么是數(shù)字人

以最通俗易懂的方式解釋數(shù)字人以及為什么數(shù)字人可以火。數(shù)字人是其外表形象通過2d/3d建模or拍攝等方式上傳/制作形象,通過自然語言驅(qū)動口型/動作/表情 以模擬真實人物互動場景的存在。

某位經(jīng)濟學(xué)家曾提出:人類發(fā)展科學(xué)技術(shù)的目的是:減少浪費。

數(shù)字人的存在就是為了代替企業(yè)在人力成本上的“減少”浪費與效用提升。他是本地生活和AI自然語言能力兩大交叉場景下誕生的數(shù)字衍生品。

1.2 數(shù)字人經(jīng)歷過什么?

數(shù)字人在2020年末到2021年完成技術(shù)基礎(chǔ)積累階段,當(dāng)他剛開始進入到大眾視野時,還是在2021年元宇宙的概念初火時,彼時疫情元年,宅經(jīng)濟甚囂塵上,甚至帶火一批捏臉師,月收入高達4w元。彼時數(shù)字人仍舊停留在形象層面的熱度,其內(nèi)容的背后依舊是昂貴的人工成本。

2022年劉潤年度演講是AI數(shù)字人首次破圈的開始。

劉潤在演講里提到:“以后你閉關(guān)在家里,出差在路上,只要給同事們一段語音,就能驅(qū)動這個數(shù)字人,生成視頻。以后,就讓硅基勞動力,替你工作吧。” 這次的演講,也使數(shù)字人領(lǐng)先者-硅基智能 (創(chuàng)始人:司馬華鵬)吃到了數(shù)字人商業(yè)落地第一波紅利,自媒體從業(yè)者無論是個人或企業(yè)開始用數(shù)字人做短視頻、矩陣號,數(shù)字人搭上紅人經(jīng)濟的列車。

2023年9月Heygen發(fā)布海外影視翻譯作品,讓數(shù)字人再度火爆,也讓Heygen一躍成為了最具潛力的創(chuàng)業(yè)公司。同年heygen創(chuàng)收1800w美元,公司估值達到7500w美元。

2022年6月IDC在報告中寫道,到2026年中國AI數(shù)字人市場規(guī)模將達到102.4億元人民幣

2023年生成式AI熱潮下,數(shù)字人被視作未來使用自然語言與機器交互的入口級產(chǎn)品之一,推動了市場熱度提升。隨著熱度大增,數(shù)字人市場規(guī)??赡軐⒏爝_到這一水平。而今年2月以來,“數(shù)字人”一詞的微信指數(shù)達到了去年十月的幾倍到幾十倍水平。

數(shù)字人的成功是有目共睹的:各大社交媒體網(wǎng)站總是會出現(xiàn)數(shù)字人IP賬號,在經(jīng)濟、醫(yī)療、育兒、旅游、電商等各大行業(yè)數(shù)字人開始代替真人出鏡,不管是做知識付費、私域引流還是電商帶貨、電播達播,數(shù)字人開始頻繁進入人們的生活。

對行業(yè)不了解的人們很難分清,現(xiàn)在在鏡頭前的,到底是真人還是AI產(chǎn)物。

二、數(shù)字人直播

2.1 數(shù)字人直播還有哪些痛點

大廠、創(chuàng)業(yè)團隊、AI公司和一些此前做智能客服營銷的數(shù)字化服務(wù)商都在這一賽道頻繁動作。到2023年年底,已經(jīng)呈現(xiàn)了熾熱化戰(zhàn)況,很多企業(yè)在續(xù)費留存上開始遇到瓶頸,甚至在價格上都開始呈現(xiàn)了內(nèi)卷的趨勢。

當(dāng)下數(shù)字人內(nèi)卷下的廠商必備能力,或通過自研,或通過代理/oem,又或者通過集成第三方能力,拼命打造全流程化的AI數(shù)字人解決方案,又或者尋求差異化競爭,探索破局機會。

在2023年上半年吸引很多KA客戶和smb商家入坑嘗試,打出數(shù)字人+GPT+直播伴侶=印鈔機的廣告,很多廠商吃到了第一波的紅利。

但是,由于當(dāng)前市面上的數(shù)字人建模能力參差不齊,優(yōu)缺點也非常明顯,已經(jīng)逐漸開始面臨續(xù)費率低下的各種問題。那么為了降低直播成本而被制造的“數(shù)字人”,又面臨了哪些困境。

1)服化道、妝造、拍攝–運營成本高,數(shù)字人定制周期長

真實定制數(shù)字人除了跑模型學(xué)習(xí)訓(xùn)練,還需要經(jīng)歷前期的拍攝、妝造、模特培訓(xùn)等,以確保訓(xùn)練數(shù)據(jù)的可用性。

除了數(shù)字人提供商需要有資金和運營能力提供定制服務(wù),這是對直播有著高要求,且對數(shù)字人IP享要求版權(quán)的KA客戶,也需要多套定制數(shù)字人,提高數(shù)字人直播間ip的豐富度。光是定制費用就是很大一筆錢。對于小B商家,則很難承受高昂的定制費用。一旦一個定制ip的長期使用,或者公共模特被多家廠商使用/長期投放,邊際效益遞減。

而對應(yīng)對于數(shù)字人供應(yīng)商來說,1/搭建妝造拍攝團隊提供流程快、效果好的數(shù)字人定制服務(wù) 2/提供豐富形象的ip模特庫;是解決這個問題的兩大挑戰(zhàn)

2)數(shù)字人互動水平不足

一場直播是否可以帶來轉(zhuǎn)化,是品牌商家購買數(shù)字人的核心考量點;在2023年5月,抖音采取了一項重大舉措,封禁了大量數(shù)字人直播間。

這一決定的背后,是抖音作為興趣電商平臺對內(nèi)容質(zhì)量和用戶體驗的高度重視。

數(shù)字人直播雖然具有潛力,但其互動體驗和內(nèi)容質(zhì)量仍存在諸多問題,比如動作場景循環(huán)播放的單一化,口型不標(biāo)準(zhǔn),直播間觀看量和互動量不足,像是一場AI自導(dǎo)的無聊脫口秀,不利于提升用戶黏性和轉(zhuǎn)化率。

也因此,AI直播在抖音電商碰了壁,越來越多的商家傾向于使用數(shù)字人ip形象,而背后是直播運營麥克風(fēng)實時驅(qū)動的方式,來進行一場數(shù)字人直播,以防止被封禁。

也因此,許多數(shù)字人直播開始轉(zhuǎn)向淘寶等貨架電商平臺。

那在貨架電商AI直播就可以帶來可觀的收入嗎?

與真人直播相比,數(shù)字人直播的差距明顯。互動體驗的維護成本仍然主要依賴人工,技術(shù)只是一個輔助工具。去掉了主播這個角色之后,數(shù)字人直播運營,制作一個直播間,需要準(zhǔn)備的東西太多,又尚且達不到主播的應(yīng)場能力。經(jīng)常會出現(xiàn)直播間彈幕無人回復(fù),或者回復(fù)的文案千篇一律,又或者答不到點子上。

其次一個數(shù)字人直播場控如果要同時控制多個直播間,并不能有效地觀察到每個直播間的互動情況,而對于部分小B客戶,連場控這個角色都沒有,互動水平就成了薛定諤的貓……

對于KA品牌而言,一個數(shù)字人直播間的品質(zhì)直接關(guān)系到品牌形象和用戶信任度,而其用戶信任度又反過來反哺數(shù)字人直播間。好的品牌信任度在數(shù)字人直播間的復(fù)購率遠(yuǎn)遠(yuǎn)高于普通商家。

對于中小商家來說,他們?nèi)狈μ烊坏钠放苾?yōu)勢和直播經(jīng)驗,因此數(shù)字人直播的投入產(chǎn)出比變得更加關(guān)鍵。高昂的成本,和較低收入的數(shù)字人直播間,自然而然難以為繼。

所以一些數(shù)字人供應(yīng)商通過增設(shè)客戶成功經(jīng)理等方式來提高轉(zhuǎn)化率和續(xù)費率,但這也需要大量的團隊建設(shè)成本。

綜上數(shù)字人直播雖然是直播間的一個外殼,但其關(guān)鍵在于如何借助大模型能力提供高質(zhì)量的互動體驗,提升直播間的內(nèi)容豐富度和互動回復(fù)準(zhǔn)確性,是當(dāng)前的一大卡點。

3)數(shù)字人直播在高客單價品牌的貢獻有其局限性

隨著數(shù)字人逐漸進入各大電商平臺,用戶發(fā)現(xiàn)大多數(shù)數(shù)字人的外觀和聲音都越來越逼真,但它們的動作、表情和姿勢的一致性和重復(fù)性往往讓人很容易識別出它們是數(shù)字人而非真人。

最近,劉強東克隆了自己的數(shù)字人,在直播間吸引了2億觀眾,但許多觀眾評論說效果仍然突兀,很容易看出是假的。

數(shù)字人和真人直播間的效果存在很大差異,轉(zhuǎn)化率也遠(yuǎn)不如真人直播間高,甚至只有真人直播間的一半。

對于對直播觀看體驗要求較高的年輕用戶來說,他們可能會很快流失,或者只是為了領(lǐng)取優(yōu)惠券而參與觀看。然而,對于對數(shù)字人認(rèn)識不深的中老年或三四線城市用戶來說,他們可能仍然對數(shù)字人直播有興趣。

曾經(jīng)跟一個長期深耕直播領(lǐng)域的品牌主播調(diào)研了解道:“對于很多百元以上的商品,尤其美妝、家電等垂直領(lǐng)域,新用戶如果不是因為提前對產(chǎn)品有了解,提前對品牌有了解,是不太可能通過數(shù)字人直播進行下單的。因為產(chǎn)生新的購買行為,需要在直播間進行多輪的互動來進行了解一個商品,但是目前很多數(shù)字人廠商提供不了深度對話的AI數(shù)字人直播軟件。那這個時候,利用數(shù)字人在非高峰期直播,提高品牌復(fù)購,讓已經(jīng)了解品牌的用戶用合適的價格參與活動,也可以幫助品牌達到目標(biāo)”

4)差異化運營和同質(zhì)化競爭

數(shù)字人市場的白熾化,也迫使很多商家在尋求破局機會,各顯神通。

數(shù)字人底層技術(shù)多數(shù)來源于國外開源模型,從結(jié)果來講,數(shù)字人的動作、口型、語音互動,其實已經(jīng)區(qū)域同質(zhì)化,幾乎沒有差別。一個數(shù)字人的情緒和能量有多大,取決于定制數(shù)字人定制時拍攝模特的狀態(tài),而行為表情豐富的數(shù)字人也并不具備復(fù)用性。

為了解決數(shù)字人疑似錄播,手勢動作單一的問題,小冰數(shù)字人打造了動作庫;但是維護成本、定制成本、后期配置成本也很高,為了能保證動作的前后連貫性,反而限制了ip角色動作幅度。

同時,其他AI數(shù)字人平臺也開始大力出奇跡,秒播作為一款A(yù)PP端的數(shù)字人,瞄準(zhǔn)了各大電商平臺的小B用戶,打造AIGC生成式直播間概念,一鍵導(dǎo)入直播間商品就可以60s快速生成,其本質(zhì)是通過爬蟲+大語言模型的能力,快速生成直播間文案與互動。

對于沒有臺式設(shè)備的小商家而言,要求低、準(zhǔn)入門檻低、操作成本低,產(chǎn)品一面市就獲得了700萬美元的融資。

我們發(fā)現(xiàn),數(shù)字人卷到現(xiàn)在,她的外在形象、口型合成、直播背景模版等等,都已經(jīng)趨于同質(zhì)化,但是從應(yīng)用層上來說,如何設(shè)計和運營,想清楚用它干什么,讓軟件工具代替人工發(fā)揮應(yīng)有的價值,決定了他的商業(yè)化的程度。

三、常見的AI數(shù)字人商業(yè)模式

當(dāng)前數(shù)字人直播間的商業(yè)模式

1)品牌客戶、KA:

高客單價+團隊陪跑,提供全套式解決方案,打造質(zhì)量上乘的數(shù)字人直播間。

一般網(wǎng)紅ip不太會復(fù)刻數(shù)字人進行高頻直播,對其觀眾好感度會有負(fù)面影響。一般此類直播間都用于進行非高峰期直播,提升品牌復(fù)購

2)中小B商家:購買軟件使用、數(shù)字人定制和增值產(chǎn)品,自建團隊自行運營;或者采用更加低廉,無需固定設(shè)備的AIGC生成式直播工具,如秒播

對數(shù)字人口型和形象等要求不嚴(yán)格,同樣希望拉滿24小時直播,但是價格會更加低廉,門檻更低。甚至可以達到全24小時無場控自動播。

3)有一些提供硬件直播工具的供應(yīng)商-提供輕量化直播設(shè)備,也會接入數(shù)字人,作為軟硬件產(chǎn)品的衍生功能,提高產(chǎn)品價值

4)提供數(shù)字人定制、語音交互定制、2D/3D渲染等數(shù)字人組件服務(wù),成為數(shù)字人直播供應(yīng)商的底層技術(shù)引擎供應(yīng)商。

當(dāng)然除了直播場景,即創(chuàng)/剪映等TO C端APP也在同樣提供數(shù)字人短視頻的創(chuàng)作工具。成本更低廉,吸納了一大波中小B商家采用更加低成本的方式,進行“數(shù)字人直播”或者“錄播”。

四、AIGC浪潮下,數(shù)字人供應(yīng)商可以做哪些事情

個人以為,AI直播最重要的是凸顯“帶貨”的場域,和互動解答的能力。

我們可以去反思這些問題,他們沒有答案,只是作為拋磚引玉的思考:

  1. AI直播一定需要數(shù)字人嗎?對于很多店播、展播等場景,直播甚至都不需要有“人”出境,或者說,不再作為直播的主角,直播只不過套著AI直播的軀殼。對于直播商戶來說,提供真實的商品鏡頭、店銷鏡頭、展廳鏡頭配合AI敘事,用AI講好故事,以商品為核心,以人為輔。把“千篇一律”形象弱化,把有趣的AI靈魂強化,可以嘗試打造一場真正意義上AI直播
  2. 數(shù)字人只是套殼,注入靈魂的交互能力才是AI的本質(zhì)。隨著大模型的流行,數(shù)字人互動可以不再依賴NLP,需要大力維護的人工智障互動模式,嘗試使用RAG檢索增強,搭建企業(yè)智囊知識庫,應(yīng)對直播間復(fù)雜的問答模式。
  3. 當(dāng)產(chǎn)品出現(xiàn)同質(zhì)化競爭,通過生成式人工智能搭建帶貨場景下的產(chǎn)品矩陣,用需求帶動需求,帶貨場景不僅僅是數(shù)字人直播;圖文帶貨、短視頻帶貨、商品圖生成、智能文案AIAgent、AI智能成片、視頻翻譯等等;當(dāng)產(chǎn)品可以在帶貨領(lǐng)域搭建自己的品牌壁壘,是否可以降低獲客成本,在這一片AI競爭的紅海里保持技術(shù)優(yōu)勢呢?
  4. 做寬AI帶貨場景的產(chǎn)品矩陣以外,同時做深一些組件化的產(chǎn)品技術(shù)供應(yīng),如直播場景下優(yōu)越的文案設(shè)計模型接口、互動能力接口,成為AI直播的“靈魂供應(yīng)商”同樣不失為一個好的商業(yè)模式

本文由 @Meyssan 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 數(shù)字人不就是賽博“人設(shè)”嗎,看過一些游戲直播,主播不露臉但是露數(shù)字人。

    來自廣東 回復(fù)
  2. 感覺數(shù)字人的天花板在內(nèi)容和情緒價值上,很多時候,用戶如果只是購物的話,用數(shù)字人很有用,但是沒有話題,沒有用戶積累,就像散裝商鋪一樣,沒有品牌,感覺是一個高效的將有用的東西買個有需要的人的工具(個人思考)

    來自四川 回復(fù)
  3. AIGC的市場規(guī)模將越來越宏大,但在某些特定區(qū)域也是有其局限性的。

    來自浙江 回復(fù)