AI虛擬人冷思考:是代替人類,還是人類用它賺錢?
隨著AI人工智能技術(shù)的不斷發(fā)展,虛擬人的產(chǎn)業(yè)正在逐步崛起,在這個發(fā)展迅猛的時代,AI克隆人、虛擬角色等形式的虛擬人開始走進(jìn)我們的生活,成為人們?nèi)粘=涣?、娛樂的新方式。不過“AI+虛擬人”的應(yīng)用前景雖廣闊,但同時也面臨著眾多挑戰(zhàn)和風(fēng)險。本文將圍繞著虛擬人產(chǎn)業(yè)的發(fā)展方向、機(jī)會及風(fēng)險等方面展開探討,一起來看。
1903年,園藝學(xué)首先發(fā)明了“克隆”這個詞匯,100年后,不僅植物可以克隆,羊可以克隆、猴子也可以克隆,甚至人也可以被克隆了。
只是礙于倫理問題,克隆人的研究一直被限制。最近,隨著AI的火熱,AI克隆人出現(xiàn)了。微軟小冰推出的AI克隆人,就像一個真實(shí)存在的網(wǎng)友,“他”有自己的朋友圈,可以陪你文字聊天,語音聊天,甚至還能視頻聊天。
再往前,AI燕姿翻唱了《發(fā)如雪》,一夜之間爆火全網(wǎng),燕姿本人稱自己的粉絲已改換門庭。
其實(shí),早在1927年,無聲電影《大都會》中就出現(xiàn)了電影史上第一個AI虛擬角色——機(jī)器人瑪利亞,后來的米老鼠、日本的動漫,人們就用手繪動畫的方式展現(xiàn)二維虛擬形象。
只是,當(dāng)時由于技術(shù)還不成熟,虛擬人的應(yīng)用還處于萌芽階段,后來隨著計(jì)算機(jī)視覺和動捕技術(shù)的出現(xiàn),虛擬逐漸進(jìn)入到探索階段,如今隨著AI時代的到來,虛擬人開始真正走進(jìn)我們的生活。
無論是簡單的產(chǎn)品咨詢,還是直播行業(yè)、影視行業(yè),虛擬人看起來正在替代人類。那么,AI對虛擬人產(chǎn)業(yè)會帶來哪些改變?虛擬人產(chǎn)業(yè)的機(jī)會和風(fēng)險有哪些?虛擬人是不是一門好生意?
一、AI技術(shù)重塑虛擬人
2022年7月12日,火了10年的虛擬偶像洛天依,第一次通過AI發(fā)聲:“唱響你心中的歌,我是虛擬歌手洛天依?!?/p>
這標(biāo)志著,AI重塑虛擬偶像的時代正在到來。
2000年,電影《最終幻想:靈魂深處》首次用計(jì)算機(jī)視覺(CG)和動作捕捉技術(shù),設(shè)計(jì)了三維虛擬形人。
當(dāng)時的虛擬人主要是由真人通過動作捕捉驅(qū)動動畫形象,2016年底,號稱全球首位虛擬主播,4個月吸粉40萬,在Youtube開設(shè)“A.I.Channel”頻道的虛擬主播,依舊是使用真人驅(qū)動的虛擬偶像。
直到2018年,新華社聯(lián)合搜狗公司推出的全球首位3D版AI合成主播“新小微”,AI對虛擬人的改變才開始進(jìn)入爆發(fā)期。
AI對虛擬人的改變包括外觀形象、行為表達(dá)、思想交互三個方面。
第一,AI對虛擬人外觀形象方面的改變,在于傳統(tǒng)的3D建模需要人通過軟件設(shè)計(jì)一個形象,而AI生成是通過算法和以往數(shù)據(jù)而生成的3D形象。
比如新華社的“新小微”就是以其職員趙琬微為原型,首先通過幾百個攝像頭對趙琬微身體部位360度全方位掃描,并對其多種形態(tài)的表情和動作進(jìn)行捕捉記錄。然后再對“新小微”的各個部位和表情進(jìn)行了模塊化處理,像拼樂高一樣重新組裝。
最后通過算法實(shí)現(xiàn)驅(qū)動和渲染構(gòu)建出來的虛擬人模型,做到表情、唇動、肢體動作和語言表達(dá)的高度契合。
第二,行為表達(dá)方面,AI通過語音合成技術(shù)取代傳統(tǒng)真人配音模式,由AI直接生成語音,包括唱歌、新聞播報、演講、朗讀等等應(yīng)用場景。
AI燕姿的爆火,就離不開2021年韓國科學(xué)院發(fā)布的開源AI語音合成模型VITS,在該語音模型基礎(chǔ)上開發(fā)的so-vits-svc項(xiàng)目,通過對燕姿歌曲、采訪等聲音的訓(xùn)練,就有了AI燕姿。
第三,思想交互方面,大模型的出現(xiàn),讓AI通過大量人類數(shù)據(jù)集的訓(xùn)練,思考和回答更接近人類,使虛擬人的交互更像人。
比如制作游戲的軟件Unreal Engine基本上實(shí)現(xiàn)虛擬人從“很像”到“很真”的跨越。4月,一款基于ChatGPT制作的游戲——《生成智能體:人類行為的交互式模擬》上線。
網(wǎng)易旗下開放世界武俠手游《逆水寒》讓智能NPC和玩家自由生成對話,并基于對話內(nèi)容,游戲中的人物自主給出行為反饋。
再就是微軟小冰,基于小冰框架開發(fā)的AI克隆人,第一批網(wǎng)紅半藏森林入入駐,不同的用戶聊天內(nèi)容不同,回復(fù)的內(nèi)容也不相同,更像是真人的交互。
二、誰能用虛擬人賺錢?
不僅僅是網(wǎng)易、微軟小冰,虛擬人世界還有更多的玩家。
6月6日,2023蘋果開發(fā)者大會在蘋果飛船總部大樓舉辦,大會上蘋果發(fā)布的混合現(xiàn)實(shí)(MR)頭盔,再次將人們的視野帶向元宇宙。隨著AI等技術(shù)的進(jìn)步,元宇宙世界離我們越來越近。
虛擬人是元宇宙的構(gòu)成要素和交互載體,作為真實(shí)人類的映射,虛擬人是運(yùn)用動作捕捉、AI等技術(shù)復(fù)制真人(數(shù)字孿生)形象,以便在元宇宙當(dāng)中,實(shí)現(xiàn)虛擬與現(xiàn)實(shí)的更強(qiáng)交互,具備更好的現(xiàn)實(shí)感。
當(dāng)前虛擬人產(chǎn)業(yè)鏈可分為三層,分別是基礎(chǔ)層、平臺層和應(yīng)用層。
基礎(chǔ)層提供基礎(chǔ)硬件和軟件支撐,比如顯示設(shè)備VR/AR眼鏡、建模軟件、渲染引擎。
基礎(chǔ)層做得好的多是國外的公司,比如Unity引擎,不僅可以做虛擬人,還能進(jìn)行動畫、游戲等的支持,很多熱門游戲是通過Unity引擎開發(fā)完成的。
平臺層主要包括AI廠商和綜合性互聯(lián)網(wǎng)廠商等技術(shù)支持企業(yè)。
平臺層企業(yè)是對基礎(chǔ)層的軟硬件技術(shù)運(yùn)用,并結(jié)合AI、計(jì)算機(jī)視覺(CG)等虛擬數(shù)字人技術(shù),為應(yīng)用層提供進(jìn)一步技術(shù)支持和解決方案。
比如商湯、云從、依圖和曠視等AI四小龍,還有在語音識別領(lǐng)域做得比較好的科大訊飛。其他的還有像微軟、騰訊這樣提供一站式解決方案的企業(yè)。
這次虛擬半藏森林的開發(fā)公司——小冰,就是平臺提供商,同時也是應(yīng)用層的提供商。
應(yīng)用層的企業(yè)是將虛擬數(shù)字人技術(shù)與傳統(tǒng)行業(yè)進(jìn)行融合,實(shí)現(xiàn)對傳統(tǒng)行業(yè)的改造。比如虛擬主持人、虛擬客服等。
從商業(yè)化和應(yīng)用場景來看,虛擬人可以分為內(nèi)容/IP型、功能服務(wù)型、虛擬分身型3類。
內(nèi)容/IP型虛擬人,比如2021年爆火的虛擬美妝達(dá)人柳夜熙,這類虛擬人主要應(yīng)用于影視、文娛、市場營銷等場景,功能服務(wù)型虛擬人主要應(yīng)用于行業(yè)服務(wù)場景,比如電商的虛擬客服,這兩種類型虛擬數(shù)字人更多是面向B端。
虛擬分身類型數(shù)字人除了面向B端的應(yīng)用,也面向C端,比如著名的咨詢專家劉潤,就定制了自己的虛擬形象,分身可以代替他進(jìn)行直播等工作。
變現(xiàn)的機(jī)會分為兩種,利用數(shù)字人形象進(jìn)行淘金的、向淘金者出售鏟子的。
劉潤的數(shù)字分身就屬于第一種,可以讓數(shù)字分身承擔(dān)工作,創(chuàng)造收益;樂華娛樂旗下虛擬偶像女團(tuán)A—SOUL也屬于第一種,虛擬偶像女團(tuán)和真實(shí)的偶像女團(tuán)一樣,也可以通過向普通粉絲出售門票、周邊賺錢。
柳夜熙背后的創(chuàng)壹科技,既利用柳夜熙的直播和視頻獲取收益,同時也是個賣鏟子的。柳夜熙背后就有著150人技術(shù)驅(qū)動的中臺和強(qiáng)大的內(nèi)容戰(zhàn)略。
創(chuàng)壹科技,也曾憑借控雨的創(chuàng)意,創(chuàng)造出了爆火的素材,可供抖音龐大的其他用戶使用,截至2021年6月,排抖音特效使用榜單前十。
現(xiàn)在,虛擬數(shù)字人越來越智能化、形象化,應(yīng)用也更普遍,那么虛擬數(shù)字人是不是一門好生意?
三、虛擬數(shù)字人是不是一門好生意?
虛擬人的應(yīng)用尚處于發(fā)展早期,未來發(fā)展迅速幾乎是確定的方向。
艾瑞咨詢的研究報告顯示,2022年中國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1866.1億元和120.8億元,預(yù)計(jì)2025年分別達(dá)到6402.7億元和480.6億元,呈現(xiàn)強(qiáng)勁的增長態(tài)勢。
目前,很多公司也的確因?yàn)樘摂M人的應(yīng)用獲得了可觀的收益。
2020年11月,A-SOUL火了之后,樂華娛樂的泛娛樂業(yè)務(wù)收入從2020年的2110萬元增長至2021年的3790萬元,主要原因便是虛擬藝人組合A—SOUL的商業(yè)發(fā)展產(chǎn)生的收益,A-SOUL還推動了樂華泛娛樂業(yè)務(wù)毛利率大幅轉(zhuǎn)正。
小冰公司推出的AI克隆人,付費(fèi)模式有兩種:一種是“情感模式”是72元/年,可與克隆人語音通話、朋友圈互動;另一種是“超級模式”,360元/年,克隆人會成為用戶的辦公伙伴,提供撰寫文案等服務(wù)。
以“半藏森林”為例,如果有1萬個用戶付費(fèi),如果全部選擇情感模式,相當(dāng)于“半藏森林”克隆人一年收入72萬元;如果選擇超級模式一年則可收入360萬元。
國外類似半藏森林的商業(yè)模式,今年5月2日,國外網(wǎng)紅Caryn Marjorie與初創(chuàng)企FV(Forever Voice)合作推出Caryn AI,是粉絲的“虛擬女友”。
Caryn預(yù)計(jì),AI版本的自己能讓她收入翻60倍,年入6000萬美元(約4.16億元人民幣)。
金礦很大,但錢不一定好撈。
先說明一下,這里要討論的不是基礎(chǔ)層的一些大企業(yè),對他們而言,自身技術(shù)突破是戰(zhàn)略,不會用短期能否有較好的變現(xiàn)模式和變現(xiàn)空間來衡量,更多的是針對平臺層的部分公司以及對虛擬人的應(yīng)用上。
第一,成本比較高,但收益不具有確定性。
B端需要的虛擬人,一般是用來代替人工作的,比如虛擬主播,本意是拉長直播時間、減少人力成本。
不過,就當(dāng)前的AI技術(shù)而言,尚不能做到與真人無異,很多從事直播業(yè)務(wù)的人說數(shù)字直播間的流量不好?!侗儭返囊黄恼路Q,美ONE(李佳琦公司)工作人員表示,數(shù)字人會影響直播互動,這是直播最大的優(yōu)勢。
想讓數(shù)字人更接近于真人,就需要花更多的錢,比如劉潤的數(shù)字分身成本在百萬元級別。
優(yōu)質(zhì)的數(shù)字人還需要高額的運(yùn)營成本,就像上文提到的需要超過百人的創(chuàng)意團(tuán)隊(duì),從2021年爆火到現(xiàn)在,柳夜熙在抖音的作品不過41個,第一條短視頻的制作成本就高達(dá)幾十萬元。
除了工具類型的,還有情感陪伴類型的虛擬人,超級模式下的虛擬半藏森林屬于二者結(jié)合。
不管是半藏森林還是Caryn,在推出虛擬人之前就已經(jīng)是知名人士,這并不好模仿。這一類數(shù)字人還面臨的風(fēng)險在于用戶新鮮感喪失。
人們忠誠于一段關(guān)系,或是因?yàn)槔?,或是因?yàn)橹救は嗤?,或是怕被譴責(zé),再或者別無選擇。而當(dāng)以知名人物為原型的虛擬人足夠多時,人能合理合法地?fù)碛袩o限的情感資源時,忠誠自然也就被拋之腦后了。
清華大學(xué)在《元宇宙發(fā)展研究報告3.0》中也表示,由于虛擬人成本高,如果后期運(yùn)營乏力,將出現(xiàn)熱度衰退、用戶新鮮感喪失等問題,IP價值就會出現(xiàn)回落。
第二,存在監(jiān)管和法律風(fēng)險。
比如侵權(quán)問題。近期爆火的AI燕姿,專家提出對于肖像權(quán)、著作權(quán)、數(shù)據(jù)權(quán)等,AI燕姿都可能會涉及侵權(quán)。
比如詐騙問題。近期,內(nèi)蒙古包頭警方就通報了一起案件,騙子通過AI換臉和擬聲技術(shù),佯裝熟人實(shí)施詐騙,福州市某公司法人代表郭先生10分鐘內(nèi)被騙430萬元。
隨著技術(shù)的發(fā)展,更像人的虛擬數(shù)字人可能成本更低,更加適配的法律和監(jiān)管細(xì)則也會出臺,虛擬人產(chǎn)業(yè)會更加規(guī)范地發(fā)展,但在目前看來,成本和收入還談不上對等。
參考文獻(xiàn):
[1]《2022虛擬人應(yīng)用場景與實(shí)踐報告》 ,甲子光年智庫;
[2]《傳媒:虛擬數(shù)字人+AI,產(chǎn)業(yè)加速度》, 華泰證券;
[3]《A-SOUL團(tuán)隊(duì)首次接受獨(dú)家專訪:這個行業(yè)沒有NG的機(jī)會》,36氪專訪;
[4]《紅星獨(dú)家對話創(chuàng)壹科技謝多盛:揭秘柳夜熙們的誕生與未來》,紅星視頻;
[5]《數(shù)字人“黑洞”:花100萬造人,花800萬運(yùn)營》,甲子光年;
[6]《代理數(shù)字人年入百萬?真商機(jī)還是「割韭菜」》,豹變;
[7]《虛擬數(shù)字人專題研究:長短期展望,IP與賦能》,安信證券
作者:武占國;編輯:賈樂樂
來源公眾號:市值榜(ID:shizhibang2021),資本與商業(yè)研究。
本文由人人都是產(chǎn)品經(jīng)理合作媒體@市值榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!