用一篇文章,幫你了解什么是虛擬數字人?
編輯導讀:洛天依的出現和爆火,讓很多人看到了虛擬偶像的廣闊市場。不僅如此,虛擬主播、虛擬員工等數字人不斷涌現,在代替人類從事某些行業的同時也引發了一些爭議。本文作者圍繞“數字人”進行分析,希望對你有幫助。
大家好,我是Clippp。今天為大家分享的是「虛擬數字人」。這段時間元宇宙概念的大火帶動了很多人對未來的無限遐想,與元宇宙緊密相關的虛擬數字人的熱度也在提升。
現在網絡上經常出現各式各樣的數字人,虛擬偶像、虛擬主播層出不窮,當然伴隨著數字人一同出現的還有各種爭議。
今天我們就來一起探究虛擬數字人是什么、具有哪些特征,分為哪幾種類型以及都應用在什么行業,深入地了解虛擬數字人概念。
一、數字人的三方面特征
虛擬數字人是指具有數字化外形的虛擬人物。與具備實體的機器人不同,虛擬數字人依賴顯示設備存在,我們所知的很多虛擬人都要通過手機、電腦或者智慧大屏等設備才能顯示。
虛擬數字人宜具備以下三方面特征:
- 一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;
- 二是擁有人的行為,具有用語言、面部表情和肢體動作表達的能力;
- 三是擁有人的思想,具有識別外界環境、并能與人交流互動的能力。
綜合來看,就是具備四方面的能力,即形象能力、感知能力、表達能力和娛樂互動能力。
如果我們下次再看到有公司推出數字人,就可以結合這些特征和能力來判斷這個數字人的可信度,避免被借勢營銷的企業鉆了空子。
二、數字人的運作原理
知道了什么是數字人,接下來就要搞清楚數字人到底是怎么說話、互動的,是背后有真人在操控,還是完全通過技術生成。
面對新興的數字人,相信很多讀者都存在類似的疑問。
數字人的誕生發展和AI人工智能可以說是密不可分,想了解數字人的運作原理,首先要知道數字人的通用系統框架。
虛擬數字人系統一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構成。(資料參考:2020年虛擬數字人發展白皮書)
交互模塊為擴展項,根據其有無,可將數字人分為交互型數字人和非交互型數字人。
首先看一下非交互型數字人:系統依據目標文本生成對應的人物語音及動畫,并合成音視頻呈現給用戶。
交互型數字人
根據驅動方式的不同可分為智能驅動型和真人驅動型。
?智能驅動型數字人
通過智能系統自動讀取并解析識別外界輸入信息,根據解析結果決策數字人后續的輸出文本,驅動人物模型生成相應的語音與動作來使數字人跟用戶互動。
這種人物模型是預先通過AI技術訓練得到,可通過文本驅動生成語音和對應動畫,業內將此模型稱為TTSA(Text To Speech & Animation)人物模型。
真人驅動型數字人
真人根據視頻監控系統傳來的用戶視頻,與用戶實時語音,同時通過動作捕捉采集系統將真人的表情、動作呈現在虛擬數字人形象上,從而與用戶進行交互。
三、數字人常見的類型
調研分析當前市場上的數字人,根據人物圖形維度,分為2D和3D兩大類,從外形上可分為卡通、寫實等風格,綜合來看可分為二次元、3D卡通、3D高寫實、真人形象四種類型。
接下來根據每種類型的特點,從外在形象、服飾裝扮、表情動作等方面,結合典型案例來逐一分析虛擬數字人的設計。
1. 二次元類型
虛擬歌手-洛天依
洛天依的職業設定為虛擬歌姬,個性軟萌可愛、溫柔細膩,外貌特征上是灰發、綠瞳,頭戴碧玉發飾。
▲除了獨特的形象和性格,洛天依還能唱歌、跳舞、直播帶貨,多樣的才藝加持讓人物設定不單薄,受到很多用戶的關注。
2. 3D卡通類型
虛擬助理-度曉曉
度曉曉是基于虛擬人IP的陪伴型虛擬助理。在小度助手的能力基礎上,度曉曉有虛擬人物形象和情感交互系統,具備視覺識別能力,支持自然的交流方式。
▲在外形裝扮上,度曉曉是紅色短發的甜美可愛風,五官比例偏向二次元風格。根據現有案例來看,度曉曉在眨眼、微笑等面部微動作以及肢體的造型,都很自然、生動,整體設計效果相對較好。
▲度曉曉定期更新身穿不同主題服裝、擺著各種pose的形象,每套服裝都有一個主題再帶配上各種周邊小配飾,營造出一種清新時尚的效果。
3. 3D高寫實類型
浦發銀行數字員工-小浦
小浦作為銀行的數字員工,主要進行風險評估、要聞播報、投資建議等在線服務。
▲從外觀上,小浦在形象上無論發型還是五官都足夠擬人化、職業化,穿著銀行職業裝,屬于比較典型的銀行職員形象。
▲小浦沒有很夸張的面部表情,始終以面帶微笑的狀態面向用戶,給人一種親切感。肢體動作相對較少,沒有特別夸張的動作設定,只有固定的幾套動作。
4. 虛擬偶像-AYAYI
AYAYI是使用Unreal引擎造出來的特別擬真的Metahuman形象。
▲外在形象:寫實程度更高,人物整體效果已經和真人十分接近,五官特別精致、眼瞼微斂、銀色短發,散發著一種清冷氣質。
▲從AYAYI社交賬號的更新來看,目前主要是分享一些AYAYI的擺拍圖片,穿著的服裝、飾品都比較真實、時尚,拍照環境都是休閑、藝術類的場景。
▲ AYAYI人物形象的時尚感和真實感,更容易切入商業化,比如穿著特定品牌的服裝進行擺拍。
高保真數字人-Siren(塞壬)
Siren是高保真、實時、可交互數字人,用到了實時渲染、表情捕捉、動作捕捉、高保真3D掃描等前沿技術,達到了目前業界最高的技術水平。
▲Siren的面貌細節更加真實,可以很清楚看到皮膚的細節、眼睛的轉動、說話的神態、臉上各種各樣的細紋。不管是毛孔、細紋等皮膚質感,還是神態上的表情,都很像真人。
▲Siren在說話時嘴唇動作自然,效果真實。之所以有的數字人看起來不自然,很大一部分原因是因為數字人面部表情不生動,特別是在說話時嘴唇和臉部、牙齒甚至舌頭的聯動,很容易出現動作不聯動、不真實的情況。
5. 真人形象類型
新華社AI合成主播-新小浩
“新小浩”是無論外在形象、面部表情、服裝搭配、說話聲音,還是肢體動作上,都是完全基于真實主持人生成。
通過語音合成、唇形合成、表情合成以及深度學習等技術,克隆出具備和真人主播一樣播報能力的“AI 合成主播”。
▲我們每天都會遇見各種各樣的人,即使臉上最細微的表情,我們都可以感知到,用計算機打造出來的表情,往往缺乏靈氣。
真人形象的虛擬主播的優勢在于,他的特征都是來源于真人,呈現的面貌和狀態更容易被用戶了解。如果不仔細看,可能分辨不出是不是真人。
四、數字人的應用場景
目前國內市場上已經出現了非常多的虛擬數字人,在各行各業中有著廣泛的應用。
虛擬數字人技術結合實際應用場景領域,切入各類,形成行業應用解決方案,賦能影視、傳媒、游戲、金融、文旅等領域,根據需求為用戶提供定制化服務。
按照應用場景或行業的不同,已經出現了娛樂型數字人,如虛擬偶像、歌手、網紅、虛擬代言人等;
助手型數字人,如虛擬客服、虛擬導游、智能助手。
主播型數字人,如虛擬主播、虛擬支持人等。
這里搜集的案例只是虛擬數字人的應用的一小部分,還有很多優秀的應用案例等待著大家去一起發現。
五、代表性的研發平臺
國內有很多互聯網平臺在研發虛擬數字人,我也從中收獲了大量的信息和資料,這次把這些平臺分享給大家:
- 搜狗AI開放平臺
- 網易伏羲、網易易現
- 百度AI開放平臺
- 騰訊云、騰訊NEXTStudios
- 訊飛開放平臺
如果大家想了解更多關于AI人工智能、數字人和最新科技的發展,可以去這些平臺學習~
慢慢來比較快,希望對你有所幫助!
#專欄作家#
作者:Clippp,微信公眾號:Clip設計夾。每周精選設計文章,專注分享關于產品、交互、UI視覺上的設計思考。
本文原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
你好像什么都說了,又好像什么都沒說