越來越像“人”的數(shù)字人——形象介紹以及發(fā)展趨勢展望

0 評論 4081 瀏覽 12 收藏 19 分鐘

虛擬數(shù)字人在各行業(yè)里的應用已經(jīng)越來越廣泛,那么隨著技術(shù)越來越成熟,數(shù)字人未來的形象及發(fā)展,可能呈現(xiàn)怎樣的趨向呢?這篇文章里,作者圍繞數(shù)字人做了介紹和分析,不妨來看一下,或許可以幫你更加了解這一概念背后的圖景。

隨著數(shù)字人的熱度越來越高,各行業(yè)運用的應用場景越來越豐富,數(shù)字人也越來越被大眾所知曉。特別是2022年下半年到2023年,比如北京冬奧會的開幕式表演、氣象播報、手語解說中頻頻現(xiàn)身;數(shù)字人主播在電視臺中的主持。

各種晚會與明星互動表演:2022年江蘇衛(wèi)視跨年晚會舞臺上,“虛擬鄧麗君”便與周深共同完成了《大魚》、《小城故事》和《漫步人生路》三首歌曲的合唱;2022年5月18日,首個文博界虛擬宣推官文夭夭:唐代花鈿妝容,雙髻丸子頭,著一襲淡雅長裙,腰系唐朝花鳥鏤空香熏球。

本文就數(shù)字人的形象類型、不同類型的制作周期與限制條件、普及程度與大眾認知程度、運用的優(yōu)劣勢以及未來發(fā)展的趨勢這些維度就個人的見解與各位分享。

首先簡單介紹一下什么是數(shù)字人:

虛擬數(shù)字人指存在于非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物。

市面上也多將其稱為虛擬形象、虛擬人、數(shù)字人等,代表性的細分應用包括虛擬助手、虛擬客服、虛擬偶像/主播等。

一、數(shù)字人類型

1. 行業(yè)內(nèi)根據(jù)虛擬數(shù)字人的角色形象一般分類主要有以下類型

其中在目前的運用中,較為常見的有2D真人、2D卡通、3D卡通、3D寫實、3D超寫實這5個類型。

2D真人:通過真人在專業(yè)錄影棚錄制的視頻再加AI訓練而成;用戶也可以通過圖片把用戶的外觀特征再加AI訓練而成。其表情神態(tài)、肢體動作等堪比真人效果——目前很多人可能接觸到的是抖音、淘寶等直播電商平臺上,有很多此類型數(shù)字人。

2D卡通:通過 2D 建模生成,具有非常強的可塑性。如世界第一虛擬偶像日本夢幻歌姬“初音未來”的形象、洛天依等?!壳捌鋵嵲谶\用層面上,已經(jīng)不是很常見了。

3D卡通/3D寫實:通過高精度原畫設計、高寫實 3D 建模、高水準的虛擬人引擎導入、高精度動作捕捉、最后完成精致的修幀渲染方能完成。——隨著GPU以及算力的發(fā)展,目前越來越高進度的3D數(shù)字人運用在APP/小程序/機具終端上。

3D超寫實:超寫實是指人物外觀仿真度高,栩栩如生,這種虛擬人需要面部面數(shù)在1萬面以上,高精度經(jīng)得起360度無死角的懟拍。面部材質(zhì)不僅十分接近真實皮膚的質(zhì)感,還可以根據(jù)相機的距離進行自動優(yōu)化,皮膚、五官、頭發(fā)、肢體幾近真人。如Ling、柳夜熙等——目前更多的還是運用在最為獨立IP,作為企業(yè)形象代言人,可以去承接視頻宣傳、海報宣傳、跨界互動上。

2. 從制作周期、制作方式維度來說明闡述一下不同類型數(shù)字人的情況

制作周期:

  • 2D真人:真人形象采集,+文本/聲音AI驅(qū)動,制作周期3-4周。
  • 2D卡通:2D繪制,形象生成周期短,制作周期2-4周。
  • 3D卡通人物/3D寫實:3D繪制,制作周期2-4個月。
  • 3D超寫實:真人掃描/3D建模,制作周期3-6個月。

制作流程:

2D數(shù)字人:

2D卡通數(shù)字人較為簡單:主要通過手繪或者美術(shù)人員來實現(xiàn)。

2D視頻數(shù)字人:

  • 錄制真人視頻表演、采集數(shù)據(jù),一般錄制3-5分鐘的視頻。
  • 再將視頻給到AI訓練。
  • 最終實現(xiàn)輸入文本/音頻文件,實現(xiàn)口唇驅(qū)動。

3D數(shù)字人制作流程:

1)虛擬形象設定構(gòu)思:首先我們需要知道虛擬人的形象風格及類別;

2)虛擬形象建模、建模形象綁定、動作捕捉。基于虛擬形象IP設計或真人偶像繪制原畫和三視圖、招牌動作表情。進行面部及身體3D建模,選擇關(guān)鍵點,將識別關(guān)鍵點映射至模型上,進行綁定。關(guān)鍵點綁定的數(shù)量及位置影響最終效果。利用動作捕捉設備或特定攝像頭+圖像識別,捕捉在形體、表情、眼神、手勢等方面的關(guān)鍵點變化。

3)實時驅(qū)動渲染

真人演員(在虛擬偶像中稱為中之人)根據(jù)制作需要進行相應表演,實時驅(qū)動虛擬數(shù)字人表演。

4)實時內(nèi)容輸出互動

最終將復活的實時數(shù)字人接入實時渲染引擎。

——稍微展開聊聊(什么是恐怖谷效應):

3D技術(shù)限制存在恐怖谷效應。所謂恐怖谷效應,是指當機器人或虛擬人對人類的擬真程度到達非常高的程度后,由于和真人只有一點點的差距,反而會使現(xiàn)實人類感到恐懼。而如果能突破這個臨界點,人類對機器人或虛擬人的恐懼度就會迅速下降。

二、形象未來發(fā)展趨勢預測

隨著技術(shù)的越來越成熟,以及硬件設備(移動手機、硬件大屏等)性能越來越強大,大眾對于數(shù)字人的期望也會變的越來越高。

1. 從制作的角度來看

近年來,拍照式相機陣列掃描重建得到飛速發(fā)展,目前可實現(xiàn)毫秒級高速拍照掃描(高性能的相機陣列精度可達到亞毫米級),滿足數(shù)字人掃描重建需求,成為當前人物建模主流方式。國際上 IR、Ten24 等公司已經(jīng)將靜態(tài)重建技術(shù)完全商業(yè)化,服務于好萊塢大型影視數(shù)字人制作,國內(nèi)凌云光等公司制作的拍照式人體掃描系統(tǒng)也已經(jīng)在電影、游戲、虛擬主播項目中成功應用。

相比靜態(tài)重建技術(shù),動態(tài)光場重建不僅可以重建人物的幾何模型,還可一次性獲取動態(tài)的人物模型數(shù)據(jù),并高品質(zhì)重現(xiàn)不同視角下觀看人體的光影效果,成為數(shù)字人建模重點發(fā)展方向。

2. 從渲染的技術(shù)來看

實時渲染技術(shù)的突破助力寫實類數(shù)字人實現(xiàn)實時交互,應用范圍快速擴大。

隨著硬件能力的提升和算法的突破,渲染速度、渲染效果的真實度、渲染畫面的分辨率均大幅提升,在虛擬人物實時渲染方面,已經(jīng)能做到以假亂真。

3. 從形象展現(xiàn)端的角度來看

  • 展示平臺主要以傳統(tǒng)顯示設備為主,PC、手機、大屏是主流顯示硬件。
  • 未來數(shù)字人和3D數(shù)字內(nèi)容的結(jié)合,對于裸眼3D、VR、AR等硬件的普及具有推動作用,沉浸式設備在特定領域?qū)⒊蔀樽顑?yōu)解。

4. 從客戶的需求角度來看

  • 未來數(shù)字人的發(fā)展,正呈現(xiàn)出靜態(tài)向動態(tài)、2D向3D、卡通向?qū)憣崱蜗蛳蚨嘞蚧?/strong>的趨勢;
  • 人格化成為數(shù)字人爆火的新的發(fā)展方向。在“好看的皮囊”上精心打磨的同時,生產(chǎn)者更希望數(shù)字人擁有“獨特的靈魂”,讓用戶感受到人格化數(shù)字人身上的情感力量。比如像銀行的虛擬客服形象多為西裝制服的精英女士,而虛擬美妝博主則以時尚精致的美麗姐姐為主。這種與所屬領域緊密貼近的造型能夠幫助人們更好的識別,增強人們的代入感和信任感,未來的區(qū)分度也會越來越明顯。

5. 從數(shù)字人IP角度來看

數(shù)字人作為數(shù)字 IP 不僅需要助力品牌實現(xiàn)差異化和年輕化,還能讓用戶快速建立品牌聯(lián)想和品牌標識。

目前的打造趨勢:造場景、立人設、創(chuàng)運營。

場景:

  • 根據(jù)虛擬人的應用場景劃分,虛擬人產(chǎn)業(yè)可以分為:內(nèi)容消費型虛擬人、工具型虛擬人、內(nèi)容生產(chǎn)型虛擬人,分別面向C端市場、B端市場以及元宇宙的去中心化基建。
  • 具象一點,虛擬人物的主要活躍場景包括:娛樂綜藝、游戲、時尚、運動健身、視頻/大片、實時直播、全息/現(xiàn)場。

立人設:

  • 打造符合品牌調(diào)性的文化符號,包括人物性格、身份背景、功能價值等,也就是給虛擬人賦予個性和靈魂。
  • 虛擬人角色設定可以分為五個類別,分別是完美偶像、前沿實驗、真實生活、智能助手和行業(yè)專家。

創(chuàng)運營:采用“有故事 + 有進化 + 有持續(xù)性”的運營模式,打通全域式營銷通道,為數(shù)字人 IP 續(xù)航發(fā)展注入能量。

  • 理解各種業(yè)務的特性和客戶特性;文字可以很好地體現(xiàn)出角色的個性特征;
  • 增加在現(xiàn)實生活中暴露或與現(xiàn)實人物合影,增加逼真度;
  • 將有意義的意見或信息(如服裝、攝影教程、好物、好電視劇、安利等等)提供給使用者,而非單純地強調(diào)人的“活起來”;
  • 在與品牌的協(xié)作中,可以提供與之有關(guān)的圖片或錄像,增強其專業(yè)或職業(yè)的性格,并為其廣告做廣告;
  • 盡量在線上尋找流量,或是參加熱點話題的探討,以提高曝光率;借助雜志,媒體,線下展會等多種途徑進行宣傳。

三、虛擬數(shù)字人發(fā)展趨勢

1. 三個特點

1)技術(shù)向上,成本向下

在元宇宙時代,強大的企業(yè)將開始跨足不同領域,合并不同學科的知識,以加速技術(shù)創(chuàng)新并將其應用于實際產(chǎn)業(yè)。在技術(shù)不斷升級的情況下,這將推動行業(yè)標準化和智能化的發(fā)展,提高生產(chǎn)效率。隨著技術(shù)的發(fā)展,高精度虛擬人的制作成本將不斷降低,使得內(nèi)容創(chuàng)作者能夠更輕松地專注于創(chuàng)造內(nèi)容,而不受成本的限制。這意味著未來我們將看到更多的創(chuàng)作者將資源用于創(chuàng)作本身,從而推動內(nèi)容產(chǎn)業(yè)的進一步發(fā)展。

2)價值向內(nèi),責任向外

在元宇宙時代,擁有內(nèi)容生產(chǎn)能力的虛擬人,將成為“內(nèi)生力量”,構(gòu)建起元宇宙價值的“內(nèi)循環(huán)”。創(chuàng)造內(nèi)容的虛擬人將成為元宇宙價值的重要組成部分,就像是一個內(nèi)部推動力量,為元宇宙的發(fā)展構(gòu)建起一個內(nèi)部的循環(huán)。如果虛擬人在元宇宙中違反法律和道德規(guī)范,那么虛擬人的所有者將會被視為主要責任人,需要接受虛擬世界和現(xiàn)實社會的不同審判。

3)行業(yè)破壁,產(chǎn)業(yè)融合

元宇宙的核心是“融合”,隨著產(chǎn)業(yè)的升級,它將重新連接整個產(chǎn)業(yè)鏈,引發(fā)新的場景和業(yè)態(tài)的涌現(xiàn)。人類社會與元宇宙將以“元宇宙+”的模式長期共存,虛擬人作為一種關(guān)鍵的數(shù)字工具,將廣泛滲透到傳統(tǒng)產(chǎn)業(yè)中,實現(xiàn)向外擴展,成為推動各行業(yè)效率提升到新水平的關(guān)鍵手段,繼互聯(lián)網(wǎng)之后的又一重要推動力。

2. 商業(yè)模式

國內(nèi)很多公司選擇自己開發(fā)語音、文字和圖像處理能力,而國外則更傾向于使用微軟、AWS、Google等公司提供的核心自然語言處理(NLP)技術(shù),將其整合到產(chǎn)品中,讓客戶可以自由選擇。

這可能是因為國外主要由計算機圖形(CG)公司主導市場,而國內(nèi)公司更注重業(yè)務集中化。未來,一些國內(nèi)公司表示他們也會向外部公司開放部分技術(shù)能力。這種差異在未來可能逐漸減小,因為國外公司更趨向于提供標準化的虛擬數(shù)字人形象,包括豐富的音效和模板。

相比之下,國內(nèi)公司的提供相對較有限,更多的是根據(jù)用戶需求進行特定設計,以滿足定制化項目的需求。在交付方面,國外主要以特定的虛擬數(shù)字人為主,讓客戶方進行訓練和迭代;而國內(nèi)則更注重提供內(nèi)容。

國內(nèi)大多是傳統(tǒng)的AI公司,在這個賽道中基于虛擬直播或虛擬主持人播報起家,并開始關(guān)注這兩項技術(shù)的周邊產(chǎn)業(yè),如完整的直播應用方案、運營等并逐漸向其他領域延展。

但由于國內(nèi)市場和內(nèi)容消費的市場太大,缺乏業(yè)務延展的動力。部分公司在向消費級的完整解決方案拓展。

除了 Epic這個游戲引擎公司外,其余的公司都是專注于這個領域的。就目前動向而言,可能會沿垂直行業(yè)發(fā)展。國外企業(yè)更多聚焦于2C,延續(xù)了從日本興起的虛擬陪伴文化(這一方向在國內(nèi)主要體現(xiàn)在AcFu和嗶哩嗶哩中)。我國企業(yè)則多聚焦于實用性更強的2B2C領域,通過客服等服務型場景降本增效,更快的兌現(xiàn)技術(shù)價值。

3. 總結(jié)

目前,雖然數(shù)字人在應用方面還面臨一些問題,比如產(chǎn)業(yè)鏈不夠順暢、場景無法很好地連接、成本較高等。但隨著“元宇宙”的快速崛起,整個產(chǎn)業(yè)鏈將更緊密地結(jié)合在一起,使技術(shù)更先進,成本更低,使得數(shù)字人進入普通家庭,提高企業(yè)的質(zhì)量和效率。

在元宇宙中,每個人都將有一個數(shù)字身體,這個數(shù)字身體的主體就是虛擬人。虛擬人參與到元宇宙的社會活動中,與由智能驅(qū)動的虛擬人形成了“人機共生”的完美結(jié)合,創(chuàng)造了一種新的商業(yè)形式。

虛擬人已經(jīng)開始在政務、商業(yè)、娛樂、醫(yī)療、教育、金融、養(yǎng)老等各個領域發(fā)展,不斷提升自身能力。這體現(xiàn)了“元宇宙”中虛擬與實際的密切關(guān)系。

在未來很長的時間里,元宇宙中的虛擬人將成為熱門話題。但無論如何,我們要尊重人類、尊重自然、尊重科技、尊重宇宙、尊重藝術(shù),讓這個不可避免的未來變得更美好。

本文由 @毅鳴 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!