虛擬數字人的應用和觀察

0 評論 926 瀏覽 2 收藏 11 分鐘

隨著AI的出現,虛擬數字人逐漸成熟,而讓虛擬人富有生命力和有影響力,是當前未來的行進方向。作者總結了虛擬數字人的應用和觀察,一起來看看吧。

生成式AI的技術讓虛擬數字人不僅僅只有系統設置好的能力,更可以具備“靈魂”。

如何讓虛擬人有生命力和有影響力,是未來行進的方向。

21年我關注這方面的時候,大部分還是處于電影特效環節,一個真人需要穿一些專業的動捕設備,然后需要設計同學進行大量的人工建模和綁定;

23年年底到現在我再次對這個行業的現狀進行了一些摸索,發現確實有了驚人的迭代。

剛開始還是處于應用本身的更新,22年我有次在廣州一個展會上看到了做數字人直播的SaaS公司,印象非常清楚,當時還詢價,大概是8000/人/月;而且其他的展位都是有商品的,只有這家放了ppt,而且連海報都還沒有,只是一個黑白A4紙,打印的產品說明。

當時這家公司的人還是一些“假人”建模出來的,并且音和形的擬合度也非常低。

整體觀看,非常假。

但是時日至今,現在確實能夠夠看到一些還不錯的數字人。

一、虛擬數字人的幾個常見應用

1. 虛擬偶像

產出一些音樂、小短劇、照片等,主體基本由公司進行運營,在各大社交平臺進行圈粉。

商業化變現路徑:粉絲經濟

代表作:洛天依(二次元音樂)

柳夜熙(劇情)

2. 虛擬主播

播音主持專業賽道,對新聞、綜藝等進行專業的主持;也有在抖音小紅書代替真人出鏡,呈現內容;

商業化的變現路徑:節省人力 + 資本價值

代表人物:央視的主播小C

3. 數字員工

服務于企業,多有IP屬性、品牌代言和跨界屬性,帶來一些“噱頭”,視覺效果加持,提供一些客服能力。

商業化路徑:品牌價值、資本價值

代表人物:百信銀行的員工AIya

4. 虛擬導游

服務于各地的文旅局,作為旅游IP的特性進行呈現;現在這這兩年的商業化路徑看起來還不錯。

古人現代化呈現(虛擬李白)

商業化路徑:代言人、AI概念加持

代表人物:劉三姐

5. 數字分身

概念:大多數是對現實生活中的人提供一個第二數字分身進行呈現,比如現在的老黃,主要是作為公司的代表作進行呈現,比如最近的劉強東直播、黃仁勛數字分身。

二、技術方案

實現路徑:造個虛擬人出來–>能表達(說話不假)—>能夠產生交互(能回復問題)

最原始的狀態:動捕設備+手工渲染

現在的方案:

1. 人怎么造出來

  • 手動建模:通過unity3D.c4d等等都可以建模(原始)
  • AI繪畫的技術:
  • 文生圖通過文生圖的形式,構建一個人(通過
  • AI換臉通過真人圖像轉虛擬人的形式(比如抖音的一些頭像、寫實畫像轉二次元、妙鴨..)

2. 人怎么動

真人驅動:通過動作捕捉設備進行關聯,記錄動作坐標;

代碼驅動:對生成的數字人模型進行骨骼、表情的綁定以實現后續驅動;

智能驅動:通過動作的描述、口型、表情,等等,自動進行有動作流的綁定與生成。

3. 聲音擬合

這里就像是我給一個視頻配音,如何提高精準度,這里大家應該都感受過,需要一直不斷地拉大視頻的幀,這樣才能對的更整齊

但是這里還有一個問題,我們還需要讓這個人的口型和語音對上,這個其實就是一個技術難點了(比如前幾年電視劇的后期配音大家是非常能明顯的感覺到區別)

過去的做法,是我需要人工把人物模型說話的模型建模渲染出來,然后讓語音對齊這個口型;

口型動畫生成技術:現在的技術已經攻克了口型和語音的自動擬合,能夠實現我通過語音驅動這個人物模型的口型;

但是坦白講,隨著語言而變動表情和語氣,這個點,確實現在還沒有看到,或許也是成本太高了,一時半會不太能呈現出來。

4. 如何產生交互?

對話這件事情,現在已經有了生成式大模型、知識庫,對于信息的輸入和賦予靈魂的輸出,這件事情,倒不是技術困境了,阻力核心還是集中在,如何結合多模態讓人類感知到這個“數字人”真實性。

三、未來來商業化的方式(個人思考)

1. 電商的應用場景,真實度提升的那一刻,虛擬主播會逐步進入大家的世界

現在能看到的一些數字人直播間還是非常初級的階段,大多還是基礎的實現口播,在情緒和問答數據交互上存在一些瓶頸,但是這些是可以通過現有的模型技術進行解決的,相信很快會有大的廠商在這里解決這里的技術問題

  • 在一些大廠的基礎商鋪會首批上線,比如集團下的多個化妝品品牌等等;
  • 一些本地生活的連鎖門店的直播間,交互范圍有限,且需要靠抖音直播的時長來轉化優惠券和流量的;

四、文旅行業會快速落地

現在各地的文旅局,都在推進AI的應用,不管是博物館的ar眼鏡還是一些全息投影疊加AI人物的生成

導覽數字人、代言人,這些都可以快速提升游客的感官體驗。并且在這個場合中,“假”并不會被過度放大。

eg:上次在山東省博物館和河南省博物院,都有看到類似的應用,通過ai的方式展現了京杭大運河當前的開鑿和狀況;還有李白杜甫這些詩人的經歷,都有通過虛擬人+生成式視頻+現場交互的方式,給游客帶來較好的體感

助手數字人化

日常大家會使用siri和小愛同學等等的語音對話助手,但是這里的siri是一個同樣的siri,而且只是語音

如果現在你可以真實的構建一個數字人助手,可以yy一下,我可以線上設定他參數,比如我希望他是boy or girl ,語氣是怎么樣的,學歷背景和工作履歷是如何的,從一維二維的對話,走向三維的視頻,同時再結合一些VR眼鏡等等硬件,可以在特定的環境實現真實對話。。純yy暫無一些資料表明。

五、國內的一些商業化方案

1. 單一IP的定制化方案

  • 強定制化品牌形象的數字人:央視電視臺主播、政務IP
  • 賣捏好的人(SaaS方案)-for電商直播(百度的智能云) 

  • 軟硬件一體化方案-for電商(訊飛)
  • 重點發力重視數字人直播賽道

會員制,賣時長和做好的視頻–For內容制作者(云平臺)如影

數字員工解決方案(小冰)

六、技術困境

1. 生動性:包括最近大家看到的劉強東京東直播,都是非常死板,沒有“人味”

雖然解決了口型的問題,但是對于情緒和表情上,還是沒有辦法進行通用的商業化,這里在未來的一段時間必然是攻克的瓶頸。

2. 算力:大模型的通病了,如何降本,讓這件事情走進千家萬戶

本文由 @聞一 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!