大模型拯救數字人

0 評論 1449 瀏覽 2 收藏 23 分鐘

隨著生成式AI技術的迅猛發展,數字人領域迎來了新的生機。本文將探討AI大模型如何賦能數字人,使其在形象、互動和成本等方面實現突破,分析數字人如何成為AI大模型商業化落地的突破口,并展望數字人作為AI服務入口的未來潛力。

AI加持下,數字人真是一門好生意嗎?

先發展模型能力,還是先發展應用?

在過去很長一段時間,這恐怕都是生成式AI行業里最具代表性的爭論之一。

行業內曾在楊植麟和朱嘯虎公開發表觀點之后,劃分成了“技術信仰派”與“產品信仰派”,并且一度爭執不下。但僅不到一年,這種爭論就逐漸聚焦成一種聲音——商業化落地。

清華大學計算機系教授、中國科學院院士張鈸曾就這一問題向「甲子光年」表示:“在中國,光搞大模型很難活下去,必須與應用相結合?!?/p>

其實,學界的呼吁早已成了業內的共識。

半年前的一場AI論壇中,包括金沙江創投朱嘯虎、獵戶星空傅盛、智譜張帆等在內的所有嘉賓,都認可商業化是現階段國內大模型企業的第一要務,也都認可to B是大模型快速實現商業化的最佳路徑。

當然,即使是to C的Kimi,也在今年5月20日通過網頁版推出了打賞付費功能。這被視為Kimi試水商業化的重要動作。

但究竟如何與應用相結合,是擺在國內絕大多數AI大模型企業面前的一道難題。

而在解題過程中,“數字人”似乎成了全行業統一的標準答案。

11月6日,AI Infra企業零一萬物對外發布了大模型to B解決方案,其中就包括了面向電商直播、辦公會議等場景的“如意”數字人。

這一動作耐人尋味的原因在于,李開復曾在今年6月的智源大會上公開表示不做to B。然而僅僅半年之后,零一萬物就帶著數字人解決方案扎進了to B市場。

其實,互聯網大廠早就開始了基于AI大模型的數字人布局:例如騰訊打造騰訊智能、百度打造智能云曦靈平臺、京東打造言犀、華為打造華為云盤古數字人大模型……

不只是互聯網大廠,傳統IT廠商也開始探索數字人。

在「甲子光年」近期對世紀互聯旗下全資子公司第一線DYXnet的訪談中,世紀互聯高級副總裁/第一線總經理陳姵妏透露,第一線目前也在打造“線靈系列”AI服務,而數字人正是其中一個重要板塊。

為何AI大模型公司如此鐘情數字人?大模型給數字人帶來了什么?AI加持下,數字人真是一門好生意嗎?

一、兩條“死胡同兒”

數字人的爆火,可以追溯到4年前。

早在2020年之前,數字人的前身“虛擬人”就借著元宇宙的東風開始被大眾認知。

彼時,Meta還在扎克伯格的帶領下all in元宇宙。被帶火的3D虛擬人被視為元宇宙的“原住民”,一度成了最熱門的創業賽道。當時僅國內與虛擬人沾邊的創業公司就多達幾十萬家。

在眾多的虛擬人中,“柳夜熙”一時風頭無二。

2021年10月31日,柳夜熙憑借一條“捉妖”題材的短視頻爆紅全網,一夜漲粉363萬。

柳夜熙,來源:柳夜熙微博

從此以后,各大虛擬人如雨后春筍一般,一時間賺足眼球:萬科數字員工“崔筱盼”拿下了2021年萬科總部最佳新人獎;虛擬人“鄧麗君”在江蘇衛視2022跨年演唱會亮相;湖南衛視的《你好,星期六》啟用數字主持人“小漾”……

根據國內創投數據庫IT桔子統計顯示,截止2022年10月,國內虛擬人領域融資數量近百起,金額約120億元。

從技術層面看,當時的虛擬人主要分為兩種技術路線:一種是平面2D數字人,渲染要求不高,可以快速規?;瘡椭?,并且更像真人,只是肢體動作和面部表情都表現僵硬,實際效果較差。

另一種是3D超寫實虛擬人,通過高成本的原理動畫制作,生成一個親和力、表現力更強的虛擬人。初代虛擬偶像洛天依就采用的是這種路線。

對比這兩種技術路線不難發現,2D數字人盡管成本低、能夠快速批量制作,但受限于當時的技術能力,無法突破形象和動作表現的瓶頸,所以即使價格低廉,卻在當時也未獲得客戶認可。

而效果更好的超寫實3D虛擬人在形象外觀上更受歡迎。但這種虛擬人的缺點也很明顯,那就是“貴”。

關于虛擬人的制作成本,「甲子光年」訪談了國內知名AI數字人創作平臺蟬鏡。

據蟬鏡聯合創始人楊洪進表示,制作一個3D虛擬人,大致要經過掃描、建模、計算機綁定、動畫展示和渲染等多個環節,時間成本與資金成本投入都不是一個小數目。

3D虛擬人的制作越精良,花費的成本越高。按照傳統的CG級制作手法計算,單個超寫實3D虛擬人的制作成本大約在100~200萬元,時間周期約為2~3個月。

此前,黃仁勛曾在英偉達發布會上出鏡了14秒虛擬人視頻。根據英偉達官方博客顯示,這短短的14秒視頻,就共有34位3D美術師和15位軟件工程師協同參與,總計投入近千工時。

黃仁勛虛擬人,來源:英偉達

除了居高不下的成本投入,企業還要為虛擬人的商業化進行考慮。畢竟在制作上花了大價錢,誰都想讓它最大程度實現商業化變現。

但事實上,當時適合這種高投入的虛擬人的商業化場景極為有限,最常見的形式就是以虛擬偶像的形式進行IP化打造,直接面向to C領域。

日本的初音未來就是這一賽道的鼻祖,也是當時全球第一的虛擬偶像。而國內則有柳夜熙、洛天依等。柳夜熙在一夜爆紅之后,甚至曾和小鵬汽車、VIVO、嬌韻詩、安踏等知名品牌達成過合作。

可問題在于,虛擬偶像在IP化運營上的投入也是個無底洞。因為虛擬偶像需要持續不斷的生產符合自身人設的內容,這就要搭配相應的內容團隊專門為其打造。這也是一筆不小的費用。

與此同時,IP生態產業鏈的上下游聯動也必不可少,例如出品玩偶等周邊產品、創作相關的影視作品等等,圍繞虛擬偶像進行持續性、多元化的運營。

據「甲子光年」此前了解,僅運營一個虛擬偶像的線上內容,一年就要花費超過800萬元?!耙驗槟悴恢皇窍M谀抢镎局阋氖亲屗鼊悠饋?。比如語音、 面部表情、 動作生成等。這些都需要持續投入?!睏詈檫M表示。

除了成本與商業化的痛點之外,虛擬人還有更加重要的實時互動問題,在當時也難以解決。

簡單來說,當時的虛擬人并不能自主實現面部表情和肢體動作的變化,也不能像真人一樣回復用戶的言語互動。這種痛點在其直播帶貨時尤其明顯。

楊洪進透露,為了解決虛擬人的實時交互問題,當時的虛擬人直播間普遍采用“阿凡達”模式,即前端是虛擬人形象,但動作和語言都由后端的真人進行操作。

高企的制作與運營成本、局促的商業化空間、實時互動瓶頸,都是限制虛擬人普及的巨大門檻,也是拖垮虛擬人運營方的重擔。

例如擔任全球鞋類巨頭斯凱奇潮流主理人的數字人孔襄,2022年4月在抖音出道時就吸引了數十萬粉絲,結果當年9月就停止更新,賬號一共只發布了8條視頻。

一邊是“用不起”的3D超寫實虛擬人,另一邊是“看不起”的2D平面數字人。一時間,這兩條技術路線似乎都走進了死胡同兒。

二、“劉潤時刻”

轉機出現在生成式AI橫空出世之后。

在諸多AI數字人里,劉潤是一個不得不提的名字。

時間回到2022年10月底。當時,OpenAI的ChatGPT還并未對外發布,商業認知博主劉潤就在年度演講“進化的力量”中展示了自己的數字人。

事實上,劉潤第一次展示數字人時并未破圈,人們更多是以獵奇的心態看待劉潤的數字人產品。但劉潤團隊隨后加大了在數字人方面的投入,尤其在內容上開始大量使用數字人進行視頻輸出,數量多到甚至一度被個別讀者吐槽“已經看不到真人了”。

直到今年1月1日,劉潤才通過公開信的方式復盤了團隊在技術上的投入。此時大眾才發現劉潤的視頻內容里已充滿數字人。

足夠以假亂真、甚至完全無法分辨,是AI大模型加持下的數字人的最大特點,也是AI給數字人帶來的最直觀的變化。

劉潤數字人,來源:劉潤視頻號

從本質上看,今天的數字人可以看做是一個具象化的AI皮膚,其運行原理也與ChatGPT一致,都是依靠精湛的算法、強悍的算力和優質龐大的數據庫。

簡單來說,現在我們看到的數字人,其實就是通過視覺形式采集人們說話時的唇動、表情和面部肌肉細節等數據并進行AI訓練,進而讓AI生成更多更豐富的表情與動作。

由于機器視覺技術已十分成熟,可以精確捕捉人說話時的唇動和面部細節,加上AI大模型在語言能力上的優勢,數字人自然能夠與真人更貼近,并且也具有加深理解用戶意圖、生成回答、保持話題連貫等對話的能力。

早在2020年就開始研發AIGC數字人的硅基智能曾向「甲子光年」透露,在ChatGPT發布前,硅基智能就通過了數字人圖靈測試的第一階段:僅通過肉眼,普通人無法分辨真人和數字人。而劉潤數字人的亮相,在硅基智能內部被稱為“劉潤時刻”。

“這是一個轉折點。因為3年前還會有客戶說不像真人,現在幾乎沒有了?!币幻杌悄艿匿N售曾對「甲子光年」表示。

不過,讓數字人更普及的核心變化顯然來自成本層面。

前文提到,早期的數字人分為2D數字人和3D超寫實虛擬人兩種技術路線。對比3D虛擬人的投入,2D數字人的成本要低很多。

據蟬鏡創始人楊洪進透露,采購一個數字人通常涉及“克隆”和“使用”兩筆費用。克隆就是由真人拍照進行AI訓練生成數字人。這筆費用在幾年前大約會在上萬元,近兩年價格逐步降低,但也在千元級別。

“去年的市場行情已經到了300元克隆一個數字人。今年我們直接把價格打成了免費。0元就能幫你克隆一個自己的數字人!”楊洪進說。

如此之低的制作價格背后,是AI加持下數字人訓練的邊際成本大幅降低的原因。

硅基智能創始人司馬華鵬曾對「甲子光年」透露,生成2D數字人所需要的數據采集越來越少,成本肉眼可見地下降:從最初需要30分鐘的視頻數據,到10分鐘,5分鐘,慢慢縮短為1分鐘、甚至是1張照片?!斑@是一條非常好看的曲線?!?/p>

換句話說,在數字人的數據庫達到一定量級后,制作方確實可以幾乎0成本生成數字人。這也是蟬鏡等數字人制作方能夠打出免費價格的底氣。

克隆成本的降低只是一方面,數字人的實際運營成本也得到了大幅降低。

以如今數字人最常見的直播帶貨場景為例,第一,商家的直播工作流變得更加簡單。

真人直播搭建一個直播間耗時耗力,而通過成熟的數字人產品,5分鐘就可以搭建一個數字人直播間,還能通過AIGC生成直播腳本、做劇本和物料的優化等。

第二,大模型加持下,個性化數字人只需幾分鐘的素材即可生成,可以實現低成本一鍵開播、24小時不間斷直播,極大節省了人力,降低了商家運營成本。

一家代播平臺負責人給到了更具體的下降比例:同樣一場直播,數字人的花費不到真人主播的10%。

在足夠低的成本面前,使用場景的局限便不復存在。

正如我們所見,今天的AI數字人已開始出現在人們常見的諸多場景。除了應用最多的直播帶貨外,智能客服、短視頻娛樂、在線教育、保險銷售等場景,也都開始出現數字人的身影。

據楊洪進介紹,由蟬鏡平臺制作的數字人,已廣泛應用在各行各業,甚至包括律師也在使用?!拔覀償底秩藛蝹€視頻的視頻號播放量超過1.2億?!?/p>

對此,陳姵妏也向「甲子光年」透露,第一線聚焦多元化辦公場景,打造了線靈系列AI服務。其中AI數字人解決方案是由第一線聯手騰訊智影等企業研發,針對電商、培訓、旅游、教育等垂直領域,幫助企業客戶進行業務講解、客戶服務等工作。

更完美的形象與實時互動能力、足夠低的成本、以及更多的應用場景,都是AI大模型帶給數字人的巨大突破。而數字人也讓AI大模型尋找到了商業化落地的突破口。

三、雙向奔赴之后???

顯然,AI大模型與數字人的結合,是一場恰如其分的雙向奔赴。

自從ChatGPT橫空出世以來,人們對此類產品的討論就從未停止。其中最普遍的論調是:它到底能產生什么實際價值?大模型的商業化究竟是什么形態?

而數字人就是大模型給出的第一個答案。

大模型要想解決商業化困境,“產品、場景、成本”是必須回答的3個問題。而數字人恰好就是這3個問題的最大公約數。

也正因如此,我們才看到了包括百度、京東、騰訊在內的互聯網大廠,以及零一萬物、出門問問等細分頭部企業、甚至是第一線這種傳統IT廠商,在數字人業務上的不謀而合。

原因在于,在AI大模型諸多商業化可能性中,數字人是率先被客戶驗證的產品。

楊洪進告訴「甲子光年」,目前,企業客戶對數字人的最核心需求就是降本增效。而直播帶貨、智能客服等數字人應用較多的場景,都是更容易測算ROI的場景。

“比如你在數字人上每花1塊錢,就能賺2塊錢。這種ROI已經普遍是數字人廠商的賣點?!睏詈檫M透露。

硅基智能曾向「甲子光年」提供過一個案例:2023年春節,杭州一家本地生活公司因為缺少人手,兩位運營人員同時運營8個硅基智能數字人直播間,在小長假期間收獲了千萬流水。

大廠的動作更加高舉高打。今年4月16日,京東集團創始人劉強東以“采銷東哥AI數字人”的形式現身京東超市、京東家電家居采銷直播間。據京東發布的官方戰報顯示,“采銷東哥AI數字人”直播不到1小時,累計成交額超5000萬元。

如此之高的投入產出比,客戶自然愿意投入真金白銀為AI數字人買單。

據楊洪進透露,蟬鏡AI數字人創作平臺上線以來,目前已積累了20多萬家中小企業客戶,累計創建的數字人數量也已超過百萬個。

盡管數字人看上去像是一個賺錢利器,但也并不意味著它能讓客戶躺著賺錢。

「甲子光年」曾在《數字人淘金熱,一場被AIGC改寫的風暴》中指出,數字人只能維持直播的營收模式,通過節省真人主播降低成本,而不能從0到1創造一個有利潤的直播間。

真知創投聯合創始人Alan也表示,數字人本身的價值其實非常有限,即使加入了AI能力,也無法憑空創造價值。

“這就像市面上一些給毛絨玩具加入AI模塊的產品一樣。盡管它能跟你對話,但它有可能還是會吃灰?!盇lan說。

楊洪進則從IP資產的角度給出了另一種思考:“企業購買數字人,也不一定希望它必須帶來多少收入。直播帶貨行業里,主播的角色非常關鍵,一些頭部主播被捧紅之后有可能跳槽,業內有非常多這樣的例子。而數字人主播顯然更穩定,這對企業來說是IP資產安全問題?!?/p>

無論是否賺錢,AI數字人都毋庸置疑的在近兩年里實現了爆發。根據IDC預計,到2026年中國AI數字人市場規模將達到102.4億元。

未來,關于AI大模型與數字人的結合,一個更值得思考的想象空間是,數字人將成為AI大模型的服務入口。

今天的數字人,已開始流露出成為人機交互入口的趨勢。而對于這些大模型企業來說,數字人也必然會成為自身與客戶之間的服務入口。

陳姵妏向「甲子光年」透露,第一線之所以要探索數字人業務,其中一個重要方面就是希望將原有的云網安業務向AI進行升級,通過AI能力進一步服務客戶。

“我們有很多傳統客戶,他們更聚焦于自身的業務。而我們要做的則是用AI幫助他們更好的完成自身業務。這是我們推出AI服務和數字人解決方案的初心。”陳姵妏表示。

像SaaS產品一樣,當客戶采購數字人產品后,后續的使用與維護的成本都將與背后的AI大模型廠商實現強綁定。但比SaaS更有優勢的是,AI大模型產品的使用粘性更高,持續使用還能讓AI對客戶自身更加了解,替換門檻也自然水漲船高。

AI與數字人的雙向奔赴,在給客戶產生收益的過程中實現商業化落地,進而反饋大模型訓練推動整個閉環乃至大模型飛輪效應的形成。這種閉環的形成不僅提升了數字人的交互體驗和智能化水平,也為AI企業提供了持續進步和落地的可能性。

這些,或許才是如此之多AI大模型企業共同瞄準數字人的真正意義所在。

作者|栗子

本文由人人都是產品經理作者【甲子光年】,微信公眾號:【甲子光年】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!