GPT給數字人裝上大腦?

0 評論 2883 瀏覽 7 收藏 16 分鐘

由元宇宙衍生出來的數字人產業,雖然商業路徑屢受質疑,但如今借著AI東風,再次被炒得火熱。為什么已經“涼”過一次的數字人又突然火起來?進入GPT時代數字人會普及嗎?本文作者分享了對數字人的看法,一起來看一下吧。

ChatGPT的橫空出世,算是接管了元宇宙的“瘋狂游戲”。由后者衍生出的數字人產業,雖然商業路徑屢受質疑,但如今借著AI東風,再次被炒得火熱。

除了百度、阿里等大廠加碼布局外,不少上市企業更是聞風而動,迅速沖到了新市場的牌桌面前。天娛數科、萬達信息、藍色光標、奧飛娛樂等,均提到正在研發相關技術,并且試圖將數字人接入ChatGPT。

落地到應用上,包括蒙牛、鐘薛高等消費品牌,紛紛推出數字代言人;眾多車企、銀行推出數字員工;薇婭背后的謙尋也在近期被曝出聯合虛擬偶像“星瞳”,開啟直播帶貨的嘗試。

更為直觀的感受是,打開短視頻平臺的直播間,AI數字人主播已經取代了不少真人主播,進行24小時無間斷帶貨,甚至像咨詢顧問劉潤等在更新視頻內容時,也都由數字人代替。

并且與此前不同,新一批的數字人,從外觀上看幾乎和真人一模一樣,口型也和所要說的內容保持一致,只是在互動上還常常答非所問,無法實現情緒共鳴。

順應趨勢,以抖音為代表的各大內容平臺,開始規范人工智能生成內容,發布行業規范,給出公開態度,這也意味著接下來的市場爆發或在眼前。

那么,為什么已經“涼”過一次的數字人突然又爆火?進入GPT時代數字人會普及嗎?未來數字人發展還存在哪些難點?有替代真人的可能性嗎?

01 舊瓶裝了新酒

大多數人會以為,數字人是伴隨元宇宙的概念誕生的,但其雛形問世的時間還要更早。

2007年,日本公司Crypton Future Media就借助“初音未來”這一IP角色在年輕人心中打上“虛擬偶像”的烙印。盡管“元宇宙”一詞可以追溯到1992年發布的科幻小說《雪崩》,但直到2021年Facebook更名為“Meta”后,“數字人”的說法才開始真正走入大眾視野。

中國數字經濟百人會發布的《數字人:數字經濟新賽道》報告稱,整個2021年數字人相關企業融資共有2843起,融資金額達2540億元。

在元宇宙概念的加持下,大眾對數字人的熱情不亞于當初的初音未來。虛擬博主一夜暴漲百萬粉絲的案例比比皆是;更有數字人偶像參加綜藝選秀,甚至B站還專門開設了虛擬人直播區。

但風吹過后,有時也很難開出新花。

開發元宇宙業務本就是一項資本密集型的項目,而產業基礎設施目前尚不成熟,這也導致諸多投資者損失重大。

僅一年多時間,以Meta為代表的互聯網大廠開始因為元宇宙入不敷出,在扎克伯格一句“我錯了,我對此負責”后,數字人市場也隨之遇冷,逐漸淡出市場視線。

直到2022年底ChatGPT橫空出世,接棒元宇宙成為全球科技領域的超級大風口。數字人作為信息技術交叉融合的前沿呈現,再次被推到了聚光燈下。業內人士普遍認為,將能夠產生長時間、多輪次、有邏輯文字互動的ChatGPT與數字人相結合,那么一個無限向人類思維靠近的虛擬人即將誕生。

一些熱衷追逐前沿的個人或團隊,率先進行了嘗試。

“這是我的首個數智人分身?!痹谡故玖艘黄谟伞氨救恕背鲧R的短視頻節目后,數字經濟學者劉興亮告訴觀眾,視頻中與他形象、音色幾乎一模一樣,甚至同樣夾雜著山西口音的主播并非他本人,而是以他為原型制作的數字人。

國內著名商業咨詢顧問劉潤更是將其視頻中幾乎所有真人出鏡部分內容,換成了“分身”。

國外擁有180萬粉絲的Snapchat網紅Caryn Marjorie,更是開發了AI版本的自己,結合GPT-4,靠利用不同版本的Caryn AI,和粉絲談戀愛,按分鐘收費。

除了視頻博主,線上講師、帶貨主播、導游、導覽等職業,也成了數字人批量“上崗”的熱門領域,相關企業紛紛落地產品。

幾天前,萬達集團首批數字人亮相,這些數字分身采用真人主播形象,并且做到了一人化身多種角色;另外薇婭背后的謙尋也是開始加班加點培訓虛擬帶貨主播;甚至各種定制數字人的廣告都已隨處可見。

當然,最讓行業興奮的還是,各大平臺對數字人的態度開始轉變。

因為不得到平臺的肯定和支持,博主、商家心里總會忐忑,擔心賬號有被封禁等風險,繼而讓服務商也無法順利推進和解決行業的需求。不過隨著抖音率先公開表態,發布平臺規范,預計接下來,會有更多互聯網平臺跟進。

與元宇宙時期相比,現在的數字人明顯更加大眾化。一位業內人士直言,“去年數字人還只是大企業或網紅專屬,現在基本上到了每個人都能有自己數字化分身的階段”。而在「科技新知」看來,其中原因與大模型爆發、成本下降以及應用場景開拓相關。

02 供給側突破

從技術實現路徑來看,目前國內的數字人廠商主要以NLP技術、多模態融合交互、大模型、XR技術為底。

而隨著AI技術的提升和數據資源的豐富,以及更加先進的機器學習算法和深度學習模型的引入,數字人的智能水平得到了大幅提升。其中多模態AI技術使得數字人的交互能力更上一個臺階,感知能力、思維決策、內容輸出能力都得到顯著改善,在思想、語言、行為上和真人更加接近、更加智能化。

此外,ChatGPT的出現也為業內提供了發展捷徑。無論在哪種場景下,交互才是數字人的核心。如果說精美的CGI僅僅為這些數字人提供了一層漂亮的皮囊,那么它還需要一個真正“有趣的靈魂”和“聰明的大腦”。這就是大規模語言模型的用武之地。

數字人與生成式AI的結合,是整個產業發展的關鍵節點,二者正在產生相互作用。中國傳媒大學國家重點實驗室中心首席科學家沈浩認為,生成式AI的引入將為虛擬數字人賦予“最強大腦”。業內專家也紛紛表示,虛擬數字人有望成為ChatGPT應用的最佳化身和接口。

數字人和ChatGPT本質上皆是智能度相對較高的人機交互。虛擬數字人可以向ChatGPT發出請求,獲取ChatGPT的回答,并將內容呈現給用戶,對于企業來說甚至不需要單獨訓練,便可在短時間內批量生產數字人。目前已有企業在進行這方面的嘗試,例如虛擬技術服務商世優科技。

AI技術除了給數字人帶來有趣的靈魂外,同時也覆蓋了數字人生產運營全流程,為行業帶來了更低的成本和更高效率,成為產品快速普及的基礎。

事實上,高昂的制作和運營成本一度讓不少中小企業望而卻步。以此前火爆的“美妝達人柳夜熙”為例,公開信息顯示,其3到4分鐘的視頻制作周期為一個多月,成本高達幾十萬元。曾經復雜的訓練樣本數據采集,也導致數字人定制過程長,一定程度上限制了其快速應用落地。

如今,隨著技術進步,數字人的制作時長和成本都在持續降低,甚至不少企業都開始了工廠式批量生產。

最開始,業內做一個數字人需要幾個月,去年是以幾周為單位,今年做一些2D小樣本數字人已經可以達到小時級,并且成本降至千元級別?,F在只需要錄制幾分鐘的真人口播視頻、幾句語音素材形成一個“小樣本”,再通過基于自監督機制的通用多模態模型經過大規模數據訓練,就能獲得與真人形象、語音近似的數字人。

在直播行業,數字人的成本優勢更為明顯。一名采用數字人直播的企業負責人提到:“一個AI主播定制費用是8000元,一年系統使用費8萬多元,而一個真人主播平均月薪兩萬元,一年也要24萬元,可以省下來10多萬元。二十個主播,一年就可以節省 200 萬元?!边@還不算“閑時流量”所帶來的效益。

更智能的表現以及更低的成本,也挖掘出更廣泛的應用場景。之前數字人主流應用可能僅局限在代言、虛擬偶像等輕度互動場景,現在除直播帶貨外,就連一些博主的日更都采用數字人,另外一些投資顧問、銷售甚至醫院醫師等都逐漸出現數字人的身影。

不過仍要注意,雖然快速低成本生成的數字人在服務性需求契合度上有較大成長,訓練完成基本可以接入應用場景;但客觀來說,更精細的打磨和團隊可控性等等,還都有待完善。

03 待填的空白

自人工智能問世,“AI威脅論”的探討就從未停歇。ChatGPT火爆之際,也有人立刻列出了“最可能被ChatGPT取代的職業”清單,數字人帶貨的爆火也讓“取代李佳琦”成了直播行業關注的熱點。

不過現在鼓吹AI數字人將全面取代主播、大V等業態,還屬言之過早。

首先需要明白的一點,現階段的數字人主播,還算不上“真正的AI”。

「科技新知」在瀏覽多個數字人直播間后發現,幾乎所有“主播”只能根據前期輸入的文本進行復述,動作也是循環播放的,交互能力和隨機應變能力幾乎為零。

另外,并非所有用戶都對數字人抱有好感?!耙坏┌l現不是真人在直播,我會立刻滑走?!币晃粺嶂杂谠谥辈ラg購物的消費者為此做出了解釋,自己通常是被主播極具特色的個人風格所吸引,而數字人主播即便再逼真,也很難復刻這種“人情味”?!耙粋€很簡單的細節,你打在公屏上互動的語句,主播都看不懂、無法完成互動,甚至無法展示產品,那直播帶貨的意義何在?”

人機語音交互服務商一知智能CTO李一夫認為,目前生成式AI通過大模型形成答案的速度還比較慢,而交互場景對于實時性的速度要求又非常高,所以當前生成式AI還不能直接運用到數字人的交互上,這個也是未來需要大模型去解決的問題之一。

從平臺角度來看,雖然已經有平臺明確為數字人發放通行證,但平臺強調的重點在于內容是否優質,然而在抖音、快手、視頻號上,這些AI直播在某種程度上算是經過了包裝的錄播和無人直播,既稱不上優質,也得不到流量扶持。

所以,未來數字人運營人員還是需要花費精力研究如何獲取流量,如何制定更好的內容,并把這些輸入小模型,以生成更好地運行腳本。

其次,數字人技術在應用時也需要十分謹慎。

2018年圖靈獎得主Geoffrey Hinton曾表示,非常擔憂AI所帶來的虛假信息傳播。這并非空穴來風,國內外飽受AI變臉困擾的明星不在少數。網絡上曝出的以人臉、聲音合成技術為手段進行詐騙的活動也屢見不鮮。甚至,如果數字人技術用在了直播現場,一旦出現黑客侵入等問題,可能會產生極大負面影響。

因此,在進一步規?;瘧弥?,數字人技術的安全性保障、數字人運營團隊權限的可控性、相關部門的立法監管等方面都有待完善。

經過元宇宙、GPT的雙重洗禮,數字人雖已不是新生事物,但行業對其認識還存在不少空白。整體來看,數字人的進化路徑由擬人化走向同人化,最終將走向超人化,實現歸真超實。當然這個過程中,如何給用戶前所未有的情感體驗,讓用戶接納,如何建設好周邊生態,教育好用戶,如何建立行業規范標準,健全監管制度,都將成為這個新生產業發展的關鍵所在。

作者:萇樂;編輯:伊頁

來源公眾號:科技新知(ID:kejixinzhi),洞察技術變化背后的產業變遷。

本文由人人都是產品經理合作媒體 @科技新知 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!