姜sir變成姜siri,AI配音能不能滿足玩家需求?
AI人工智能的身影已經越來越常見,從AI主播、到AI繪畫,又比如本文中的AI配音,越來越多領域開始應用、結合AI,與此同時,AI人工智能的應用也讓不少人產生疑惑:在未來,AI可以代替真人完成某些事情嗎?如果可以的話,又可以完成哪些呢?
在原定錄音工作無法完成的情況下,為了保障重要游戲資源的完整,臨時調整計劃或更換CV并不少見。近日,因為負責當期內容的配音演員無法參與錄制,《時空中的繪旅人》和《未定事件簿》也相繼發布了角色更換配音的公告,不過,這次并不是換人,而是用AI配音替代真人錄制。
AI配音不稀奇,但AI配音游戲角色,還是配乙女游戲中的男主之一,確實是個新鮮事。除了引發粉絲和吃瓜群眾對背后的內情的探究,這一嘗試也讓游戲玩家既期待又忐忑不安。不過,隨著語音在游戲中實裝,以及相關實機視頻的公布,語音最終呈現出來的效果卻出乎玩家的預料:
也有被新嗓子俘獲,情緒較為激動的:
雖然存在缺陷,但總體來說并未翻車,反而算得上是驚喜。
一、AI配音正在大步向前
AI配音,似乎在逐漸顛覆大眾的普遍印象:
雖然與早期的小冰等相比,現在的智能語音助手,在語言流暢度上已經有了很大的進步,也有了更為豐富的聲音方案,但大部分時候,智能語音助手、AI聽書、短視頻AI配音等,仍然扮演著沒有感情的念稿機器,還會在斷句、特殊句式、多音字上屢次碰壁。而早期作為虛擬歌手標配的機械感和電音,隨著聲庫和調音技術的升級,也逐漸被削弱。創作者還會特意加入換氣聲,使之更貼近于真人。
與唱歌不同,除了流暢,語氣和情感也是配音的重點。短視頻中的AI配音之所以讓人覺得“莫的感情”,是因為只滿足了基礎的發音流暢,并沒有語氣變化與情緒起伏。
不過,在AI聽書這一領域,似乎已經有了一些效果,如微軟TTS中文語音、火山語音等,除了銜接自然,在朗讀過程中也會有明顯的輕重緩急。常被網友用來整活的番茄AI讀書(火山語音),在識別到一些具有情緒色彩的內容,語速和語氣會有變化——盡管情緒不一定能對應上,且極易會受到符號影響卡出鬼畜音頻。
雖然好笑,但確實是生動起來了。
在許多人對AI語音的印象還停留在探索階段時,《繪旅人》和《未定》則在語言銜接、語氣以及情緒上,展現出了高度貼合真人的成果,當然,距離完美還有提升空間。
在評論區,玩家的評判標準也反復橫跳,一方面知道是AI后忍不住開始找毛病,另一方面又認為不應該對AI太過嚴格。
不過,鑒于這是兩個人第一次“學說話”,評價大體上還是包容居多,甚至自發尋求合理性,比如莫弈的略微氣虛契合了劇情設定下的曖昧氛圍,葉瑄的微妙停頓以及電流聲,恰好可以歸于“外星人”設定。
還原本音外,此次AI配音的另一個特殊之處,在于音源來自于角色而非CV。
無論是虛擬歌手,還是智能語音助手,大都是由真人提供音源。因此對于AI語音,特別是即時生成的語音來說,聲庫質量尤為重要。即使是虛擬歌手,其歌曲效果,也不只取決于調校水平。
但《繪旅人》和《未定》中,葉瑄和莫弈這兩個角色,并非由CV直接提供音源,而是通過角色過往的配音來分析提取聲紋,也就是說,這是葉瑄和莫弈“自己給自己配音”。
涉及到的兩個AI技術提供者,在這之前也已經在其他領域中大展身手。網易AI Lab曾在去年與《羊城晚報》合作推出廣東媒體首個視頻類真人AI合成主播“羊小晚”和“羊小派”。
至于逆熵AI,在前段時間米哈游旗下虛擬偶像鹿鳴的直播上,就引發過討論,在幾年前公布時,也對AI配音這方面做出了解釋,即深度學習記錄配音演員的聲音和情感,做到輸入文字就能夠生成語音。也是由于這一項技術的經驗,相較于準備時間較為倉促且第一次嘗試的葉瑄,莫弈的配音才能呈現出更好的效果。
相似的原理,在虛擬歌手身上也得到了應用,8月末,洛天依AI在軟件ACE Studio上開啟公測,同樣是通過深入學習來模擬真人發聲效果。
在視頻平臺上,也有網友將洛天依AI聲庫與此前的V3、V4聲庫進行對比,相比之下AI聲庫呈現出來的歌曲片段,在流暢感和真人感上都有很大的提升,更為自然柔和。不過也有網友認為這樣失去了洛天依特有的標志性電音。
洛天依聲庫的加入,無疑讓ACE Studio進入了更多網友的視野,而除了調音,這一虛擬歌姬軟件的捏聲線功能也為創作者帶來了更多的靈感和途徑:
在選定模板的基礎上,通過調節參數得出聲音“配方”后,給人的感覺基本就像是角色本人在唱歌了。
但無論是真人音源還是虛擬音源,由于AI的可調性,AI語音呈現出來的效果和真人也有著微妙的差異。這在虛擬歌手上比較常見,在聲線和語氣上已經高度還原的莫弈身上,也會產生一種角色和CV分離開來的感覺,給人的感覺像“貼莫而不貼姜”。
而神奇的是,這種與真人稍微剝離的感覺,似乎并不會讓玩家不滿,反而讓他們更有代入感。
二、AI會代替真人配音嗎
使用AI配音的直接目的,是避免因為外界因素而導致超出計劃的變動。不過,這也受到角色定位的影響,近兩個月中,其他游戲里也有姜廣濤配音的其他角色出場,如《花亦山心之月》中的玉澤和《食物語》中的龍井蝦仁,但除了提前錄好的部分,在其他內容中暫時成為了“啞巴”。
這些角色雖然也有高人氣,總歸只是眾多角色中的一個,在時裝及其劇情的暫時失聲并沒有太大的影響,但作為乙女游戲的男主角之一,葉瑄和莫弈在活動劇情中缺席或失聲,都會對角色塑造和玩家體驗上產生嚴重的負面影響。
而在局勢尚未明朗的當下,更換CV也確實不合適,因此,使用AI配音,便成為了最優解。
AI會替代真人配音嗎?對此網友的態度也各不相同,有人認為AI配出來的沒有靈魂,有人則認為紙片人就應該配電子音:
不過,就當下的情形來看,短時間內這樣的可能性不大。
主要是在于技術與成本。人工智能的使用,很大程度上是為了降低人力成本,但應用的范圍也有限。當前AI配音主要應用于不需要太多情緒的短視頻文案、新聞播報、聽書功能上,滿足基本的信息傳達功能。
而更為復雜的有情緒的AI配音,在這些領域是不適用的,也不必要的。因為AI配音的相對低的成本,并不包括像《繪旅人》和《未定》這樣給主要角色臨時配音的情況——不僅要考慮語言流暢、還要在語氣情緒上貼近角色,以及盡量還原配音演員。在技術要求和工作量上,這無疑是高于真人配音的,也并非所有的游戲都能擁有網易米哈游兩家大廠在資金和技術上的支持。
而對于合作雙方來說, 除了與角色的適配度,CV本身的影響力,也是游戲廠商考慮的重點。雖說將角色與配音演員聯系在一起并不好,但這種現象依舊是普遍存在,否則也不會將CV作為宣傳點,并舉辦CV和玩家的互動活動了。這些附加效應,自然也是真人配音的高成本中的一部分。而廠商要創造獨家AI CV,再將其打造成為IP,擁有與頭部CV相當的號召力,并不是能一朝一夕完成的。
此外,AI配音技術尚未完全成熟。
而且,比起情感,AI配音更多的是擁有了情緒,而這些情緒是通過一點點的后期調節來實現的。相對于真人,許多時候數據或許會少了一些打動人心的力量。比如視頻創作者的小情緒、發音習慣、甚至是偶爾的口胡,都能拉近與觀眾的距離,這是追求完美的的AI配音無法實現的。
雖然對頂級的CV沒有太大的影響,但對于許多在業務能力和知名度上較低的配音工作者來說,AI配音的不斷進步確實會有威脅,比如現在的AI聽書已經開始擠占有聲書市場了。但這也并非完全是壞事,競爭會推動配音演員對自身技能的提升。不過,這一問題并非面向個人,而是需要整個行業進行調整,提升真人配音的競爭力來應對危機。
三、結語
AI配音游戲角色,讓人們看到了這一技術在語音領域的又一次進步。在感慨人工智能技術的越來越強大的同時,也擔心會帶來虛假信息、擠占市場、剝奪創造力等社會問題。此前的AI換臉、AI繪畫,也是如此。
但就如機械代替部分人力一樣,AI在更廣泛領域得到應用的趨勢是不可阻擋的,我們只能通過法規等來規避其隱患,而無法阻止它。但能替代的,也只是一部分,至少在目前,AI配音的應用范圍還十分有限,而在技術成熟和成本降低的未來,局面或許會發生改變。
不過,即使是AI技術在未來達到了突破性進展,我也更愿意相信,將AI作為輔助工具,協助真人CV完成各類配音工作,并在這一過程中互相學習促進,才是最理想的結果。
作者:寸草,來源公眾號:手游矩陣(ID:shouyoujuzhen)
原文鏈接:https://mp.weixin.qq.com/s/x4adQ55zkUglYuQIq66SQg
本文由 @手游矩陣 授權發布于人人都是產品經理,未經作者許可,禁止轉載
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
相對于真人,許多時候數據或許會少了一些打動人心的力量
ai在這方面進步越來越快了,雖然現在聽起來還有一點瑕疵,但以它的學習速度,說不定真的能完全替代人力
聽說有游戲決定用ai代替真人配音特別吃驚,特地去聽了一下效果,確實是超出預期的好
但是配音這種工作,尤其是游戲當中給玩家提供情感體驗的角色,還是更感性的人給人感覺真實一點