為什么越像人的自然語言交互工具,越容易讓人失望?

0 評論 7448 瀏覽 11 收藏 9 分鐘

你以為自然交互工具越擬人化越能讓用戶感覺親近,越受用戶歡迎?其實不然。

從有了Siri作為先例,擬人化已經成為了自然語言交互工具的必備能力。

不論是服務于個人用戶的AI語音助手,還是企業提供的智能客服,甚至是各種有語音功能的家用電器,都要做IP、造人設,幾乎有了成精之勢。

在大多數時候,我們認為自然語言交互的工具的擬人化可以降低用戶的“恐怖谷效應”,讓用戶更喜歡與其交流。但最新的研究結果卻表明,事實或許并非如此。

成為人類的千重套路

首先我們可以來看看,自然語言交互工具擬人化的“千重套路”。

第一步,給自己起一個人畜無害的名字。

我們常說,當你撿到一只小動物后,如果給它起了名字,那么它十有八九會成為你的寵物。AI也是一樣,當自然語言交互工具擁有姓名,基本就注定了它會在成精的道路上越走越遠。自然語言交互工具的名字通常是“小”字輩,既顯得弱小無害又無關性別足夠政治正確。

第二步,利用語音生成技術模仿人類語氣。

擁有了名字之后,肯定就不能再用冷冰冰的電子音了,甚至以往語音生成技術管用的“真人錄音+規則匹配”的模式也略顯死板。這時便出現了以谷歌WaveNet為代表的神經網絡語音生成,通過對真人說話方式多種特征的抓取,對語義、詞性、語法包括上下文等等參數綜合考慮,最終生成谷歌助手那樣像真人一樣說話會停頓、有思考的語氣。

第三步,讓對話內容更加人性化。

在自然語言交互的過程中,語音生成需要建立在文本內容之上。滿足了“說話語氣”的擬人化,同樣也要讓“說話內容”更加人性化。

這時語義理解、多輪對話、自然語言生成等等技術的成熟度就變得非常重要。

例如:微軟在微軟小冰上應用的全雙工自然語言交互,就能實現“邊聽邊想”和“節奏控制”——通過整個對話過程對用戶意圖進行理解,減少用戶的等待時間,并且能夠主動引發新話題打破沉默,自行調節回答的內容和時機。這樣的對話內容通過語音生成技術“展現”出來,就可以以假亂真,讓人以為自己真的在和人類對話。

最后一步,披上“人皮”。

除了技術之外,還要以一些外圍模式讓自然語言交互工具更加擬人化。

比如:為它們設計一個可愛的卡通形象,增加幾條指令讓它們學會一些撒嬌賣萌的口頭語,在交互界面上增加一些細節讓人們意識不到他們在與機器對話等等。

有了這幾步套路,基本就能塑造出一個“化作人形”的自然語言交互工具了。

越人性越可愛?自然語言交互工具的期望值管理

可我們從未想過的一個問題是:在實際應用時,自然語言交互工具真的越擬人化越好嗎?

最近賓州州立大學媒體效果研究實驗室就進行了這樣一項實驗。研究人員們告知志愿者:他們將在電商平臺中選購數碼相機,并需要和在線客服交談咨詢。

這些客服背后都是智能自然語言交互系統,但研究人員對其進行人性化和響應程度上的區分。不同組的志愿者們分別會接觸不同的在線客服系統,有在對話時直接告知對方自己是機器客服的,有的只展示出對話框內容,有的會通過真人頭像和名字“偽裝”成人類。

同時,這些擬人程度不同的智能客服,又分別有著不同的響應程度。有些可以迅速精準的回答用戶問題,有的卻聽不懂人話顧左右而言他。

在交互過后調查實驗者的滿意程度時,結果卻令人意外。

在一般的邏輯中,我們會認為智能客服在交互時響應程度越高,人們的滿意度自然也會越高。

可實際情況是:在同樣的響應程度下,使用者的滿意程度是與智能客服的人性化程度相關的。比如:同樣的交互內容,明確知道對方是機器客服的實驗者就會給出80分的滿意度評價,而那些偽裝成人類的機器客服卻只能獲得60分的滿意度評價。

原因是當機器客服表現出較高的人性化特征時,用戶對他們的期望程度也會隨著上升,盼望著他們能和人類一樣幫助自己解決問題,如果得不到想要的答案,則會放大失望感。

其實在我們自己應用自然語言交互時也有同樣的感受,當語音助手、智能客服等等產品不能解決問題還要強行賣萌講笑話時,我們的暴躁指數往往會呈直線上升。

說到底,自然語言交互的人性化與否是一個“用戶期望值管理”問題,有時過度提升用戶期望值反而會弄巧成拙。

做人容易,做工具難

但目前我們能看到一個重要的趨勢是:自然語言交互人性和工具性的發展程度是不均衡的。從技術發展的難易程度來看,讓自然語言交互工具更加接近人類,遠遠要比讓自然語言交互工具更加有效容易得多。

不管是谷歌的WaveNet還是微軟的全雙工自然語言交互,都足以讓自然語言交互的發音模式、對話節奏等等細節無限接近人類。未來結合上計算機視覺層面,甚至機器人制作工藝層面的能力,我們可以打造出一個與人類無異的對話者。

其實在今天,我們就能看到諸如AI主播或harmony推出的索菲亞等等在視覺上極致人性化的“AI演說者”??蛇@些自然語言交互解決問題的能力卻沒有因此提高。

具體表現為:對于人類語料的理解還存在一定隔閡,尤其是小語種、老年人、兒童等等相對冷門的語料庫;對于不同領域詞匯的認知還不夠全面,很多時候涉及到一些垂直產業時,AI往往會進入知識盲區。

如此以來,幫助自然語言交互的“工具性”追趕“人性”或許將成為未來很長一段時間內的產業熱潮。例如:建立各個細分產業領域的知識圖譜、累積詞匯庫,或收集不同人群不同方言語種的語料庫用于AI訓練。

在技術的不斷追趕之下,人們對自然語言交互工具的期望值不斷提高已經是一種必然,為了避免出現“短板效應”,我們或許應該投入更多精力去追求“人性”以外的東西。

 

作者:腦極體,微信公眾號:腦極體

本文由 @腦極體 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash, 基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!