如何評(píng)測(cè)語音助手的智能程度(2):服務(wù)提供

4 評(píng)論 13105 瀏覽 46 收藏 24 分鐘

關(guān)于如何評(píng)測(cè)的問題,筆者從四個(gè)維度展開了分析,而本文服務(wù)提供維度展開評(píng)測(cè)點(diǎn)的拆解,考量的是場(chǎng)景理解及整合應(yīng)用CP和SP的能力。

很多人覺得AI是一個(gè)行業(yè),但AI其實(shí)并不是行業(yè),真實(shí)的情況是行業(yè)+AI,即原本的各個(gè)行業(yè)如何釋放AI的能力促使產(chǎn)業(yè)升級(jí),提升運(yùn)轉(zhuǎn)效率,創(chuàng)造更多的社會(huì)價(jià)值。

在前一篇文章里,用戶提出一個(gè)需求——“我就想要一個(gè)聰明且好用的智能助理,能夠滿足我生活中的各種需求?!?/strong>

這個(gè)“各種需求”的滿足,其實(shí)是原本已經(jīng)存在解決方案的,AI只是試圖去革新體驗(yàn)。

我們都知道那個(gè)著名的公式:用戶價(jià)值=(新體驗(yàn)-舊體驗(yàn))-替換成本。

那么問題來了,用戶原本用得好好的,為什么要來用你呢?

很多AI創(chuàng)業(yè)公司就是理解以及處理不好這個(gè)問題,經(jīng)營(yíng)不好而半路夭折。

任何一個(gè)服務(wù)背后的構(gòu)建,智能助手其實(shí)都依賴于CP(內(nèi)容提供商)和SP(服務(wù)提供商)的能力,那么如何將這些能力巧妙地與AI結(jié)合,是非常值得研究的部分。

前一篇文章,筆者重點(diǎn)談了【意圖理解】維度,本篇文章為大家?guī)怼痉?wù)提供】維度的評(píng)測(cè)點(diǎn)拆解。

在談及這個(gè)模塊的時(shí)候,評(píng)測(cè)考量的是場(chǎng)景理解及整合應(yīng)用CP和SP的能力。

1. 資源/服務(wù)的全面性

機(jī)器貓有一個(gè)百寶袋能夠解決足夠多的問題。

《超能陸戰(zhàn)隊(duì)》的大白最初的定位是在醫(yī)療健康領(lǐng)域,相對(duì)就比較窄一些。當(dāng)然后續(xù)大白經(jīng)過版本迭代升級(jí),也開發(fā)出自己的其他能力,這就是能力拓展。

“你看我家的這只大白,他又大又圓,能治病救人,還能打,要是能再多做一些事就好了”

所以,智能語音助手的技能服務(wù),能力范圍自然是越多越好?

在理解這個(gè)維度之前,我們一定要明白比較的對(duì)象。

在前面一篇文章里筆者曾經(jīng)提到過:“市面上,例如騰訊叮當(dāng)、小愛同學(xué)、天貓精靈、小度音箱這類大生態(tài)的集合的處理方案,屬于最大的開放域?!?/p>

這種產(chǎn)品形態(tài)的背后,其實(shí)是把集團(tuán)的資源整合進(jìn)一個(gè)智能硬件中,為音箱這個(gè)智能硬件提供更多附加價(jià)值。

筆者的視角看來,這也是在未來,各CP和SP在未來注定會(huì)到來的智能時(shí)代,嘗試以音箱這類硬件載體,找到AI為用戶提供服務(wù)價(jià)值的一種探索性行為。

從這個(gè)角度去評(píng)判,他們無疑是大而全的。

巨頭們的打法,他們做的是生態(tài)。用評(píng)價(jià)應(yīng)用商店的角度,去評(píng)判智能助手,根本就不對(duì)。

故而SIRI的未來,定位一定是基于蘋果的大生態(tài),做一個(gè)向用戶提供SP和CP的連接器。它是中介,提供的服務(wù)能力是,幫助用戶尋找CP和SP。

而實(shí)際上,真正去解決我們生活中的問題的是,各個(gè)行業(yè)細(xì)分領(lǐng)域的CP和SP們。

CP角度:視頻、音樂、音頻內(nèi)容、文字內(nèi)容、游戲等領(lǐng)域。

SP角度:出行、教育、醫(yī)療、金融、電商、旅游、餐飲、客服、線下生活服務(wù)等領(lǐng)域。

所以,真正比拼服務(wù)全面性的,指的是解決某個(gè)具體問題的能力。

例如滴滴的定位是解決用戶的出行問題,如何解決一公里內(nèi)的出行服務(wù)需求,收購(gòu)一家“自行車”唄。

在實(shí)際的業(yè)務(wù)評(píng)測(cè),體驗(yàn)測(cè)試很多市面上的AI助理,就覺得有些服務(wù)有,但是服務(wù)的覆蓋不夠。

例如很多的AI助手都是訂機(jī)票功能的,但是似乎少有的能做到整個(gè)服務(wù)鏈條的全覆蓋。比如:

  • 能定國(guó)內(nèi)的機(jī)票,沒法定海外的機(jī)票;
  • 買機(jī)票的同時(shí),不能買出行相關(guān)的保險(xiǎn);
  • 乘坐飛機(jī)相關(guān)的各種FAQ服務(wù)問題能不能答得上來;
  • 行程單郵寄以及發(fā)票報(bào)銷,解決得是否到位;
  • 預(yù)約送機(jī)和接機(jī)的服務(wù)需求如何解決;
  • 商旅人士定酒店的服務(wù)是不是也得加上;

……

定位可大可小,只有先明確產(chǎn)品的定位,然后基于定位所覆蓋的服務(wù)范圍,去滿足用戶需求,基于這個(gè)角度去評(píng)測(cè)“資源/服務(wù)的全面性”才更準(zhǔn)確。

而作為AI從業(yè)者,實(shí)際上應(yīng)該思考的是,用如何用現(xiàn)在的AI能力升級(jí)某個(gè)產(chǎn)業(yè),更好的為用戶提供更多的價(jià)值,爭(zhēng)取做到某個(gè)細(xì)分需求領(lǐng)域里面的最好。

此為,我輩中人,應(yīng)該反復(fù)思考的命題。

2. 資源/服務(wù)的質(zhì)量

既然有全面性考量,相對(duì)應(yīng)也有質(zhì)量的追求。

行業(yè)內(nèi)能提供最好質(zhì)量的也就是BAT的那幾家,這個(gè)背后是接口,即SP和CP的比拼。無非就是把手機(jī)上獲取的內(nèi)容和服務(wù),換一個(gè)硬件載體所承載。

從用戶角度而言,是通過點(diǎn)觸找到自己想要的內(nèi)容/服務(wù),還是和通過語音找到自己想要的內(nèi)容/服務(wù),這個(gè)過程并不重要,而真正在意的是能否滿足需求,有無體驗(yàn)升級(jí)?

即,只要讓我能拿到能回家的火車票,我才不管哪個(gè)軟件,通過什么形式完成交易行為。

在這一點(diǎn)上,巨頭的SP和CP非常齊備,而小廠往往就慘兮兮,比如我想聽周杰倫的歌,我也能做好相關(guān)的語義理解,結(jié)果公司的背后沒有QQ音樂的支持,那只能找一些替代方案,還擔(dān)心版權(quán)問題。

中等廠商如喜馬拉雅,基于內(nèi)容做音箱,然后捆綁內(nèi)容完成銷售。

那么問題來了,如果自己不是巨頭公司,手里也沒有內(nèi)容,公司也沒太多的錢,買不到版權(quán),如何去做呢?

在一些細(xì)分領(lǐng)域,是存在內(nèi)容自建這一說的。我們可以開一些也許不嚴(yán)謹(jǐn)?shù)哪X洞。

先定義一下場(chǎng)景:智能廚房,如何給用戶帶來革新的體驗(yàn)?

比如說,電冰箱上開個(gè)屏幕,外加麥克風(fēng)揚(yáng)聲器wifi模組,這個(gè)硬件成本是可控的,如此可以構(gòu)成一個(gè)廚房AI機(jī)器人。

每天推特價(jià)菜,整合每日優(yōu)鮮或樓下便利店,對(duì)廚房的需求直接語音配送下單。在廚房這個(gè)場(chǎng)景下,屏幕上可以語音搜索,做菜烘培類的視頻資源等,可以用知乎,抖音,下廚房等任意地方的內(nèi)容,這個(gè)細(xì)分領(lǐng)域,維系好內(nèi)容建設(shè),成本并不高。

再比如說,市面上一些熱門游戲,已經(jīng)有了自己的智能助手,有些做的好,有些不好。

在這里可以尋求的服務(wù)可以有:提供游戲攻略、提供客服入口以及服務(wù)、收集用戶建議,做運(yùn)營(yíng)營(yíng)收類動(dòng)作一類系統(tǒng)整合服務(wù)。

就單單一個(gè)服務(wù)點(diǎn),當(dāng)用戶在游戲中挫敗的時(shí)候,卡在某個(gè)關(guān)卡下死活過不去,可以提供游戲圖文/視頻攻略,貼心的送一些臨時(shí)性的道具關(guān)懷,甚至幫助用戶完成戰(zhàn)斗。這些都是可以通過助手實(shí)現(xiàn),并有效提升用戶留存的。

所以,智能助手能不能基于場(chǎng)景和需求,給予用戶高質(zhì)量的內(nèi)容價(jià)值,是非常重要的考量點(diǎn)。

3. 反饋樣式的豐富性

簡(jiǎn)單來說,就是智能助手的回復(fù)類型有多豐富。

還是舉個(gè)例子:現(xiàn)實(shí)生活中,你向其他人提問我想了解一下這個(gè)房子,你能介紹一下么?

如果現(xiàn)在同樣的問題,拋給語音助手,對(duì)方回復(fù)的內(nèi)容樣式包含如下:

  1. 純文本介紹
  2. 圖片搭配文本,語音介紹
  3. 視頻內(nèi)容介紹
  4. 帶交互的功能式頁(yè)面
  5. 導(dǎo)購(gòu)講解外加VR視覺交互

無論是問問題和反饋需求,我的智能助手怎樣回復(fù)我,總會(huì)有一個(gè)反饋樣式。

在實(shí)際使用其他的智能客服交流的時(shí)候,問他一些非常基礎(chǔ)的問題,比如說找一下簽到功能頁(yè)面

機(jī)器人會(huì)非常細(xì)心的告訴我,先點(diǎn)哪里,然后點(diǎn)哪里,然后點(diǎn)哪里就可以找到了。

問題就是他是一串純文本,為什么就不能給我一個(gè)直接跳轉(zhuǎn)到指定頁(yè)面的功能按鈕呢?顯然,它并沒有提供一個(gè)【跳轉(zhuǎn)】的功能樣式。

故而,智能助手輸出結(jié)果樣式的豐富性也應(yīng)該作為評(píng)測(cè)指標(biāo)。

列舉一下當(dāng)前的回復(fù)樣式,文本、圖文、視頻播放器、音軌、選項(xiàng)卡、表單、功能按鈕、多模態(tài)交互等等。

必要說明的是,樣式并非越華麗炫酷越好,而是恰當(dāng)好處就好,往往越是華麗炫酷的東西,越是加載效果多,反饋速度慢也是評(píng)測(cè)丟分項(xiàng)(這個(gè)后面的評(píng)測(cè)維度會(huì)提及)。

樣式的選擇,就是具體場(chǎng)景具體分析了。

所以評(píng)測(cè)點(diǎn)是,是否能夠理解用戶需求,使用豐富的反饋樣式,提升用戶體驗(yàn)。

4. 內(nèi)容展示合理程度

這一塊其實(shí)非常考驗(yàn)人的設(shè)計(jì)功底,好的UI界面一定是簡(jiǎn)單而優(yōu)雅的。

它只在用戶需要的時(shí)間,展示需要的內(nèi)容

展示是分為GUI(圖形界面)的和VUI(語音界面)兩個(gè)部分的。

就好比飛機(jī)的駕駛艙,一定是讓人抓狂和惱火的,太多的儀表盤和功能按鈕會(huì)讓人決策癱瘓。而這種設(shè)計(jì)我一般稱之為勸退性設(shè)計(jì)。而汽車的駕駛艙的設(shè)計(jì)就好的多,因?yàn)樗?jiǎn)化了操作。

而就算是汽車的駕駛艙,不同的廠商處理能力也完全不一樣,Tesla的處理表現(xiàn)是非常優(yōu)雅的。

經(jīng)歷過功能機(jī)年代的人都知道,那個(gè)年代實(shí)體鍵盤占據(jù)屏幕的一大部分,而當(dāng)前的手機(jī)鍵盤僅僅在需要出現(xiàn)的時(shí)候出現(xiàn),類似的例子實(shí)在是太多了。

故而內(nèi)容展示的合理程度,也應(yīng)該成為一個(gè)評(píng)測(cè)標(biāo)準(zhǔn)。

就算是復(fù)雜的內(nèi)容,也需要做好信息處理,根據(jù)用戶的情況,分層次分階段,進(jìn)行內(nèi)容展示。

為了幫助大家理解,我舉幾個(gè)語音交互層面的例子。

比如說,大家周末相約到你家聚會(huì),有些同學(xué)由于不熟悉路況,然后打電話給你。你通過語音跟對(duì)方完成指路行為。注意,這是一個(gè)純語音對(duì)話的場(chǎng)景。

一般情況下,你采用的的話術(shù)表示是東南西北,一二三四某個(gè)街道樓棟門牌號(hào)這類語言結(jié)構(gòu),這種固然沒什么問題,但是往往是對(duì)空間感較好的男生比較友好。

而這類話術(shù)在女生那邊就不那么管用了,她們熟悉什么呢?商店品牌,廣告牌標(biāo)識(shí),建筑形狀,顏色等等,所以你自然就應(yīng)當(dāng)調(diào)整自己的話術(shù),相信她們會(huì)更接受。

上述例子就是基于用戶的情況,去設(shè)計(jì)自己的話術(shù)呈現(xiàn)

前面一個(gè)智能廚房的場(chǎng)景,詢問如何做菜,一般會(huì)給予視頻推薦。如此,解放雙手,邊看邊聽邊做,這個(gè)是我們想象的美好場(chǎng)景。

如果內(nèi)容不加以控制和處理的話,用戶的使用路徑是,先看視頻后做菜,或者是邊看視頻邊做菜。如此,大概率會(huì)出現(xiàn),一看就會(huì),一做就廢的情況。

原因無他,信息過載,細(xì)節(jié)過多,記不住。

而對(duì)內(nèi)容進(jìn)行管理,加以處理的話,合理的處理分層次分階段,體驗(yàn)便能再上升一個(gè)臺(tái)階。

上述例子就是基于分層次分階段,去設(shè)計(jì)自己的內(nèi)容呈現(xiàn)。

筆者曾經(jīng)設(shè)計(jì)過一些語音交互游戲。在進(jìn)行業(yè)務(wù)教學(xué)的時(shí)候,曾經(jīng)走過類似的彎路。

往往我們一開始是需要向用戶介紹基本狀態(tài),以及基本操作指令的,在介紹游戲指令的時(shí)候,有這一段描述:

……游戲的命令列表分別是:“繼續(xù)”、“重復(fù)一遍”、“下一步”、“退出游戲”。

問題1:命令列表是計(jì)算機(jī)語言,不具備親和力,更好的表述應(yīng)該是替換成你可以對(duì)我說:

而在后續(xù)實(shí)際的體驗(yàn)過程中,以及觀察用戶實(shí)際使用情況是:

當(dāng)AI講完,用戶并不知道接下來該怎么辦,頓在那里里發(fā)呆。

當(dāng)AI講完,用戶走神沒聽清楚,也忘記了前面“重復(fù)一遍”的命令列表。脫口而出你說啥?

問題2:一開始用戶拿到這一串命令的時(shí)候,其實(shí)是不知所措的,就好比跟你念了一段說明書。因?yàn)樾畔⑦^載,而可能會(huì)遺漏掉某些信息。

這就是語音交互的尷尬所在,操控命令無法圖形化顯示,只能想辦法在用戶需要的時(shí)候提示。(這就非??剂砍霈F(xiàn)的時(shí)機(jī))而交代也需要細(xì)節(jié),比如:

AI:說“繼續(xù)”進(jìn)入下一步。

用戶:繼續(xù)進(jìn)入下一步。我們真的不希望用戶如此表述。

問題3:我們期望用戶的表述,與預(yù)想不符,而修訂后的是

助手:進(jìn)入下一步請(qǐng)說“繼續(xù)”

類似的例子還能列舉很多,無論是GUI還是VUI,對(duì)用戶一股腦呈現(xiàn),不加以管理是非常不負(fù)責(zé)的。

在自然語言處理領(lǐng)域,特別是純語言的表述,邏輯順序非常非常重要。所以我提煉成,內(nèi)容展示合理程度,故而列為評(píng)測(cè)點(diǎn)。

5. 兜底處理表現(xiàn)

盡管我們都希望自己的智能助手能夠給予最好的回復(fù)。

而在實(shí)際的業(yè)務(wù)中,總會(huì)有一些搞不定的情況。

此處搞不定分為兩種,一種情況是,AI聽懂了,但是需求超出范圍,如何回復(fù)?

另外一種情況是,AI真的沒聽懂,但是能猜測(cè)一個(gè)大概,但拿不準(zhǔn),如何回復(fù)?

實(shí)際業(yè)務(wù)中的解決方案,每個(gè)業(yè)務(wù)單元處理均不一致。

私以為常見的處理方案如下。

下面的這個(gè)例子中,有什么理財(cái)推薦我想買理財(cái)其實(shí)意圖近似,但是AI則根據(jù)自己的理解,給予了兩種不同的處理方案。

下面的三個(gè)例子中,其實(shí)都是歸屬于成功理解意圖,但是回復(fù)不一致。

案例1,采用閑聊接話的方式,顯然是不過關(guān)的。(這類不過關(guān)真的非常多)

而案例2和案例3,則是相對(duì)過關(guān)的。

案例2和案例3,都無法直接滿足,雖然方向不同,但也是努力兜底,為用戶解決問題。

一種是通過下載APP作為解決方案,一種是交給導(dǎo)航去處理,提供解決方案。這兩種選擇的背后,都是可以產(chǎn)生商業(yè)價(jià)值的。

所以兜底回復(fù)的表現(xiàn),衡量的是,能夠?yàn)橛脩簦瑸楣編矶嗌賰r(jià)值。故而列為評(píng)測(cè)點(diǎn)。

6. 階段性結(jié)尾

寫東西不光光是羅列和定義評(píng)測(cè)點(diǎn)是什么,筆者更期望在每個(gè)點(diǎn)上,加入更多的業(yè)務(wù)思考和理解。

實(shí)際上,原本在【服務(wù)提供】這個(gè)維度,有更多評(píng)測(cè)點(diǎn)去列舉,受應(yīng)用性所限,刪掉的一些內(nèi)容。

用提問的方式,列舉一下我刪除掉的指標(biāo)。

第(6)點(diǎn),列舉一個(gè)例子,特別跟我們工作中一樣,馬總下周去北京出差,你幫忙安排一下相關(guān)行程。然后秘書會(huì)溝通具體時(shí)間,航班的班次,酒店,路上的交通,出差相關(guān)的事項(xiàng)提醒以及資料。當(dāng)這類事情,交付給AI的時(shí)候,AI如何處理。

第(7)點(diǎn),智能助理可以出現(xiàn)的地方,麥克風(fēng),揚(yáng)聲器,wifi模塊,就可以使用語音交流了,如果有屏幕,則多一種點(diǎn)觸交互。那么這意味著智能助理,可以存在的載體非常多,手表/環(huán)、手機(jī)、電腦、眼鏡、耳機(jī)、音箱、車載硬件等任何地方。那么當(dāng)用戶在不同場(chǎng)景的下的需求,到了另外的地方,如何對(duì)人類提供反饋。

第(8)點(diǎn),開放域閑聊,解決用戶的寂寞問題。要知道,“樹洞”也是一種待滿足的需求。表現(xiàn)得最好的是電影《Her》里面的薩曼莎,不熟悉這個(gè)電影的朋友可以去B站搜下內(nèi)容。其次表現(xiàn)得最好的,我所知道的,應(yīng)該是被很多人調(diào)戲了這些年的微軟小冰了。

(6)、(7)、(8)三點(diǎn)畢竟高難度,雖然想過方案,但是對(duì)絕大多數(shù)智能助手而言,相對(duì)低頻,故而棄之。當(dāng)然也可以把這些評(píng)測(cè)點(diǎn)納入,作為加分項(xiàng)。如果能實(shí)現(xiàn)得比較好,那就是亮點(diǎn),甚至是當(dāng)成重要賣點(diǎn)去贏得市場(chǎng)競(jìng)爭(zhēng)力!

當(dāng)用戶提出需求后,AI先理解,后反饋,這個(gè)反饋表現(xiàn),就是本文【服務(wù)提供】維度各個(gè)考量角度。

我們都知道那個(gè)著名的公式:用戶價(jià)值=(新體驗(yàn)-舊體驗(yàn))-替換成本。前段時(shí)間讀《俞軍產(chǎn)品方法論》時(shí),更是加深了理解。

我們?nèi)绾吾尫臕I的能力去革新體驗(yàn),盡量提升(新體驗(yàn))的價(jià)值。

同時(shí)用戶(替換成本)是什么,如何降低。如何兩頭用力,最大化創(chuàng)造用戶價(jià)值。

此為,我輩中人,反復(fù)思考的命題。

以上,關(guān)于第二大維度【服務(wù)提供】的考量部分,就此完結(jié)。

后續(xù)文章會(huì)補(bǔ)充余下的部分,并以相同的形式去進(jìn)行補(bǔ)充解釋和完善:

  • 【交互流暢】——當(dāng)用戶與AI進(jìn)行交互的時(shí)候,重點(diǎn)就交互反饋過程中的性能指標(biāo),體驗(yàn)是否流暢來設(shè)計(jì)評(píng)測(cè)指標(biāo)。
  • 【人格特質(zhì)】——智能助手是否具備足夠的魅力/人格化特質(zhì),就情緒表現(xiàn),情商,共情、個(gè)性化、擬人化程度來設(shè)計(jì)評(píng)測(cè)指標(biāo)。

謝謝你看到了這里,有疑問,可以在留言區(qū)評(píng)論與作者深入討論。

相關(guān)閱讀

如何評(píng)測(cè)語音助手的智能程度(1):意圖理解

 

作者:飯大官人,不折騰會(huì)死星人,微信公眾號(hào):fanfan19860403《游戲運(yùn)營(yíng):高手進(jìn)階之路》作者。熟悉游戲領(lǐng)域、人工智能-自然語言處理領(lǐng)域。

本文由 @飯大官人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自?Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 關(guān)于冰箱加屏、WiFi模塊、冰箱商城、語音交互的事情2017年我在美的就做過了;而關(guān)于通過AI問什么問題直接導(dǎo)向?qū)?yīng)的服務(wù),這個(gè)跟客服機(jī)器人其實(shí)是一回事。

    來自安徽 回復(fù)
    1. 單論和多輪邏輯和產(chǎn)品實(shí)現(xiàn)的結(jié)果是不一樣的,如果你是單輪,理解后直接給一個(gè)GUI的交互,那多輪絕對(duì)不是這樣~

      來自廣東 回復(fù)
  2. 我餓了,AI應(yīng)該問我想吃什么然后跳轉(zhuǎn)到我的外賣APP上,搜索好了讓我選擇 ?? ?? ??
    什么時(shí)候AI真的變成了賈維斯就厲害了

    來自安徽 回復(fù)
    1. 在此處應(yīng)該有產(chǎn)品的視角。
      ——————
      我餓了這個(gè)實(shí)在是太寬泛,選擇可以很多。
      取決于產(chǎn)品定位
      如果你是平臺(tái)級(jí)助手,就應(yīng)該給你推薦幾種不同的服務(wù)(去餐廳,點(diǎn)外賣)做選擇。
      如果你是業(yè)務(wù)型助手,就直接就你過往的餐飲喜好,或者你的健康數(shù)據(jù),做推薦。

      來自湖北 回復(fù)