原來這就是智能虛擬助手
編輯導語:如今的智能虛擬助手,已經越來越“物聯網”化了,它不僅依托于智能手機、Pad和PC端,它還會出現在音響上、汽車里、電燈、電冰箱等等各種家用電器中。本文作者對智能虛擬助手的設計、交互,和市面上的智能虛擬助手等方面進行了分析,一起來看一下吧。
你好谷歌,幫我把臥室的燈關了。
你好谷歌,幫我把溫度設置為75度。
你好谷歌,給我媽發條消息,告訴她我10分鐘后就到。
你好谷歌,幫我找一下制作雞的菜譜。
這是谷歌助手官網的一段宣傳語,雖然只有簡單的四句話,但卻生動地描繪出了虛擬語音助手和人類日常生活的場景。
我曾在我的上一篇文章中講過chatbot聊天機器人,而虛擬助手也可以算是一種聊天機器人,但也有所不同。
聊天機器人在狹義上更多的是指現在市面上很多依托于移動端、PC端的對話機器人,這些聊天機器人的主要交互方式是觸屏或屏幕點擊,輔之語音。
而智能虛擬助手的載體就會豐富很多,它不僅依托于智能手機、Pad和PC端,它還會出現在音響上、汽車里、電燈、電冰箱等等各種家用電器中,也就是越來越“物聯網”化了。
01 智能虛擬助手 smart virtual assistant
如今,我們和手機、電腦的關系只是停留在人與工具的關系,通過操作它們我們可以與世界連接,給親人發微信,在購物網站搜索想要的東西買買買。
而智能虛擬助手作為一個機器人,一般都有一個叫起來朗朗上口的名字,有性別,還會叫自己為“我”,有的智能虛擬助手甚至還會有自己的性格。我們通過和智能虛擬助手交談與世界連接,叫它幫我們發送消息,叫它幫我們買買買。我們和智能虛擬助手的關系更像是人與人之間的關系。
siri剛剛推出的時候,很多人會喜歡問siri:“幾歲了,有沒有男朋友?”這樣的問題,就是因為此時的用戶多了一層“情感”。
1. 聲音的魅力
你是否有這樣的困擾,每天都要不斷地拿起手機,很難專注做一件事。
微軟的一份報告指出,我們的注意力從從 2000 年的 12 秒下降到 2020 年的 8 秒,低于平均水平的金魚。
現在的世界充斥著各種五花八門的app,我們的注意力正被不斷的分散。人類在閱讀的時候,眼睛會迅速掃描 —— 遠、近、上、下,所以一個奪人眼球的視覺效果把我們成功吸引后,過一會一個新的視覺效果又會再次奪走我們的注意力。
與視覺相比,我們的聽覺的注意力會高很多,由于我們的耳朵不會亂“動”,所以我們一次就只能專注一件事情,聽覺觸發的專注力持續性也更強。
芝加哥布斯大學行為科學教授Nicholas Epley在他的研究中寫到:“你無法看到另一個人的思想,但你可以聽到它?!?/p>
當我們用眼睛閱讀的時候,我們需要在我們的大腦中來模擬我們看到的內容。而當我們聆聽時,通過聲音的音調、音高、音色等,我們可以更深入的聽到別人的聲音特征和情緒狀態,聆聽給用戶的體驗會比閱讀更加親密、舒適、人性化,更容易使人產生信任。
近幾年,播客越來越火,有數據表明,大多數的播客聽眾都會收聽播客的結尾,播客的保留率相比其它媒體更高。同時播客的聽眾還會收聽結尾的廣告并采取行動,播客廣告的轉化率也要比其它媒體高的多。
正是因為聲音的這種「超能力」,注意力經濟的爭奪正逐漸從視覺注意力轉向聽覺注意力,為了保持對注意力經濟的控制,近些年世界各大科技巨頭都紛紛投資各種博客和虛擬語音助手,包括亞馬遜的Alexa、谷歌的 Google Assistant等等。
雖然前面講到聽覺注意力的魅力巨大,但是目前階段的用戶通過智能虛擬語音助手能做的也只是發出一些指令,一些很簡單的交互,比如詢問天氣、設置計時器、播放歌曲等,還遠沒有達到可以通過智能虛擬語音助手感受到交互式聆聽體驗的階段,在未來,這也許就需要我們設計師來繼續探尋。
2. 相機也能為智能虛擬助手助力
雖然語音是智能虛擬助手的主要交互媒介,但也不僅僅只限于語音。相機、照片也可以作為智能虛擬助手的交互媒介之一。
用戶只需要將相機對準一個對象,停留片刻,智能虛擬助手的后臺數據就會標記用戶對該對象感興趣,從而不斷迭代更新自己,變得越來越了解用戶。目前,蘋果、谷歌都已經開始研發這種技術,相信在未來相機作為智能虛擬助手交互媒介也會更普遍、更智能。
02 市面上的智能助手有哪些?
1. 亞馬遜Alexa
「Alexa」的名字來源于《星際迷航:原始系列》和《星際迷航:下一代》中的計算機語音和對話系統,開發人員使用Alexa這個名稱是因為X這個輔音可以準確的被識別。
- 公司:亞馬遜
- 喚醒詞:Alexa
- 主要載體:智能音箱Amazon Echo 、Echo Show
智能音箱Echo于2014年11月發布,有可以放置在任何地方的小型智能音箱,還有帶有大觸摸屏的智能音箱。小型智能音箱已經發行了4代,大型觸摸屏智能音箱的是近幾年才開始發售的。
2. Google Assistant
谷歌助手在2016年5月發布,依托于google平臺,它的優勢主要在于出色的語音識別性能、搜索準確度高。
- 公司:Google
- 喚醒詞:Hey Google
- 主要載體:智能音箱Google Home
智能音箱Google Home 于2016年11月在美國發布,可以播放音樂、收聽新聞,還支持智能家居,用戶可以通過語音命令控制家里的電器。
3. Siri
「Siri」一詞在挪威語中的意思是「帶領你走向勝利的美麗女神」。蘋果公司于2010年4月28日收購了Siri公司并重新開發后,Siri成為了蘋果設備的內置軟件,通過Siri用戶可以用自然語言和設備進行交互。
- 公司:Apple
- 喚醒詞:Hey Siri
- 主要載體:智能音箱Apple Homepod、Apple Homepod Mini
智能音箱Apple Homepod于2018年上市,支持Apple Music、Airplay和HomeKit,會自動將自己設置為家庭中樞以提供智能家居服務。也許是因為定價高昂,缺乏第三方支持,Homepod已于2021年3月停止生產。
4. 百度度秘DuerOS
DuerOS是百度度秘事業部研發的對話式人工智能操作系統,是百度全球領先人工智能技術的重要應用之一,借助百度的生態,DuerOS擁有海量數據和出色的中文識別能力。
- 公司:百度
- 喚醒詞:小度小度
- 主要載體:小度智能音箱
小度智能音箱于2018年6月發布,擁有1000萬小時的有聲內容和400多項生活常用技能,是智能音箱行業的新貴之一。
5. 阿里精靈AliGenie
AliGenie于2017年在云棲大會上推出,與其他虛擬助手類似,阿里精靈能夠進行智能家居控制,音樂播放,語音購物,播報天氣等。同時阿里精靈是一個開放平臺,允許不同制造商在該平臺上開發并將其內置到第三方產品中。
阿里精靈開放平臺:https://www.aligenie.com/
- 公司:阿里巴巴
- 喚醒詞:天貓精靈
- 主要載體:天貓精靈方糖、帶智能屏的天貓精靈
天貓精靈于2017年7月5日發布,2017年8月8日正式開售。是阿里巴巴人工智能實驗室研發的智能音箱,具有娛樂、生活、購物等多個領域的數百個功能。
6. 小愛同學
2017年9月小愛同學隨著小米電視發布,適用于小米的智能音響,手機,電視,手表及手環等穿戴設備,建構在小愛開放平臺數據庫上,可直接連接至米家物聯網系統。
- 公司:小米
- 喚醒詞:小愛同學
- 主要載體:小米小愛音箱、小米觸屏音箱
小愛音箱于2017年7月發布,能向用戶反饋日程、天氣、路況等信息,還具備設定鬧鐘、語音備忘等功能。小愛音箱還可以和小米智能家居產品進行捆綁,通過語音交互控制電視、盒子、掃地機器人、電飯煲、空氣凈化器、電風扇、智能燈等小米生態鏈設備。
03 智能虛擬助手設計
1. 智能虛擬助手設計與互聯網設計的區別
智能虛擬助手的體驗設計和傳統的互聯網體驗設計并沒有特別大的區別,我們在進行智能虛擬助手體驗設計的時候,完全可以借鑒互聯網體驗設計領域里的一些方法和原則。
但它們也并不完全一樣,由于智能虛擬助手設計以「語音交互」方式為主,所以還存在一些獨特的差異點。
1)智能虛擬助手設計更關注全流程的體驗
智能虛擬智能助手一個很大的特點就是依附的終端非常多,只要是個連接互聯網的智能設備,它都能存在。這個設備可以是電視、汽車、冰箱或者智能手表,多終端依附也是智能虛擬助手的一個非常大的競爭優勢。
而這一特點也就使得智能虛擬助手對設計師的要求和傳統的互聯網產品是截然不同的,設計師要關注用戶全流程的體驗,而不僅僅是局限于某一個終端。
比如,用戶剛剛在移動端觀看某電影,當他打開電視的時候,智能虛擬助手會詢問用戶是否繼續播放剛剛在移動端看的電影。
在智能虛擬助手的設計中,讓用戶能夠在不丟失上下文的情況下,在多個設備中靈活自如的切換,也是要重點關注的一個點。
2)智能虛擬助手設計存在更多不確定性
智能虛擬助手的主要交互方式就是語音對話交互,這種交互方式更接近人類的自然行為特征,與我們在一般的網頁或App中用手指或鼠標點按屏幕的形式不同。
語音交互會給用戶一種截然不同的感受,而這種感受會讓用戶覺得更加人性化,更開放,但這也就導致了智能虛擬助手存在更多的不確定性。
比如在App設計中我們可以使用二次彈窗來防止用戶出錯,出錯后可以撤回,但智能虛擬助手的防錯糾錯機制就更為復雜,可控性更低。
04 視覺側
如果問你,現在市面上的虛擬助手,比如siri、谷歌助手長啥樣子,你的腦海中會有印象嗎?也許你腦海中會有各種智能音箱的硬件形象,但是在軟件層面卻沒有一個具體的形象。
由于人工智能是很抽象的一個東西,并且是以語音交互為主,所以很難給人一種視覺上的存在感。所以現在談到智能虛擬助手的視覺,能讓人想到的的就是一個極具未來感的3D立體球或者波浪,隨著聲音的音調變化,這個立體球也會跟著產生動效。
05 交互側
由于智能虛擬助手的交互方式以語音交互為主,所以智能虛擬助手的交互設計和我們傳統互聯網產品的交互設計還是會有所不同,那么具體有哪些設計點需要我們去注意的呢?
1. 跳過冗長重復的歡迎語
當我們把我們家里的家用電器連接到智能虛擬助手時,經常會聽到一段「歡迎語」,告知用戶連接成功,該如何操作之類的話。
如果這段「歡迎語」在你每次連接成功或者打開時都會有,那么盡量使它不要太啰嗦,簡單一句話告訴用戶接下來該怎么辦即可。
冗長的歡迎語如果只在第一次出現那么還可以接受,但如果用戶已經對產品非常熟悉,每次打開都要聽這么一段長長的歡迎詞就相當于是APP中的加載等待延遲界面,用戶無法跳過,但必須要等待,這個時間越長,就會讓用戶越抓狂。
如果歡迎詞太長,還有一個弊端就是這種機械化重復的歡迎詞會讓用戶感覺不到智能虛擬助手的人情味。
智能虛擬助手采用語音交互的方式,區別于一般的手機和電腦觸屏,很大一點就是設計師希望智能虛擬助手可以在用戶心中扮演一個人類伙伴的角色,一個朋友或者一個管家,他們會和我們聊天,他們有性別、有名字,甚至還有一點自己的性格。
如果每次都出現一段這么官方且冗長的「歡迎詞」,會讓用戶感受不到這位智能虛擬助手的人性。
2. 別讓用戶記憶
人類的短期記憶是有限的,Jakob Nielsen的研究表明:短期記憶只能保存大約7塊信息,這些信息在20秒內就會在大腦中消失。
在觸屏交互中,所有信息全部展示在屏幕上,隨著用戶視線的移動,信息再進入到大腦中,用戶不需要記住屏幕中的全部信息,只需要專注于眼睛看到的那一塊信息。
設想一個你想讓智能虛擬助手推薦餐廳的場景,如果在觸屏界面中你會看到一個長長的列表將推薦的餐廳展示給你。
在語音交互中,人類短期記憶的影響就很大,如果智能虛擬助手一下子把這長長的一串飯店名報給你,你根本記都記不住,又該如何選擇呢?
那在語音交互中針對這個問題有什么解決方法呢?
方法一:分段說
我們在進行界面設計的時候,會有一個神奇的7+-2原則(就是指人的短期記憶的最佳狀態是一次最多記住 5~9 個選項信息,如果超出這個數字,人的記憶就會容易出錯),比方說我們在展示手機號的時候往往會拆成3段,這樣更便于用戶查看和記憶。
而這樣的方法同樣也可以運用到語音交互中,我們可以把一段長信息拆分成幾個更小更容易讓用戶記住的塊。
比如說我們可以讓智能虛擬助手先說幾個(這個數量要盡量少,讓用戶可以用短期記憶記住,一般建議 3 個),讓用戶先在一個小的集合內進行選擇,然后再詢問用戶是否想聽更多,這樣逐步跟進。
方法二:分類說
我們還可以先讓用戶根據興趣愛好篩選,把范圍縮小,這樣還能提高用戶的選擇效率。
3. 提升用戶的安全感
智能虛擬助手中的語音交互給用戶的是一種全新的體驗,新事物往往會給用戶一種不確定性、不安全感。這種不安全感在「反饋方式」方面表現得尤為突出。
比如,我現在設置了一個5分鐘的計時器,如果在手機界面,我們可以清晰直觀的看到倒計時數字一秒一秒的跳動,從而知道我的計時器正在運行。
有一句成語說得好,叫做「眼見為實」,看不見的東西往往很難讓人相信。在智能虛擬助手上我們看不見計時器的跳動,心里可能就會想,它在不在計時呢?過了5分鐘它會提醒我嗎?
在智能虛擬助手的語音交互中,好的反饋方式不僅可以減少不確定性,還能幫助提升用戶的信任感。那么不能使用視覺,應該怎樣反饋用戶呢?
4. 重復用戶的話
我們可以讓智能虛擬助手重復用戶說的話,來告訴用戶智能虛擬助手已經接收到的指令。智能虛擬助手也并不是100%準確的,如果用戶發現智能虛擬助手理解錯誤,那么他可以立馬讓其更正過來。
5. 及時追問
當用戶發出一個帶歧義或者不清晰的指令時,智能虛擬助手也要繼續追問用戶,確定情況,減少失誤。這樣不僅有利于提升用戶信任感,還可以促進用戶與智能虛擬助手之間的「人際關系」。
6. 允許用戶修改數據
在界面設計中,我們在完成某個任務流程時,會遇到返回修改數據的情況。在和智能虛擬助手進行交互時,我們也要允許用戶返回修改之前的數據。
7. 智能虛擬助手交互方式不要復雜化
上一點我提到,我們在和智能虛擬助手進行語音交互時,需要讓用戶可以修改數據。我親自測試了某頭部公司的智能音箱,目前也暫不允許用戶通過語音交互修改數據的操作,如果想要修改必須要到手機App中進行修改。
其實這是目前很多智能虛擬助手的現狀,就連蘋果Siri也是如此,雖然蘋果公司鼓勵用戶盡量通過語音的方式使用Siri,但交互的重要部分還是需要觸摸屏觸摸。
也許是受限于技術原因,但我們作為設計師需要有這個意識,就是既然我們選擇語音交互作為智能虛擬助手的主要交互方式,那我們就要盡量讓我們的用戶僅通過語音就可以完成任務,這樣才是一個真正讓人愉快的語音交互。
8. 為用戶提供定制化體驗
人工智能機器人一個很大的魅力就在于它有機器學習能力,關于機器學習大家可以看我的上一篇文章《如何設計聊天機器人?》。
擁有機器學習能力的機器人就會變得很「聰明」,根據用戶頻繁說的或做的事情,機器人會慢慢搜集這些信息,當逐漸了解用戶的喜好和習慣之后,將它們逐步轉化為用戶價值,為用戶提供更合適、優質的服務體驗。
但這樣擁有機器學習能力的智能虛擬助手在智能家居中還是會遇到問題,比如說你家里有一個智能音箱,每天都會用它來播放你愛聽的音樂,當你結婚了,家里還多了一個小baby,你的智能音箱就會經常播放許多兒童音樂,它會認為是「你」喜歡這些兒歌。
當你自己一個人想聽音樂的時候,還是給你推薦了兒歌,那樣你的體驗也會變得很糟糕。
亞馬遜已經在嘗試解決這個問題,它們推出了一種語音識別系統,可以根據命令它的人的聲音來配置文件,這個技術已經越來越成熟,希望以后我們虛擬助手都能「智能」的為家里的每一個成員提供專屬于他們自己的定制化體驗。
9. 鏡像用戶的說話方式回應他
想象一個場景,如果你現在在圖書館里看書,你想讓對面坐著的一位陌生人幫你遞一下書,你會和他說:“你好,請問可以幫我遞一下那本書嗎?”,當對方遞完后,你會禮貌的回一句“謝謝”。
另一個場景,你和你最好的朋友一起在圖書館看書,你想讓坐在對面的他幫你遞一下書,此時你和他說:“你好,請問可以幫我遞一下那本書嗎?”,遞完然后回他一句“謝謝”,他肯定以為你“中邪”了。
人與人之間的對話方式往往由他們之間的關系決定,就算是相同的意思,說話的方式也可以截然不同。陌生人之間的對話會添加很多的禮貌用語,對話會更冗長、更正式;而熟人之間的對話就會比較簡潔。
在進行智能虛擬助手的交互設計時,我們需要關注到用戶的說話方式,讓智能虛擬助手在回答用戶的時候,鏡像用戶說話的語氣和正式程度,這樣會讓他們感覺更舒適自然。
如果用戶喜歡簡短高效的說話方式,那么就簡單利索的回復他;如果用戶喜歡用一些禮貌用語,那么也要禮貌的回應他。
10. 注意聲音和界面風格的一致性
雖然說智能虛擬助手以語音交互為主,但它肯定還是會對應有智能手機或pad端的頁面,而這些頁面的視覺風格也需要和虛擬助手的聲音匹配。
在這里先給大家做一個小題目:
虛擬助手小寧同學是一位聲音柔和的軟妹子,而虛擬助手大瓜是一位聲音渾厚有力的男聲,那么下面兩張圖分別適合他們哪個呢?
圖片的顏色、圖形都會傳遞給用戶一種感受,而聲音的音色、音調也同樣會傳遞給用戶一種感受。我們在進行智能虛擬助手的設計時,會著重關注智能虛擬助手傳遞給用戶的“人設”感受。智能虛擬助手會存在在智能手表、手機、汽車和各種家用電器的面板中,合適的界面風格會幫助建立這種“人設”形象。
11. 不要本末倒置
智能虛擬助手的最大的亮點就在于它背后的人工智能技術,這項技術可以為用戶帶來極大的便利性并提升用戶體驗。
作為用戶體驗設計師,我們不能在沒有明確目標場景的情況下,就為我們的智能虛擬助手“硬塞”入人工智能技術,讓別人覺得我們的產品很酷、很前衛,但忘記了用戶使用產品的目的和體驗。
我們需要在心中始終謹記:人工智能只是服務于產品、幫助產品為用戶提供價值的一種技術。不能先想到我們有哪些技術,然后再去想象產品功能應該是什么樣的,這是本末倒置的。
12. 聆聽用戶說的每一個詞
我們的智能虛擬助手在詢問用戶的時候,一般只會提問比較具體的某一個點,然后再逐層追問。
但有的用戶會習慣把他的需求一起說出來,這個時候我們需要分析記錄用戶說的所有信息,來幫助用戶快速達成目的,而不是獲取到我們想要的答案后,用戶說的別的信息就直接忽略。
13. 不要放大用戶的錯誤
用戶在和我們的智能虛擬助手對話的時候,有的時候并不會按照提問的方式進行回答,這往往會導致系統識別不了用戶的回答,為了得到可識別的答案,有的系統會以“教導”的形式告訴用戶,應該怎么怎么說。
這種形式一來很啰嗦,二來這種類似命令的口吻會把用戶的錯誤放大化,從而讓用戶感到很受挫。這里可以采用輕量化的方式,再次向用戶發出提問,在不讓用戶察覺的情況下,“糾正”自己的回答。
14. 竭盡全力幫助用戶
智能虛擬助手扮演的是用戶的“助理”角色,作為一個得力的小助理,在用戶有困擾的時候,我們需要竭盡全的幫助用戶,比如盡可能多的提供信息。
15. 不要說與當前對話無關的細節
在與用戶描述信息時,不要說一些不重要、無用且重復的細節,這樣不僅會加重用戶的短期記憶負擔,還會讓用戶經歷漫長的等待而逐漸失去耐心。
16. 不要限制用戶的回答
我們不能一開始就要求用戶以系統要求的規范去回答問題,而是要以用戶優先,讓用戶先按照他自己習慣的方式回答,然后引導用戶完善答案,從而符合規范。這樣用戶的感官體驗會輕松許多,不會有一種被約束的感覺。
06 智能虛擬助手面臨的威脅
智能虛擬助手雖然是未來炙手可熱的話題之一,但其所面臨的安全性問題也飽受爭議。
1. 幫助兒童隔離敏感內容
智能虛擬助手如果在家用設備中,家庭中的每一個成員都可以與它交互,當兒童使用的時候,需要他們接觸到敏感內容,這就需要生物識別技術進行判斷當前用戶是否為兒童,這個方面也是很重要的。
2. 多用戶使用時的隱私性
當智能虛擬助手設備被多個成員同時使用時,一個可靠的安全系統就變得尤為重要,每個人都不希望自己的隱私被侵犯。
目前行業中比較有前途的一種認證方式就是語音生物識別技術,有研究表明,語音識別的準確率可達到95%
3. 偽造錄音、合成語音
還有一個比較棘手的問題就是智能虛擬助手設備對假的錄音、合成語音的識別,目前已經有相關技術來解決這個問題,但是該技術依舊很不成熟。也有一些人指出,可以把語音識別和別的認證方式(比如人臉識別、指紋掃描)相結合,來提升安全性。
07 智能虛擬助手的未來
現在智能虛擬助手的主要應用在家用c端領域,在未來,智能虛擬助手會更廣泛的應用到b端領域。比如智能虛擬助手會應用在實體店、政府機構中,為用戶提供店鋪中的相關服務,比如辦理簽證、駕照等。
在智能辦公、智能城市中也會運用到虛擬助手,比如智能虛擬助手可以幫助安排會議、記錄會議紀要等。
本文由@陳婉寧 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
寫得好,求認識~(算半個同行)
語音交互有時候方便有時候又很不方便,特別是對于說方言或說話有口音的人來說
跟虛擬助手對話倒是很有趣,有時候會有它們是否真是人的錯覺。
相信虛擬助手未來會被運用到更廣泛的領域,提高了人類的生活幸福感。
滿滿干貨!個人很看好虛擬助手對我們未來生活的助力作用!
智能虛擬助手很大程度上便利了人們的生活,也很受人們的歡迎
非常看好智能虛擬助手未來的發展趨勢,能很好的幫助我們的生活,感覺好智能啊