心理學(xué)角度思考:兒童語(yǔ)音機(jī)器人VUI設(shè)計(jì)(早教篇)

3 評(píng)論 6340 瀏覽 69 收藏 20 分鐘

我曾給我外甥和外甥女買(mǎi)過(guò)語(yǔ)音機(jī)器人-撲閃著兩只萌萌大眼,配上胖墩墩的mini人物外形,本來(lái)以為會(huì)深受兩個(gè)小不點(diǎn)的喜好,誰(shuí)知兩小不點(diǎn)在夜里被機(jī)器人嚇得之后都不敢靠近。正如Meadows曾提出“恐怖谷理論”:與人類(lèi)極其相近但不完全相同的事物容易引起人的恐慌,也因這件事引發(fā)了我對(duì)兒童語(yǔ)音產(chǎn)品的探究。

如下圖:

恐怖谷理論

行業(yè)產(chǎn)品研究

簡(jiǎn)單總結(jié)業(yè)內(nèi)兒童語(yǔ)音機(jī)器人做的比較出色的其中三家(并未窮盡,聊表敬意):科大訊飛的阿爾法蛋、狗尾草的公子小白、ROOBO的布丁豆豆??偨Y(jié)有誤之處還請(qǐng)指正。

(1)水平對(duì)比分析:下圖部分展示三家公司產(chǎn)品中其中三款產(chǎn)品的定位和交互、展示方式,且得到小結(jié)論:

  • 主要面向0-16歲人群群體;
  • 產(chǎn)品定位主要涉及兒童呵護(hù)、兒童教育(早教、學(xué)習(xí)指導(dǎo))、生活助理;
  • 教學(xué)內(nèi)容基本為早教至初三前教學(xué)資源,少量涉及高中教學(xué)知識(shí);
  • 交互形式主要包括VUI(語(yǔ)音用戶(hù)界面)、GUI(圖形用戶(hù)界面);
  • AI技術(shù)包括聲紋識(shí)別、ASR(語(yǔ)音轉(zhuǎn)文字識(shí)別)、自然語(yǔ)言處理和對(duì)話(huà)管理、語(yǔ)音合成、計(jì)算機(jī)視覺(jué)OCR(文字識(shí)別)、TTS(文字轉(zhuǎn)語(yǔ)音識(shí)別)、知識(shí)圖譜。

(2)垂直對(duì)比分析:將同家公司旗下的不同版本的語(yǔ)音機(jī)器人產(chǎn)品進(jìn)行功能對(duì)比。

科大訊飛旗下有大蛋、小蛋、超能蛋、金龜子等,四款產(chǎn)品明顯區(qū)別:

  • 大蛋有屏幕和攝像頭,可以滿(mǎn)足比如視頻通話(huà)、安全監(jiān)控、聲控拍照等關(guān)于視頻方面的操作需求,其它三款沒(méi)有。
  • 大蛋和超能蛋是語(yǔ)音喚醒,小蛋和金龜子蛋是按鍵喚醒。

狗尾草旗下有公子小白成長(zhǎng)版I、公子小白成長(zhǎng)版II、公子小白青春版、公子小白Pro等,旗下產(chǎn)品比較清晰地劃分目標(biāo)群體用戶(hù),成長(zhǎng)版II主要針對(duì)嬰幼兒,成長(zhǎng)版I主要針對(duì)學(xué)齡前至少年期,青春版主要針對(duì)青年期,Pro版主要針對(duì)成年期。

成長(zhǎng)版和成長(zhǎng)版II的明顯區(qū)別:

  • I版有記憶調(diào)教,II版沒(méi)有,考慮學(xué)齡前至少年期兒童群體心智已較成熟且口頭表達(dá)能力較流暢;
  • I版為語(yǔ)音喚醒,II版為按鍵喚醒,考慮鍛煉兒童動(dòng)手能力和降低嬰幼兒因口齒不清喚醒機(jī)器人的難度。

ROOBO旗下有布丁機(jī)器人1S、布丁綠豆、布丁迷你豆、布丁豆豆慧讀版等,區(qū)別在于:

  • 布丁綠豆是1S的版本升級(jí),增加了觸摸操控+屏幕表情,雙插電充電+升級(jí)電池、記憶功能、學(xué)習(xí)報(bào)告、視頻功能、豐富了教學(xué)資源;
  • 布丁豆豆慧讀比綠豆增加了繪本讀書(shū)器功能;
  • 迷你豆比綠豆減少屏幕,增加微聊和胎教教學(xué)內(nèi)容。

小結(jié)思考:“是否需要為兒童提供屏幕動(dòng)態(tài)視頻展示功能”、“是否需要針對(duì)不同年齡段兒童制作不同功能版本的機(jī)器人”是我在了解行業(yè)產(chǎn)品后發(fā)現(xiàn)的有趣探討點(diǎn),在接下來(lái)“心理學(xué)角度思考:兒童語(yǔ)音機(jī)器人VUI設(shè)計(jì)”系列會(huì)進(jìn)一步涉及個(gè)人觀點(diǎn)。

心理學(xué)角度思考:兒童語(yǔ)音機(jī)器人VUI設(shè)計(jì)(早教篇)

第一步:確定目標(biāo)用戶(hù)群體

意大利著名的“蒙特梭利教育理念”提到:寶寶在6歲前不同階段對(duì)語(yǔ)言、動(dòng)作、細(xì)節(jié)、程序、書(shū)寫(xiě)、閱讀等特別敏感,該段時(shí)期稱(chēng)為“敏感期”,抓住該段時(shí)期讓孩子從無(wú)意識(shí)狀態(tài)過(guò)渡到有意識(shí)狀態(tài),并建立起寶寶所特有的心理結(jié)構(gòu)和語(yǔ)言表達(dá)機(jī)制。

0-6歲孩子八大敏感期如下:

本篇主要研討早教語(yǔ)音機(jī)器人VUI設(shè)計(jì),目標(biāo)用戶(hù)群體為0-6歲嬰幼兒群體。

第二步:樹(shù)立VUI人格特質(zhì),選取符合產(chǎn)品形象的音色

Cathy Pearl在《語(yǔ)音用戶(hù)界面設(shè)計(jì)》一書(shū)中曾提到:

“用戶(hù)會(huì)將你的VUI人格化,無(wú)論你是否有意讓用戶(hù)這樣做,他們都會(huì)認(rèn)為VUI具有某種人格特質(zhì),最好做法是你自己在設(shè)計(jì)時(shí)就確定好VUI人格?!?/p>

Siri的高冷女性形象、微軟小冰的賣(mài)萌逗趣小可愛(ài)、小愛(ài)同學(xué)的青春二次元美少女便是主動(dòng)打造VUI虛擬角色、樹(shù)立不同人格特質(zhì)的做法。

而0-6歲嬰幼兒最需要家人陪伴,因此機(jī)器人形象樹(shù)立為年輕溫和的寶爸或?qū)殝專(zhuān)捎诓煌彝毎謱殝屌惆楹⒆拥臅r(shí)間各異,可構(gòu)建兩種形象版本讓用戶(hù)切換選擇,比如:某戶(hù)家庭中陪伴孩子時(shí)間比較少的是爸爸,用戶(hù)可以選擇“寶爸”版本,讓語(yǔ)音產(chǎn)品填補(bǔ)寶寶缺乏的來(lái)自父母某方的陪伴。

而機(jī)器人語(yǔ)音音色的選擇需要和產(chǎn)品形象保持一致,需要溫和不嚴(yán)厲的年輕音色。目前科大訊飛已經(jīng)推出聲音復(fù)刻技術(shù)在小范圍群體使用,往后若聲音復(fù)刻技術(shù)達(dá)到推廣應(yīng)用水平,或許可讓用戶(hù)通過(guò)復(fù)刻自身聲音來(lái)自主定義機(jī)器人語(yǔ)音音色,使得寶寶更真切感受到家人的陪伴。

第三步:明確產(chǎn)品定位,構(gòu)思功能,繪制VUI流程圖

流程圖在IVR(互動(dòng)式語(yǔ)音問(wèn)答)設(shè)計(jì)中用于展示VUI系統(tǒng)所有可能發(fā)生路徑的圖示,在繪制流程圖前要先根據(jù)產(chǎn)品的定位和目標(biāo)確定產(chǎn)品功能。

  • 產(chǎn)品定位為:早教+陪護(hù)。
  • 產(chǎn)品目標(biāo)包括三項(xiàng):開(kāi)發(fā)智力、關(guān)注心理健康、保障安全。

Part 1 : 產(chǎn)品功能考慮細(xì)節(jié)

屏幕視頻功能考慮:

針對(duì)早教是否需搭配動(dòng)態(tài)視頻展示這個(gè)問(wèn)題,有的機(jī)器人產(chǎn)品考慮保護(hù)孩童視力不建議增加動(dòng)態(tài)視頻功能。

個(gè)人觀點(diǎn)是:根據(jù)“蒙特梭利教育理念”提到的0-6歲寶寶的“感官敏感期”,4個(gè)月左右時(shí),寶寶大腦中負(fù)責(zé)聽(tīng)覺(jué)、語(yǔ)言、嗅覺(jué)的顳葉和枕葉會(huì)變得更加活躍,色彩鮮艷、情節(jié)簡(jiǎn)單的擬人卡通視頻會(huì)對(duì)他們更有吸引力,且在有助在其不識(shí)字狀態(tài)幫助理解學(xué)習(xí)。感官的全面調(diào)動(dòng)也有助于開(kāi)發(fā)寶寶智力。

互動(dòng)游戲功能考慮:

同時(shí),“蒙特梭利教育理念”提到:孩童6個(gè)月后會(huì)進(jìn)入咿呀學(xué)語(yǔ)模仿階段,9個(gè)月左右進(jìn)入語(yǔ)言理解階段,13個(gè)月左右可進(jìn)入以詞帶句教育階段,下圖舉例了3-6歲孩童的語(yǔ)言能力發(fā)展目標(biāo)。

此階段要讓孩童多與環(huán)境中對(duì)應(yīng)的事物互動(dòng)并鼓勵(lì)說(shuō)出來(lái)、培養(yǎng)孩童的專(zhuān)注力和聽(tīng)力等,這種情況下趣味性的互動(dòng)游戲便不可或缺。

引用《蒙特梭利:兒童語(yǔ)言能力訓(xùn)練》

虛擬表情動(dòng)態(tài)功能考慮:

美國(guó)著名的心理學(xué)家丹尼爾.西格爾在《全腦教養(yǎng)法》中提過(guò)“印證式傾聽(tīng)”,而印證式傾聽(tīng)的前提是讓對(duì)方感受到自己是在用心了解其觀點(diǎn)。孩童渴望得到關(guān)注和聆聽(tīng),因此當(dāng)機(jī)器人跟寶寶在溝通對(duì)話(huà)時(shí),搭配上虛擬表情狀態(tài),表達(dá)對(duì)溝通者的關(guān)注和喜怒哀樂(lè)情緒的共情。

狀態(tài)追蹤監(jiān)護(hù)功能考慮:

如果要打造寶寶狀態(tài)追蹤監(jiān)護(hù)功能,機(jī)器人硬件最好設(shè)計(jì)為可移動(dòng)+室內(nèi)空間定位,搭配計(jì)算機(jī)視覺(jué)技術(shù)。家長(zhǎng)可在離家時(shí)開(kāi)啟寶寶追蹤監(jiān)控,通過(guò)人物識(shí)別確定追蹤對(duì)象身份而追隨其活動(dòng),重點(diǎn)識(shí)別是否進(jìn)入危險(xiǎn)區(qū)域和人體姿態(tài)識(shí)別其是否出現(xiàn)摔倒等狀況。打造該功能時(shí)產(chǎn)品方需要承擔(dān)責(zé)任風(fēng)險(xiǎn)和考慮孩童抵觸心理,以及遇到像掃地機(jī)器人無(wú)法抵達(dá)家里某些空間的問(wèn)題。

磨牙功能考慮:

寶寶6歲后進(jìn)入探索事物的萌芽期,把抓到的東西放入嘴里啃咬是他們探索世界、尋求安全感的一種方式,且長(zhǎng)牙階段的難受使得寶寶更頻繁咬東西。弗洛伊德的兒童心理學(xué)理論將該階段稱(chēng)為口唇期,阻止孩童啃咬東西容易導(dǎo)致孩童長(zhǎng)大后缺乏安全感和咬手指等壞習(xí)慣,因此要主動(dòng)給寶寶提供安全衛(wèi)生耐啃咬的產(chǎn)品。

Part 2 : 確定總產(chǎn)品功能(以下功能只是部分舉例)

【早教功能】

  • 英語(yǔ)動(dòng)畫(huà)視頻教學(xué)+中英互譯;
  • 故事詩(shī)歌等中文視頻教學(xué);
  • 雙語(yǔ)語(yǔ)言游戲;
  • 知識(shí)百科(兒童百科知識(shí)+育兒知識(shí))。

【陪護(hù)功能】

  • 關(guān)注心理健康的AI對(duì)話(huà)+虛擬表情動(dòng)態(tài);
  • 兒童歌曲;
  • 微聊+雙視頻通話(huà)+狀態(tài)追蹤監(jiān)護(hù);
  • 童鎖+防近視屏幕;
  • 定時(shí)提醒;
  • 家居設(shè)備中控;
  • 防摔耐磨+安全磨牙材質(zhì)。

Part 3 : 繪制VUI流程圖

VUI流程圖設(shè)計(jì)關(guān)注點(diǎn)如下:

  • 設(shè)計(jì)的可發(fā)現(xiàn)性:讓用戶(hù)知道IVR系統(tǒng)都能為其做什么;
  • 設(shè)計(jì)的完整性和可退出性:確保每個(gè)狀態(tài)豆包含一組通用組件,如:主菜單、幫助、操作、重復(fù)、退出;
  • 根據(jù)用戶(hù)使用時(shí)間間隔,區(qū)分新用戶(hù)和老用戶(hù)的提示設(shè)置;
  • 針對(duì)異常情況的應(yīng)答處理;
  • 每個(gè)狀態(tài)的記憶選項(xiàng)不超過(guò)7個(gè),當(dāng)記憶選項(xiàng)過(guò)多時(shí)采取GUI+VUI結(jié)合的交互方式。

【第一種VUI流程圖】

  • 優(yōu)勢(shì):每個(gè)分支用戶(hù)記憶選項(xiàng)比較少;
  • 劣勢(shì):用戶(hù)交互步驟較為繁瑣。

【第二種VUI流程圖】

  • 優(yōu)勢(shì):用戶(hù)交互步驟比較簡(jiǎn)潔;
  • 劣勢(shì):每個(gè)分支用戶(hù)記憶選項(xiàng)比較多,需要搭配GUI進(jìn)行交互。

第四步:兒童對(duì)話(huà)場(chǎng)景設(shè)計(jì)思考

Part 1 : 語(yǔ)音對(duì)話(huà)技術(shù)實(shí)現(xiàn)原理

(該圖出處不明確,知道原作者請(qǐng)告知,我加以注明)

以一張圖講述語(yǔ)音交互系統(tǒng)實(shí)現(xiàn)原理,幫助對(duì)語(yǔ)音交互理解,在語(yǔ)音對(duì)話(huà)技術(shù)實(shí)現(xiàn)過(guò)程中的需要注意的事項(xiàng):

  • 實(shí)現(xiàn)多輪對(duì)話(huà)和長(zhǎng)依賴(lài)關(guān)系,解決對(duì)話(huà)問(wèn)題;
  • 處理一詞多義,語(yǔ)言消歧、否定詞問(wèn)題;
  • 對(duì)用戶(hù)情感理解解析,對(duì)不同狀態(tài)下語(yǔ)氣詞表示含義的識(shí)別和反饋;
  • 良好的端點(diǎn)檢測(cè)功能引擎,如何更好實(shí)現(xiàn)語(yǔ)音降噪;
  • 如何保障用戶(hù)數(shù)據(jù)隱私和數(shù)據(jù)安全不泄漏。

Part 2 : 調(diào)研常見(jiàn)情景,構(gòu)建對(duì)話(huà)邏輯,設(shè)計(jì)用戶(hù)指令集

面對(duì)紛繁復(fù)雜的用戶(hù)使用情景,可以區(qū)分使用人群,了解不同人群常見(jiàn)使用情景而重點(diǎn)梳理構(gòu)建對(duì)話(huà)邏輯,在此要考慮到的是:兒童早教機(jī)器人的用戶(hù)群體不僅有孩童,還有孩童的家人等成人群體。

本次選取用戶(hù)使用中文早教功能來(lái)構(gòu)建對(duì)話(huà)邏輯:

針對(duì)中文早教的用戶(hù)使用場(chǎng)景,<course>、<grade>、<type>是設(shè)計(jì)用戶(hù)指令集時(shí)設(shè)置的槽位(slot),下圖列舉部分用戶(hù)指令:

Part 3 : 通用的語(yǔ)音對(duì)話(huà)設(shè)計(jì)注意事項(xiàng)

根據(jù)Cathy Pearl在《語(yǔ)音用戶(hù)界面設(shè)計(jì)》的理論,匯總語(yǔ)音對(duì)話(huà)設(shè)計(jì)通用注意事項(xiàng):

  • 對(duì)話(huà)的親切自然、簡(jiǎn)短突出要點(diǎn),加入基本對(duì)話(huà)禮儀,不要責(zé)怪用戶(hù),語(yǔ)速適中;
  • 設(shè)置自然的啟動(dòng)和結(jié)束對(duì)話(huà)模式,利用啟動(dòng)效應(yīng)讓用戶(hù)知道提問(wèn)進(jìn)度;
  • 針對(duì)復(fù)雜問(wèn)題,給出答案格式實(shí)例;設(shè)置更好的問(wèn)題結(jié)構(gòu),避免問(wèn)到一半,用戶(hù)已搶先回答出不規(guī)范的答復(fù);
  • 構(gòu)建N-Best列表,根據(jù)可能性和置信度排序問(wèn)題答案,解決部分語(yǔ)音識(shí)別錯(cuò)誤問(wèn)題,兼容用戶(hù)更多不同形式的回復(fù);
  • 適當(dāng)?shù)亟o用戶(hù)反饋,包括給用戶(hù)確認(rèn)、系統(tǒng)出現(xiàn)等待時(shí)間時(shí)候等的反饋;
  • 區(qū)分無(wú)語(yǔ)音超時(shí)(NSP)和語(yǔ)音終止超時(shí)來(lái)設(shè)置語(yǔ)音超時(shí)時(shí)間,如確定用戶(hù)說(shuō)完喚醒詞后無(wú)語(yǔ)音超時(shí)時(shí)間,一般建議為10s;
  • 允許用戶(hù)打斷語(yǔ)音,可用“魔法詞”作為打斷語(yǔ)音的暗號(hào);
  • 增強(qiáng)錯(cuò)誤提示,進(jìn)階錯(cuò)誤行為提醒;
  • 根據(jù)不同置信度采用語(yǔ)言或非語(yǔ)言的確認(rèn)方案;
  • 處理微妙的話(huà)輪轉(zhuǎn)換形式,比如:“嗯嗯”;
  • 增加聲紋識(shí)別,讓IVR系統(tǒng)認(rèn)主。

而面對(duì)兒童群體,還需要注意兒童群體存在發(fā)音口齒不清和吞音、尾音過(guò)短等問(wèn)題,特別是有的孩童在3-6歲期間會(huì)出現(xiàn)短暫的口吃、失語(yǔ)癥問(wèn)題,要如何設(shè)計(jì)N-Best列表?

Part 4 : 在通用設(shè)計(jì)原則基礎(chǔ)上,結(jié)合兒童心理學(xué),設(shè)計(jì)對(duì)話(huà)應(yīng)答腳本

個(gè)體心理學(xué)派的創(chuàng)始人阿爾弗雷德.阿德勒在《兒童人格教育》一書(shū)中曾提到:兒童心理問(wèn)題包括自卑、因心理補(bǔ)償而出現(xiàn)的膨脹野心、缺乏安全感、懶惰、焦慮、孤僻、依賴(lài)等。

此部分思考針對(duì)孩童陪護(hù)功能,針對(duì)孩童缺乏安全感的心理問(wèn)題,結(jié)合丹尼爾.西格爾的全腦教養(yǎng)法理論來(lái)設(shè)計(jì)對(duì)話(huà)應(yīng)答腳本。

而丹尼爾.西格爾在《全腦教養(yǎng)法》提出:左腦是邏輯、語(yǔ)言的、求實(shí)的,而右腦是情感、非語(yǔ)言、經(jīng)驗(yàn)化的。單獨(dú)依賴(lài)右腦會(huì)引起感情泛濫、依賴(lài)左腦會(huì)引起情感荒蕪。當(dāng)孩童遇到不好經(jīng)歷而拒絕表明傷痛,這樣的情感處理方式是退回左腦處于情感荒蕪狀態(tài),如果不正確梳理容易造成孩童長(zhǎng)大后缺乏安全感和對(duì)對(duì)應(yīng)事物產(chǎn)生恐懼心理。

很多人會(huì)采用避開(kāi)談?wù)摵⒆釉庥龅膫?,而正確的做法是引導(dǎo)孩子復(fù)述故事,幫助孩子整合左右腦,通過(guò)調(diào)用右腦理順細(xì)節(jié),然后引入右腦重訪(fǎng)情緒,讓孩子正面其內(nèi)心的擔(dān)心、害怕,隨之讓孩子意識(shí)到其在整個(gè)過(guò)程并非孤立無(wú)援,意識(shí)到問(wèn)題已經(jīng)解決過(guò)去?;蛘咄ㄟ^(guò)分享經(jīng)歷故事安撫情緒。

? ?錯(cuò)誤做法

?正確做法

以下舉例針對(duì)兒童遭遇不好情景或缺乏安全感時(shí)的對(duì)話(huà)腳本(script):

門(mén)外漢的膚淺觀點(diǎn)暫告一段落~

Thanks!

 

本文由 @唐吖年 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自網(wǎng)站

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 大腦左右半球可以分開(kāi)執(zhí)行高級(jí)心理機(jī)能是錯(cuò)誤的觀點(diǎn)。腦在執(zhí)行一個(gè)任務(wù)時(shí)激活的腦區(qū)非常廣泛,fMRI分析中會(huì)發(fā)現(xiàn)個(gè)別腦區(qū)為單側(cè)激活,多數(shù)腦區(qū)仍是雙側(cè)激活,且單側(cè)激活的腦區(qū)中左側(cè)和右側(cè)激活的腦區(qū)往往都是有的。

    引用心理的文獻(xiàn)請(qǐng)不要使用大眾讀物,謝謝!

    回復(fù)
    1. (*^_^*)謝謝大神指導(dǎo),文章中該點(diǎn)言論來(lái)自于美國(guó)心理學(xué)家丹尼爾的《全腦教養(yǎng)法》,每位大牛級(jí)人物術(shù)業(yè)有專(zhuān)攻,不確定是否左右腦功能這點(diǎn)神經(jīng)學(xué)知識(shí)丹尼爾大神是否有講錯(cuò),大神能否附上fmri的學(xué)校資料查看渠道,我進(jìn)一步學(xué)習(xí)了解。我只大概知道:功能性核磁共振成像技術(shù)可以顯示大腦各個(gè)區(qū)域內(nèi)靜脈毛細(xì)血管中血液氧合狀態(tài)所起的磁共振信號(hào)的微小變化,而實(shí)驗(yàn)得到的結(jié)果很感興趣想進(jìn)一步了解~

      回復(fù)