国产亚洲综合久久无码,黄色A级毛片,欧美一级性爱一级日本

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

阿里 AI——智能互動設(shè)備的探索設(shè)計(jì)

子邑

2018-09-10

2 評論 9085 瀏覽 53 收藏

16 分鐘

設(shè)計(jì)也需要在每個場景中分別做出判斷，行業(yè)通用的部分沉淀，以及行業(yè)特性的個性化設(shè)計(jì)思考，都是需要不斷的去嘗試和打磨的。而智能互動設(shè)備作為一種趨勢，也是設(shè)計(jì)師去發(fā)揮所長的沃土。

5號小蜜：智能互動設(shè)備的初期準(zhǔn)備

在如今智能硬件設(shè)備，語音互動的大趨勢下，我們針對實(shí)體智能互動的硬件，從想法?–?設(shè)備?–?技術(shù) –?設(shè)計(jì) – 場景，總結(jié)沉淀了部分探索經(jīng)驗(yàn)。

首先交代一下背景：

在阿里小蜜語音助手的形態(tài)下，延伸出了很多智能相關(guān)的研究和探索，其中智能硬件也是我們想要去發(fā)展的一部分。在這種情況下，以“5號小蜜”為名稱的智能互動硬件設(shè)備應(yīng)勢而生。

（名稱解釋：在決定做這個產(chǎn)品的初期，是以落地到公司的5號行政樓為場景的前提下進(jìn)行的設(shè)想，所以叫“5號小蜜”）。

在有了這個想法后，5號小蜜進(jìn)行了1.0版本的研究和設(shè)計(jì)，在項(xiàng)目初期我們的承載硬件主要是以55寸，比例為16：9的液晶屏幕為主，用機(jī)器人的虛擬形象進(jìn)行語音的互動，其中的場景設(shè)定也是在訪客進(jìn)入到5號行政樓進(jìn)行互動的能力。

智能互動設(shè)備的框架拆解

在有了初步的進(jìn)展之后，我們以設(shè)計(jì)師的視角總結(jié)了智能互動類設(shè)備的基礎(chǔ)框架，為我們之后的升級和完善進(jìn)行了整體的方向指導(dǎo)。

首先智能互動設(shè)備的核心支撐能力一定是算法的能力，而當(dāng)前市面上的智能硬件大多數(shù)是以語音助理的形態(tài)出現(xiàn)的，因此對于設(shè)計(jì)師來說，VUI是重要的一環(huán)，5號小蜜不單單是語音的交互，也是視覺上的交互。因此在感知層面的設(shè)計(jì)上來說，是“VUI+GUI”也就是聽覺和視覺的互動（但在硬件多樣發(fā)展的今天，觸覺類也應(yīng)該是要考慮到感知層面的一部分）。

VUI+GUI對比傳統(tǒng)語音交互會有一些優(yōu)勢體現(xiàn)：在互動方面，語音可以理解為面，單一面?zhèn)鬟f信息是有限的，如果語音和界面結(jié)合起來，就是從兩個單一面形成了空間，可以承載更多的信息。

舉個例子：人與人在交流中不止是語言傳遞的互動，可以從面部表情、傳遞出喜怒哀樂；肢體語言傳遞出興奮度和性格特質(zhì)。綜合起來，我們的交流才會更順暢。

在物理層面而言，是硬件設(shè)備的選擇：液晶屏幕、玻璃屏幕（透明、非透明）、全息投影等。

在初期，我們的選擇是液晶屏幕，這個是最基礎(chǔ)的承載硬件，也是成本最低的硬件。而其它選擇的硬件也有優(yōu)劣之分，透明玻璃屏適合導(dǎo)購的場景，背后是否有商品的出現(xiàn)，是從傳統(tǒng)的觸覺互動進(jìn)行了更多承載信息的進(jìn)化。非透明玻璃屏適合更沉浸的助理場景，全息投影會更接近真人的感受，也是智能感受最強(qiáng)的一類，每一種硬件方式都有適合的場景，這個是我們需要去權(quán)衡的。

在以設(shè)計(jì)師的身份參與過程中，我們更多的是以設(shè)計(jì)的視角和硬件、場景、技術(shù)等進(jìn)行搭配合作，所以在過程中，會參考多方面的因素，影響最后落地的結(jié)果。

感知層面的設(shè)計(jì)策略：視覺層

在2.0初期，我們先整理了最直接的感官層的一部分——視覺感受，以此為基礎(chǔ)為產(chǎn)品定調(diào)，以最直接的表現(xiàn)層為手段幫助產(chǎn)品建立視覺體系。

首先我們內(nèi)部腦暴統(tǒng)一同步了本次升級的目標(biāo)：讓小蜜更智能，更有服務(wù)感。一個是本身我們在做的事情就是智能相關(guān)的研究，另外在落地的場景訪客中心承載的也是服務(wù)的屬性，所以在設(shè)計(jì)方面就抓取了兩個心智方向的關(guān)鍵詞：智能、服務(wù)。

在關(guān)鍵詞的引導(dǎo)下，先建立情緒版，整合出表現(xiàn)層的特性。

抽出智能感受類的關(guān)鍵詞，可以是抽象或者具象的描述。

接著整理出服務(wù)相關(guān)的視覺屬性。

根據(jù)關(guān)鍵詞的延展，得到了視覺語言的方向，但是在推導(dǎo)中我們發(fā)現(xiàn)智能和服務(wù)有些畫面更像是互補(bǔ)色之間的關(guān)系，有一定的對立面，所以要從中調(diào)和每個關(guān)鍵詞在界面中的占比。同時(shí)要考慮是不是有減少兩者沖突的辦法，所以在多次嘗試后決定將1.0版本中的機(jī)器形象換成真人。

首先在行政樓場景中，真人會帶來更多的親切感，與服務(wù)場景更契合；

其次界面關(guān)鍵詞的分配方面也會有考量，在氛圍中我們更希望帶來智能感受、在對話中我們更希望是親切的服務(wù)感，因此真人的形象出現(xiàn)是一個比較合適的策略。

而且服務(wù)的視覺概念也從我們常常感知到的二維變成了多維的角度，從單一的界面變成了人設(shè)、服裝、肢體語言、面部表情等多方結(jié)合的綜合體。因此這兩個關(guān)鍵詞延展出來的部分就有了各自的分工：智能感更多的體現(xiàn)在界面氛圍上；服務(wù)感更多體現(xiàn)在人物上，兩者結(jié)合的會更加潤滑。

下圖是關(guān)鍵詞占比的界面嘗試過程灰機(jī)稿。

在嘗試過程中，畫面一步步清晰了起來，智能+服務(wù)也能更多體現(xiàn)出來，最終通過提煉過程中的視覺語言，形成了最終的畫面。

在整體視覺感受設(shè)計(jì)的同時(shí)，人物的視覺點(diǎn)也在同步進(jìn)行，我們對人物進(jìn)行了性別、著裝、動作、面部表情的設(shè)定，整體目標(biāo)以之前服務(wù)感中總結(jié)出的友善、輕松為關(guān)鍵詞。

最終畫面（其中一款服裝是考慮之后場景的拓展性，整個以智能感受為主）。

感知層面的設(shè)計(jì)策略：聽覺層

在描述完視覺設(shè)定后，來看一下聽覺的方面，也就是語音的互動。

首先，語音互動的核心能力還是在算法上面，因此語音交互也是和技術(shù)能力相輔相成，5號小蜜的技術(shù)手段也比較豐富，主要是以下幾種：ASR、TTS、QA、面部跟蹤、面部重塑面部跟蹤渲染等AI技術(shù)模塊。理論上只要獲得充足的人物視頻+語音數(shù)據(jù)，技術(shù)可模擬任意指定人物。數(shù)據(jù)越多，面部和語音的還原度越逼真。

其中，為獲取原始數(shù)據(jù)，需要進(jìn)行數(shù)據(jù)的采集，主要是在采集室里對語音、圖像進(jìn)行收錄，大致技術(shù)的流程如下所示：

在這些技術(shù)背景下，語音的互動更多的是考慮如何在與真人的對話中，體驗(yàn)更加順暢。

下圖為核心的Flow：

在小蜜與用戶交流的部分做了標(biāo)記，也是語音交互的核心內(nèi)容區(qū)。為了方便整個流程連貫起來，還是從最初的部分開始，講述一個完整的劇本。

用戶從行政樓走進(jìn)，一般會有幾種意圖：開會（查找會議室）、來訪（了解阿里文化等）、參觀（閑聊）根據(jù)這些場景我們進(jìn)行了兩個關(guān)鍵節(jié)點(diǎn)的設(shè)定：吸引、交流。由于結(jié)束對話屬于弱互動，所以暫不列入重點(diǎn)。

以上為語音互動的核心部分，其余還有用戶結(jié)束對話的聲音動作反饋——“再見”+揮手等；未知問題的回復(fù)處理——進(jìn)行多種兜底話術(shù)的配置；中途離場的用戶——小蜜15S內(nèi)回復(fù)初始狀態(tài)等。

物理層面策略：硬件、場景

在考慮界面語音互動的同時(shí)，也要考慮硬件方面待給體驗(yàn)的影響，比如設(shè)備的主要構(gòu)成，MIC、音響、支架、外觀顯示器等主要硬件。

MIC的技術(shù)手段是單軌拾音，因此需要保證在有效距離內(nèi)收音（機(jī)器前會張貼最佳距離的腳印貼紙，以保證對話收音）。顯示器會制作可調(diào)整的15°角傾斜，考慮反光、身高視角等情況。機(jī)器總高度控制在1.8M，用戶眼睛與小蜜眼睛保持平視，最佳觀看高度在1.7M左右的平均值，以覆蓋大部分用戶的使用感受。

（年會亮相圖）

下圖為整個硬件的構(gòu)成部分以及運(yùn)作傳輸圖。

在硬件組裝完畢后，會進(jìn)行收音的測試，在實(shí)際使用場景 – 公共環(huán)境（嘈雜環(huán)境）下用錄音（ASR識別）的方式來收集不同位置的收音狀況（保證同等條件下，比如分貝相同）來收集數(shù)據(jù)，最后判定這個MIC的硬件是不是最合適的。

經(jīng)過綜合多方位設(shè)計(jì)后，設(shè)備才能見到雛形，本身智能互動領(lǐng)域就是多維度的綜合體，設(shè)計(jì)師參與在其中也會從單一的視覺、交互維度去向更全面的維度思考，使每一個環(huán)節(jié)串聯(lián)起來，打造更好的UX體驗(yàn)。

最后的思考

從這次的項(xiàng)目來看，我們在做事情的初期就需要有一個完整的目標(biāo)定義，Lot設(shè)備的應(yīng)用場景考量等等，這次綜合升級只是考慮了單一的行政場景，解決的是咨詢類的問題，因此設(shè)計(jì)的鏈路也是單一且淺薄的。但是產(chǎn)品的發(fā)展一定是要向商業(yè)化邁步的，比如：熱門的導(dǎo)購場景，與淘系新零售的戰(zhàn)役契合，結(jié)合淘寶生態(tài)配合多種垂直行業(yè)，機(jī)器人作為智能客服出現(xiàn)在售前、售中、售后的服務(wù)等等。

設(shè)計(jì)也需要在每個場景中分別做出判斷，行業(yè)通用的部分沉淀，以及行業(yè)特性的個性化設(shè)計(jì)思考，都是需要不斷的去嘗試和打磨的。而智能互動設(shè)備作為一種趨勢，也是設(shè)計(jì)師去發(fā)揮所長的沃土。

本文由 @喵了個汪原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自 Pixabay，基于 CC0 協(xié)議

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App