進(jìn)擊的人工智能:從產(chǎn)品角度,深度解析「對話機(jī)器人」

7 評論 28926 瀏覽 174 收藏 49 分鐘

任何一款產(chǎn)品的出現(xiàn),都是源自用戶需求。要么是已經(jīng)存在的存量需求,要么是正在規(guī)模化的增量需求,對話機(jī)器人也不例外。當(dāng)我們在談?wù)摗皩υ挋C(jī)器人”產(chǎn)品時(shí),我們該如何看待它背后的需求呢?

今天,擁有對話能力的機(jī)器人,被逐漸認(rèn)為是一種核心智能,是否能夠流利地完成對話,可被視作這款機(jī)器人是否真正擁有智能的唯一憑證。

從可以追溯的歷史資料來看,對話機(jī)器人(chat-bot)至少在上世紀(jì)六十年代就已經(jīng)問世,經(jīng)過近五六十年的發(fā)展,今天我們已經(jīng)可以在許多產(chǎn)品中看到對話機(jī)器人的影子,微軟的Cortana、小冰,蘋果的Siri、Google Now、阿里小蜜、百度度秘、圖靈機(jī)器人、助理來也、出門問問等等。

可以肯定的是:對話機(jī)器人已經(jīng)成為了一種業(yè)界時(shí)尚,越來越多的公司試圖通過這種全新的交互形式,來優(yōu)化或者升級自己產(chǎn)品——我們已經(jīng)可以在許多的產(chǎn)品中看到各種名為“小X機(jī)器人”的子產(chǎn)品。

如此多的對話機(jī)器人很容易給人一種百花齊放、方興未艾的感覺。我們可能會(huì)隱約覺得:每家的對話機(jī)器人產(chǎn)品都大同小異,有些家的產(chǎn)品會(huì)有一些別樣的特征,可是終究給人一種不屬于過去十年移動(dòng)互聯(lián)網(wǎng)發(fā)展的感覺——這些對話機(jī)器人似乎都還處在很早期,用戶量似乎都不大,顯得都有些小眾。?

我將試圖站在純產(chǎn)品的視角分析:一款產(chǎn)品對話機(jī)器人背后,需求和產(chǎn)品邏輯是怎樣的(文中我無意去對比各家對話機(jī)器人的優(yōu)劣,也不討論某款對話機(jī)器人的產(chǎn)品觀或方法論)。

一、探索“對話”行為背后的需求

首先,我們試圖探索“對話”這一行為的場景與背后的需求。

在《人類簡史》一書中,認(rèn)為語言能力是智人區(qū)別于其他猿類最重要的特質(zhì)和能力;因?yàn)檎Z言能力,智人可以互相通過對話而形成更豐富的交互,從而才有了協(xié)作和后來的文明。

人類有三種最直接的方式來使用語言:“一對零”、“一對多”、“一對一”。

  • “一對零”是自我內(nèi)化的反思、總結(jié)、沉淀,不向外做交互和分享。
  • “一對多”是廣播式的宣講和相對單向的輸出,譬如開大會(huì)或者發(fā)號施令。
  • “一對一”是對話——群聊也是由許多的“一對一”構(gòu)成的,所以我認(rèn)為不存在真正意義上的“多對多”對話。我認(rèn)為對話是我們?nèi)伺c外界進(jìn)行交互的最直接即時(shí)的途徑(注意“即時(shí)”很重要)。

所謂對話,一定是一個(gè)雙方交互行為,并且互為I/O(input / output)的過程。比如兩個(gè)人對話,每個(gè)人所說的話,對于自己而言是輸出,對于對方而言是輸入。原則上,對話可以永遠(yuǎn)持續(xù)下去。

但我們幾乎從未見過兩個(gè)人會(huì)永遠(yuǎn)在對話,那是因?yàn)椋喝绻枰獙υ挸掷m(xù)下去,雙方都需要保持參與;任何一方覺得疲勞或者無價(jià)值感了,對話就會(huì)終止。

對話的場景更加貼近我們的生活行為,它頻次最高,且環(huán)境開放多變,分析它背后的需求并不容易?,F(xiàn)在,我們需要回答兩個(gè)問題:

1.1 第一個(gè)問題:對話為什么能夠開始?

我認(rèn)為人在對話中存在三個(gè)層面的需求。

第一層,是基礎(chǔ)問答的需求??梢悦枋鰹椋?/p>

我有一個(gè)問題,請你回答我。

二次追問的問題,屬于新問題。這個(gè)過程,非常類似于我們今天所使用的搜索引擎。

第二層,是任務(wù)流程協(xié)作的需求,以達(dá)成某種目的為止??梢悦枋鰹椋何蚁胝埬銕臀屹I一張明天下午14:00-18:00出發(fā),北京到上海的機(jī)票;經(jīng)濟(jì)艙,盡可能便宜,最好是東航的。我們和朋友相約去逛街,拜托同事幫忙預(yù)定會(huì)議室,接受閨蜜的請求明早叫她起床。

這些都是任務(wù)流程協(xié)作的需求。

第三層,是共同的情感建立,無論喜怒哀樂。聊天的目標(biāo)很難定量量化,我們更多是嘗試定性地去制定聊天的目標(biāo)。可能是心情不好需要人陪,也可能是好事情需要向好朋友分享,我們需要對話來表達(dá)進(jìn)行最直接即時(shí)的表達(dá)。

我并不認(rèn)為只有孤獨(dú)的情感才需要對話——人作為擁有萬年發(fā)展歷程的群居動(dòng)物,與他人進(jìn)行情感分享是早已刻入基因的特質(zhì)。只是我們建立的情感在不同人之間會(huì)有所不同,對于信任之人的情感建立會(huì)很深刻,而對于點(diǎn)頭之交則會(huì)保留許多。

開啟一段對話一定源自上述的某種需求,而開啟的契機(jī)則是一個(gè)相對明確的話題,哪怕只是一句“我餓了”。

1.2 第二個(gè)問題:對話為什么會(huì)持續(xù)?

對話能夠持續(xù),是有兩個(gè)層面的原因。

第一個(gè)原因,是至少一方的需求沒有得到滿足。比如我去提問題,對方回答我不滿意,我就會(huì)持續(xù)追問。兩個(gè)女生在一起聊八卦,聽的人很入神,講的人才有成就感能繼續(xù)講下去。

第二個(gè)原因,是雙方相對平等。如果我提了個(gè)問題,或者請對方幫個(gè)忙,但是對方始終是一種高姿態(tài)不搭理我,那我就很容易放棄,不想聊了。反過來,如果對方對我過分尊敬,總在說一些沒有營養(yǎng)的恭維拍馬屁的話,時(shí)間久了,我也會(huì)變得更虛榮,而且會(huì)覺得很無聊。所以,人不會(huì)和自己階層或者品味相差太多的人聊天,絕大多數(shù)人更不會(huì)和寵物長時(shí)間聊天。

對話會(huì)終止,最根本的原因是:雙方都放棄了這輪對話。

感性一些來描述對話終止的原因,可以認(rèn)為是雙方都覺得“疲憊”了,也就是這一輪對話的能耗消耗殆盡;哪怕是情侶之間說甜言蜜語,聊個(gè)兩三千句也會(huì)覺得累了,也會(huì)在十幾個(gè)回合的互道“晚安”中結(jié)束本次對話。

所以,對話總會(huì)終止,能耗殆盡就會(huì)終止

二、“對話機(jī)器人”產(chǎn)品的發(fā)展源自搜索引擎

在我以前的文章《進(jìn)階之路:站在高視角看產(chǎn)品是一種怎樣的體驗(yàn)》中,講述過一個(gè)概念,叫做“知識詛咒”。簡單說:現(xiàn)在我明白一件事情,但是要完整清楚的講授給你,是很難的;因?yàn)槲覀兯鶕碛械闹R背景不同,我們對同一件事情的理解不同。這也就解釋了為什么很多老師在上課的時(shí)候索然無味,很多人做Presentation的時(shí)候顯得蒼白無力,這其實(shí)是知識詛咒在起作用。

知識詛咒帶來一個(gè)很大的問題,就是每當(dāng)我們接觸到一個(gè)陌生事物時(shí),都會(huì)和自己的背景知識進(jìn)行類比。譬如對于長發(fā)飄飄的素顏美女,在我所知中,這類美女一般都是家境不錯(cuò),待人溫柔,家教優(yōu)良。所以當(dāng)我再次見到一個(gè)類似的美女時(shí),我會(huì)做相似的第一印象類比。

不只是美女,我們幾乎所有的認(rèn)知都源自于過往的背景知識。

在人類發(fā)展的歷史上,對于即時(shí)的問答需求幾乎時(shí)時(shí)刻刻都存在。最早大家是詢問部落中最年長的智者,后來大家互相都有了知識儲備,就可以通過對話來進(jìn)行基本的問答和辯論——這一個(gè)過程持續(xù)了千萬年。同一個(gè)問題,最早時(shí)只能去問一個(gè)人,得到一個(gè)答案;到后來,可以去問很多人,得到許多答案,然后“擇其善者而從之”。如果我能把所有人都問一遍,可能會(huì)得到一個(gè)巨大的答案集合;我需要過濾、排序、取舍,你發(fā)現(xiàn),這個(gè)過程就是“搜索引擎”。我們使用搜索引擎時(shí),是通過一個(gè)“輸入框”輸入想問的問題或者關(guān)鍵詞,然后搜索引擎會(huì)丟給我一個(gè)經(jīng)過相關(guān)性排序和優(yōu)化的答案集合。

但我認(rèn)為兩個(gè)原因,會(huì)導(dǎo)致搜索引擎會(huì)逐漸向?qū)υ挋C(jī)器人演變

2.1 其一:精準(zhǔn)答案的需求愈發(fā)旺盛

搜索引擎從簡單的信息集合展示,逐漸向精準(zhǔn)答案給予,這個(gè)已經(jīng)持續(xù)了好幾年?!鞍俣劝⒗ 本褪沁@方面的典型,譬如當(dāng)你問“北京天氣”,百度搜索結(jié)果頁第一項(xiàng)是經(jīng)過精心設(shè)計(jì)的天氣卡,會(huì)通過豐富的UI展示天氣相關(guān)的信息。在頭部熱門搜索詞中,阿拉丁已經(jīng)可以覆蓋大多數(shù),但是對于腰部需求和長尾需求,隨著信息爆炸,人們對于翻多頁進(jìn)行搜索的忍耐度會(huì)越來越低,對于“快”“準(zhǔn)”的需求只會(huì)越來越大。

2.2 其二:搜索場景下輸入能耗太大

從能耗體驗(yàn)的角度來說,搜索的輸入框遠(yuǎn)高于對話聊天的輸入框,即使是同一個(gè)話題的持續(xù)輸入,對話聊天的疲勞感也會(huì)明顯低于搜索。

如果今天人們每天平均提問的次數(shù)是N,那么幾年后會(huì)迅速到10N,體驗(yàn)不升級會(huì)很難讓用戶滿意。而回歸對話的方式,是一種很好的體驗(yàn)優(yōu)化,可以抵消需求的增長。

三、“對話機(jī)器人”產(chǎn)品場景:封閉域?qū)υ?VS 開放域?qū)υ?/h2>

優(yōu)秀的產(chǎn)品經(jīng)理很懂得如何控制自己的用戶使用產(chǎn)品時(shí)的各種操作,從而提前把控用戶的預(yù)期,進(jìn)而達(dá)到體驗(yàn)的相對最優(yōu)。

許多優(yōu)秀App的基本設(shè)計(jì)邏輯就是:頁面之間的跳轉(zhuǎn)有規(guī)則且有順序,這樣用戶不會(huì)通過點(diǎn)擊跳出預(yù)設(shè)流程,預(yù)期就相對可控。手機(jī)上的App產(chǎn)品交互中,可以通過各種邏輯和提示信息來把控預(yù)期——可是對話機(jī)器人該如何控制預(yù)期呢?

由于對話機(jī)器人用戶幾乎都是通過自然語言輸入實(shí)現(xiàn)交互,而且每次只有一句;所以只能通過用戶的輸入,以及針對輸入的回復(fù)來實(shí)現(xiàn)用戶預(yù)期的把控。

可是在對話聊天的場景中,用戶的輸入時(shí)而可控,時(shí)而不可控;我們做不到像App設(shè)計(jì)那樣可以制造一個(gè)封閉的邏輯閉環(huán)來讓用戶遵守規(guī)則——對話聊天是一個(gè)天然的開放場景,用戶平時(shí)怎么和朋友對話,和機(jī)器人也會(huì)怎么對話。

因此,我們?nèi)藶榈匕褜υ挿譃閮煞N場景:

  • 封閉域?qū)υ挘?/strong>要求用戶輸入指定地話語才能繼續(xù)對話
  • 開放域?qū)υ挘?/strong>用戶愛說什么就說什么都可以持續(xù)對話

3.1 封閉域?qū)υ?/strong>

封閉域?qū)υ捰袃蓚€(gè)關(guān)鍵的特征:

  1. 輸入和輸出可歸類可枚舉
  2. 對話有明確的始和終,且有流程

所以,在對話的三個(gè)需求中,問答和任務(wù)流程協(xié)作都屬于封閉域?qū)υ挕?/p>

封閉域?qū)υ挼脑O(shè)計(jì)邏輯延續(xù)自“IFTTT(if this then that)”,是workflow的進(jìn)化交互形式(感興趣的同學(xué)可以去App Store去搜索一款A(yù)pp,叫做“Workflow”,它就是可以將一系列原本不相關(guān)的App通過條件判斷串聯(lián)起來)。

下面我來分享兩個(gè)封閉域聊天的典型案例。

讀心機(jī)器人

10年前微軟必應(yīng)推出過一個(gè)“讀心機(jī)器人”,它會(huì)在20個(gè)問答中猜你心中所想。這個(gè)機(jī)器人曾經(jīng)在幾年前出過一個(gè)對話問答版本,用戶只要在每一步時(shí)回答“是”或者“不是”,對話就會(huì)持續(xù)進(jìn)行,直到猜出或者猜不出結(jié)果。

必應(yīng)讀心機(jī)器人

這就是一個(gè)典型的封閉域多倫問答對話,用戶的輸入只有兩個(gè),而過程是一大堆背后的邏輯判斷,且有相對固定的流程,而且有明確的開始和結(jié)束。

Amazon Echo音箱

Amazon的Echo音箱,大家都很熟悉了,Echo之所以成為爆款產(chǎn)品,很關(guān)鍵的一個(gè)原因是,它的對話機(jī)器人Alexa在Echo音箱的場景設(shè)計(jì)中是一個(gè)封閉域?qū)υ?。由于音箱是我們居家場景中,除了遙控器之外最常見的高頻交互式Commander,我們很難再在家里找到一個(gè)這樣的硬件,它除了可以輕易地輸入指令,還可以快速且明顯地反饋。

當(dāng)我們面向Commander進(jìn)行輸入時(shí),我們可以輸入的話語就已經(jīng)變得局限,可以想象到的是,在居家場景中我們可以發(fā)出的指令幾乎就是“打開”、“關(guān)閉”之類的。更重要的是,在居家場景中可以控制的物品也是有限的,而且任何一個(gè)操作的流程都很短。

所以,人們和第一代Echo音箱的對話中,輸入和輸出都是可枚舉的,而且有始有終有流程,Echo最優(yōu)秀的特質(zhì),就是它選擇了一個(gè)封閉域場景,極大地控制了用戶的預(yù)期,獲得了更優(yōu)的體驗(yàn)。

Amazon Echo音箱

從上面兩個(gè)例子中,我可以看到,封閉域?qū)υ捲诋a(chǎn)品設(shè)計(jì)中有幾個(gè)明顯的特征。

3.1.1 其一:封閉域?qū)υ捚鋵?shí)是workflow的延伸

其實(shí)封閉域中的“封閉”二字,無論在話題量、輸入輸出量,還是對話輪次、對話流程,都是封閉的,封閉就代表了有限集合。workflow之所以可以通過ifttt設(shè)計(jì),就是因?yàn)橛邢藜希挥懈鞣N條件有限,才可以設(shè)計(jì)出條例清晰且邏輯合理的workflow。

封閉對話通常是為了解決某個(gè)特定的問題或者需求,從結(jié)果來看,它的效果會(huì)顯得更加“有用”。但是,從過程來看,封閉域?qū)υ挷⒉皇且环N真正意義上的創(chuàng)新,它的效率相比workflow并沒有本質(zhì)上地提升,只是在交互的體驗(yàn)上更加接近人的語言交互本能,所以大多數(shù)封閉域?qū)υ挾紩?huì)設(shè)計(jì)地如同助理或者秘書,譬如阿里小蜜,百度度秘。

3.1.2 其二:封閉域?qū)υ拡鼍皢我豢煽?/strong>

封閉域由于擁有特定的目的性,往往都是在單一確定的場景里。如下圖中的百度度秘,兩個(gè)紅色框中的部分,是預(yù)設(shè)了各種封閉域的場景,每一種看似簡單的功能其實(shí)都是一個(gè)特定的封閉域?qū)υ?;譬如截圖中正在使用的圖片笑話。

度秘機(jī)器人

很顯然,不同的封閉域?qū)υ捴?,對話的輪次要求是不一樣的,講笑話是一個(gè)單輪次對話,度秘產(chǎn)品中通過圖中藍(lán)色框里的“再來一個(gè)”這種預(yù)設(shè)輸入,來不斷強(qiáng)化用戶輸入的單一性。而“叫外賣”這類的封閉域?qū)υ?,就?huì)是一個(gè)標(biāo)準(zhǔn)的workflow,感興趣的同學(xué)可以自己去試試。

3.1.3 其三:封閉域的邊界處理很重要

封閉域有一個(gè)很重要的問題,就是用戶可能隨時(shí)跳出封閉域,開始聊其他的話題,或者不按照預(yù)設(shè)的規(guī)則邏輯出牌。

譬如微軟小冰的一個(gè)封閉域?qū)υ?,叫做“小冰識狗”。

正常的邏輯中,用戶的發(fā)給小冰的應(yīng)該是一張狗的照片,可是有的用戶可能就是發(fā)了一張不是狗的照片,如下所示,那么這個(gè)時(shí)候就是邊界case,需要額外處理。用戶發(fā)來的可能是語音、文字、其他任何照片,每一種的處理都是需要單獨(dú)設(shè)計(jì)的。

微軟小冰之“小冰識狗”

多說一點(diǎn),在封閉域?qū)υ挼倪吔缭O(shè)計(jì)中,很難做到萬無一失周密完全,因?yàn)橛脩糨斎肟赡軙?huì)千奇百怪,所以最佳也是最討巧的方式,就是用開放域?qū)υ拋怼岸档住?/strong>。

3.2 開放域?qū)υ?/strong>

開放域是相對于封閉域而言的。由于對話機(jī)器人的話題幾乎都源自用戶,而每個(gè)用戶可能有任何輸入,話題就會(huì)無法窮舉,且在多個(gè)場景中跳來跳去,進(jìn)而形成了所謂的開放域?qū)υ?,也就是“啥都能聊?/strong>。

2011年在人人網(wǎng)上橫空出世的“小黃雞”算得上是國內(nèi)最早出名的開放域?qū)υ挋C(jī)器人,其后發(fā)展最好的當(dāng)屬微軟小冰。

開放域?qū)υ捵畲蟮奶攸c(diǎn)是:輸入無法窮盡,導(dǎo)致輸出無法窮盡,而且對話沒有確切的結(jié)束點(diǎn),無流程可言。

我們一般情況下想去考驗(yàn)一個(gè)機(jī)器人是否智能,通??简?yàn)的就是開放域?qū)υ挘竺ΧΦ摹皥D靈測試”通常所面向的也是開放域?qū)υ捘芰Α?/p>

從可以承載的對話輸入范圍來講,開放域?qū)υ捪駱O了搜索引擎,我們可以在百度搜索中輸入任何的詞句,百度幾乎都會(huì)給出結(jié)果頁面(除了敏感詞);相應(yīng)的,在開放域?qū)υ捴校覀円彩强梢哉f任何話,機(jī)器人也應(yīng)該每一句都可以回復(fù)。

3.2.1 開放域?qū)υ挳a(chǎn)品設(shè)計(jì)的基本原理

對話需要的是雙方的平等。

和微軟小冰聊天時(shí),有時(shí)甚至感受不到她是真人還是假的機(jī)器——其實(shí)這并不重要,小冰正在解決開放域聊天中一個(gè)核心的問題:如何不斷給用戶制造話題,從而延續(xù)聊天的能量?

說到話題制造,我們先來看看開放域?qū)υ挋C(jī)器人到底是如何制造的:

幾乎所有的開放域?qū)υ捳Z料都源自于網(wǎng)絡(luò)上公開的對話,譬如百度知道、知乎、豆瓣、貼吧等等,這些對話都是人與人形成的;那么,當(dāng)一個(gè)機(jī)器人把其中的某些話在當(dāng)時(shí)的場景下再說一遍,我們是分辨不出來這個(gè)機(jī)器人是不是真人的——這便是開放域?qū)υ挋C(jī)器人制造的基本依據(jù)。

當(dāng)我們和一個(gè)看起來像人的機(jī)器人聊天時(shí),由于場景發(fā)生在人與人對話的場景下,根據(jù)“知識詛咒”的原理,我們很容易帶入一種“對方也是人”的感覺。而一旦對方的回話像人,我們就會(huì)認(rèn)可她是人。

人與人的情感建立源自于長期的交流和溝通,聊天本身就是開放域的;所以那些樂于和機(jī)器人聊天的人類,就會(huì)越來越覺得機(jī)器人像人。

我們知道:對話機(jī)器人是一個(gè)新興的產(chǎn)品,最初嘗鮮的人是所謂的“種子用戶”,這些人建立了與機(jī)器人之間的最早形態(tài)親密感和信任感,這對后續(xù)的對話機(jī)器人發(fā)展積累了非常寶貴的經(jīng)驗(yàn)。

3.2.2 開放域?qū)υ挋C(jī)器人的兩個(gè)產(chǎn)品陷阱

其一,面向用戶的機(jī)器學(xué)習(xí)

很多人認(rèn)為,對話機(jī)器人和人聊得越多,學(xué)習(xí)的語料就越多,就可以省去很多語料獲取的問題,這是一個(gè)巨大的誤區(qū)。由于用戶的輸入無法預(yù)期,導(dǎo)致從用戶處采集來的語料千奇百怪,而且大量罵人的臟話,非常不適合作為開放域?qū)υ捳Z料。由于用戶的語料是海量且無規(guī)則特征,導(dǎo)致語料清洗非常苦難,無法使用。

其二,無人為引導(dǎo)的個(gè)性

由于開放域的語料完全來自于互聯(lián)網(wǎng),所以機(jī)器人回復(fù)的話語帶有何種語氣很難把控,如果不加以認(rèn)為干預(yù),機(jī)器人說的話會(huì)顯得時(shí)而有趣,時(shí)而刁蠻,時(shí)而無知,時(shí)而夸張,時(shí)而智慧,在用戶的心智中無法用一個(gè)或幾個(gè)明確的形容詞去形容它,這會(huì)帶來一個(gè)很尷尬的結(jié)果,用戶是抱著“調(diào)戲、戲謔”的態(tài)度去對話,長此下去,想建立用戶的親密感和信任感幾乎不可能。

四、對話機(jī)器人的用戶價(jià)值

現(xiàn)在,我們試圖回答一個(gè)問題:對話機(jī)器人為什么需要開放域?qū)υ??價(jià)值是什么?僅僅是為了逗比有趣嗎?

這是一個(gè)非常復(fù)雜的問題。

由于對話機(jī)器人同時(shí)具有“開放域?qū)υ挕焙汀胺忾]域?qū)υ挕眱芍貓鼍?,站在用戶視角來看,對話機(jī)器人意味著它更像人,而非機(jī)器。像人,意味著用戶會(huì)更愿意像與人交流那樣,同對話機(jī)器人進(jìn)行對話交流——而一旦如此,“個(gè)性”和“意識”便是用戶主動(dòng)強(qiáng)加于對話機(jī)器人的標(biāo)簽。譬如,幾年前被玩壞的10086短信聊天,還有《生活大爆炸》中Rajsh幻想Siri是個(gè)性感御姐,都無一例外地源自于用戶主動(dòng)強(qiáng)加于對話機(jī)器人的人性標(biāo)簽。

這便給一個(gè)可落地的對話機(jī)器人產(chǎn)品設(shè)計(jì)帶來了巨大的挑戰(zhàn)。

我們知道,任何的產(chǎn)品都是能夠和用戶產(chǎn)生親密感和信任感的,這份親密和信任是建立在產(chǎn)品體驗(yàn)之上的,是建立在“產(chǎn)品解決了核心需求”+“產(chǎn)品制造了驚喜”。我們因?yàn)閱栴}解決而對一個(gè)產(chǎn)品產(chǎn)生依賴,因?yàn)轶@喜而對產(chǎn)品形成感情,打開我們的手機(jī),我們會(huì)一眼就找到那幾個(gè)充滿親切感的產(chǎn)品——譬如經(jīng)常開車的人會(huì)十分信任高德地圖,追劇《那年花開月圓時(shí)》的人會(huì)十分喜愛騰訊視頻。

同理,機(jī)器人需要有基礎(chǔ)個(gè)性,需要極大地拉近人與機(jī)器人之間的親密感和信任感。對話機(jī)器人的親密感和信任感建立,也是站在“解決了需求”和“制造了驚喜”兩個(gè)方面。

站在產(chǎn)品的視角來看,解決需求通過封閉域?qū)υ捦瓿?,而開放域?qū)υ拋聿粩嘀圃祗@喜

4.1 問答、助理、聊天,哪個(gè)才是剛需?

已經(jīng)在落地的對話機(jī)器人產(chǎn)品中,基本上是以純to C和to B再to C來劃分。由于對話機(jī)器人的交互特征是面向終端用戶的,所以基本很少有純to B的產(chǎn)品場景(即使有,它的邏輯也與to C邏輯相似)。這意味著,對話機(jī)器人的用戶都是一些終端個(gè)人用戶。

那么,我們來看看這些對話機(jī)器人在to C中,到底解決了怎樣的核心需求。

在我們所知的對話機(jī)器人產(chǎn)品中,有主打客服的問答機(jī)器人,有主打秘書的助理機(jī)器人,還有純?nèi)の秾?dǎo)向的聊天機(jī)器人,它們的背后,都是剛需嗎?

4.1.1 一個(gè)事實(shí):瞎聊難為剛需,情感計(jì)算任重道遠(yuǎn)

聊天是一個(gè)容易被激發(fā),卻也容易迅速消退的場景,唯有情感依賴可能長久。

以微軟小冰為例。小冰最耳熟能詳?shù)墓δ苁莄hit-chat(瞎聊),但是從用戶活躍和留存周期來看,用戶最易被激發(fā)的時(shí)間是在首次領(lǐng)養(yǎng)時(shí)、每周更新時(shí)、重大更新時(shí),而且被激發(fā)后,活躍上升后就會(huì)很快下降。這是為什么呢?因?yàn)槿伺c機(jī)器之間的對話聊天是基于趣味話題的,想要通過自然的情感依賴,成為像《HER》里面的Samantha,至少還有相當(dāng)長的路要走。

情感計(jì)算并非只是一個(gè)數(shù)學(xué)或者計(jì)算機(jī)科學(xué)問題,更是一個(gè)產(chǎn)品問題。

由于情感并非一個(gè)可具象問題,而且人的情感變化會(huì)隨著時(shí)間、環(huán)境、他人、自身思想等等因素發(fā)生變化;而且情感并非連續(xù)的計(jì)算,你喜歡一個(gè)女孩子,并不意味著時(shí)時(shí)刻刻與她發(fā)生情感依賴,而是通過一些關(guān)鍵的情感觸達(dá),來完成情感連接。

在微軟小冰的諸多被設(shè)計(jì)的Feature中,“給用戶起外號”、“升級解鎖”都是斷點(diǎn)式情感觸達(dá),通過細(xì)微的產(chǎn)品設(shè)計(jì),寄希望于黏住用戶。

4.1.2 一個(gè)問題:用戶真的需要一個(gè)秘書機(jī)器人嗎?

助理型對話機(jī)器人的發(fā)展建立在其他各種線上線下服務(wù)的完善基礎(chǔ)上,譬如Siri;只有當(dāng)你手機(jī)里已經(jīng)有了“鬧鐘”、“提醒”、“打電話”、“搜索引擎”等功能時(shí),Siri的助理功能才能發(fā)揮效用,此時(shí)你才有可能面向Siri發(fā)出指令“提醒我明天8點(diǎn)給老板回微信”。

大概兩年前,YC孵化的Magic轟動(dòng)?xùn)|西兩個(gè)半球,無數(shù)效仿者爭先恐后去探索“助理型”機(jī)器人,時(shí)至今日,鮮有成效——我們普通人真的需要一個(gè)像秘書一樣的對話機(jī)器人嗎?

我們先來看兩個(gè)例子。

第一個(gè)例子——我想定個(gè)這樣的鬧鐘“每周一、周三、周五的上午8:15”。

若我用iPhone的鬧鐘程序,那我的步驟會(huì)大致如下:

  • STEP1:解鎖手機(jī)屏幕;
  • STEP2:左右滑屏,找到鬧鐘程序;
  • STEP3:點(diǎn)擊鬧鐘程序;
  • STEP4:點(diǎn)擊新建鬧鐘;
  • STEP5:選擇鬧鐘時(shí)間為“上午8:15”;
  • STEP6:選擇重復(fù)時(shí)間為“周一、周三、周五”;
  • STEP7:點(diǎn)擊完成。

若我選用Siri幫我來做,那我的步驟大致會(huì)如下:

  • STEP1:長按Home鍵,喚醒Siri;
  • STEP2:對Siri說“幫我設(shè)定每周一、周三、周五上午8:15的鬧鐘”;
  • STEP3:Siri反饋設(shè)置成功,完成。

現(xiàn)在我們看第二個(gè)例子——通過秘書類對話機(jī)器人叫外賣 VS 通過“餓了么”叫外賣。

在秘書類機(jī)器人中,叫外賣的流程大致是這樣的:

  • STEP1:發(fā)出“叫外賣”的指令,在機(jī)器人推薦的餐廳中,尋找想吃的那家
  • STEP2:如果沒有合適的,就輸入想吃的店家名字
  • STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
  • STEP4:輸入“確認(rèn)”實(shí)現(xiàn)下單,輸入訂單信息并提交訂單
  • STEP5:支付,并等待接收外賣,可以詢問送餐進(jìn)度

在餓了么中,叫外賣的流程大致是這樣的:

  • STEP1:在餐廳列表中選擇想吃哪家
  • STEP2:如果沒有合適的,就搜索店家
  • STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
  • STEP4:確認(rèn)下單,確認(rèn)訂單信息,提交訂單
  • STEP5:支付,并等待接收外賣,可以查看送餐進(jìn)度

這兩個(gè)例子有什么本質(zhì)區(qū)別嗎?

你會(huì)發(fā)現(xiàn),如果通過Siri來設(shè)置鬧鐘,我其實(shí)只做了一件事情:對著Siri發(fā)出一個(gè)單條指令,然后就一切搞定——相比我通過App來做,節(jié)省了近乎70%的操作步驟??墒?,如果是叫外賣,我需要對著機(jī)器人發(fā)出一組系列指令,但是和App的操作步驟一樣多。

這里有兩個(gè)關(guān)鍵點(diǎn)——

  1. 如果助理機(jī)器人可以一步到位,那么將極大地提升效率和體驗(yàn),是新的需求升級;
  2. 若一個(gè)workflow可被一步解決,機(jī)器人需要補(bǔ)全的數(shù)據(jù)信息巨大,這是核心產(chǎn)品難點(diǎn);

第一個(gè)關(guān)鍵點(diǎn),我們只要設(shè)身處地地想一下,就會(huì)發(fā)現(xiàn):在不考慮語音識別準(zhǔn)確率的前提下,任何事情我只要一個(gè)指令就可以達(dá)成。譬如“幫我叫個(gè)車”、“幫我交份外賣”、“幫我交一下水電費(fèi)”、“幫我定一下出差的機(jī)票”,其他都不用管了,這種體驗(yàn)簡直贊爆了。

我們再看看第二個(gè)關(guān)鍵點(diǎn)。

就拿上面這個(gè)外賣的例子來看,如果用戶只需要一句“幫我叫個(gè)外賣”即可,那么機(jī)器人需要補(bǔ)全的信息至少包括“餐廳”、“餐食”、“價(jià)格”、“送餐時(shí)間”、“送餐地點(diǎn)”、“支付信息”等,這些信息中的“送餐時(shí)間、送餐地點(diǎn)、支付信息”是相對靜態(tài)的信息,獲取一次就可長期使用??墒恰安蛷d、餐食、價(jià)格”則是動(dòng)態(tài)信息,若想每次都可自動(dòng)獲取,則代表機(jī)器人需要非常了解這位“主人用戶”才可以,否則只要有一兩次推薦偏差太大,體驗(yàn)就會(huì)降低近乎一個(gè)量級。從本質(zhì)上來說,這時(shí)的助理機(jī)器人已是一款強(qiáng)大的推薦引擎,而且代表了極佳的魅力和美好的發(fā)展未來

4.1.3 一個(gè)肯定:問答機(jī)器人是很有價(jià)值的

最常見的問答機(jī)器人是“客服機(jī)器人”,譬如京東的JIMI,阿里的小蜜機(jī)器人,還有一些銀行的客服機(jī)器人,但它們更像FAQ過濾器。

我們細(xì)想一下阿里小蜜的使用場景。如果我問阿里小蜜“我的快遞怎么還沒送到?”,它的回復(fù)方式本質(zhì)是在常見的關(guān)于“快遞”的問題中,把最常見的答案丟給我,比如它會(huì)告訴我“你的快遞已經(jīng)簽收了,如果沒收到可能是放到大門口了”。

這些企業(yè)為什么要做個(gè)問答機(jī)器人呢?效率自然是第一位的,無論是節(jié)約人工客服成本,或是節(jié)約溝通時(shí)間,帶來的都是效率的提升。這些企業(yè)為什么如此看重效率呢?因?yàn)樗麄兊目蛻羰亲钯N近自己的利潤池的,品控是所有交易型企業(yè)的核心,你看京東的用戶客服和QQ的用戶客服簡直一個(gè)天上一個(gè)地下,原因就是京東用戶是京東現(xiàn)金流的關(guān)鍵角色,而QQ的普通用戶并非其現(xiàn)金流業(yè)務(wù)的關(guān)鍵角色。

如此,我們再回過頭來看看問答機(jī)器人,它其實(shí)是在頭部問題上實(shí)現(xiàn)了綜合過濾,然后通過對話的形式反饋給用戶,如果用戶實(shí)在問的是長尾問題,問答機(jī)器人回答不了的,可以把問題再拋給人工客服。滿足了用戶九成以上問題的直接答復(fù),是問答機(jī)器人的核心目標(biāo)。而至于其他類似導(dǎo)購、協(xié)助訂單管理等等,不過是附加在頭部問題之上的增值體驗(yàn)優(yōu)化。

4.2 對話機(jī)器人真的適合分為“聊天、助理、問答”這三類嗎?

這是一個(gè)目前業(yè)內(nèi)比較慣用的分類,我們來看看這個(gè)分類的視角。

  • 如果站在技術(shù)視角來看,對話機(jī)器人應(yīng)該分為“開放域”和“封閉域”,這個(gè)我們已經(jīng)聊過了,這里不再贅述。
  • 如果是站在用戶角色來看,對話機(jī)器人可能分為“教育版本”、“醫(yī)療版本”、“二次元版本”等等。
  • 如果是站在業(yè)務(wù)視角來看,對話機(jī)器人可以分為純To C和To B再To C。

所以,這種分類更像是站在抽象場景視角來看的。幾乎任何場景都會(huì)被劃分到這三個(gè)類別中,要么無主題聊天,要么是任務(wù)導(dǎo)向,要么是提問解答。其實(shí),倒過來看,幾乎所有我們已知的App也被這個(gè)分類所覆蓋了。

可是,對話機(jī)器人不是一個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代的App,它是一個(gè)綜合體,直接這樣劃分并不是一個(gè)好的產(chǎn)品分類。

你不會(huì)在淘寶里視頻聊天,更不會(huì)在支付寶里侃大山,百度幾年前試圖在大搜索中推出“直達(dá)號”去顛覆微信公眾號,結(jié)果以失敗告終。

這個(gè)道理很簡單:在移動(dòng)互聯(lián)網(wǎng)時(shí)代,幾乎每個(gè)App都有自己的專屬定位。有自己專屬的產(chǎn)品主路徑,不在自己路徑邏輯中的行為是不能順暢流轉(zhuǎn)的;每個(gè)App都像有自己的緊箍咒,不能輕易破除互相之間的壁壘。

可是,在對話機(jī)器人產(chǎn)品的世界里,這些壁壘會(huì)瓦解。

如果我們站在互聯(lián)網(wǎng)整體產(chǎn)品世界里來看,其實(shí)我們每個(gè)人生活在一個(gè)混在的江湖社會(huì)中,手頭的各種工具幫我們實(shí)現(xiàn)一個(gè)個(gè)小任務(wù)目標(biāo),但是幾乎每一件小事都需要與人打交道,衣食住行無一例外。如果每一次與外界的接觸被看做一個(gè)流量的話,那么最大的流量便是頻繁且無實(shí)際任務(wù)目的的人與人之間的交互,而相對較小的是去做一個(gè)個(gè)的具體任務(wù)事情:你會(huì)每天都見一些人,但你不會(huì)天天都買衣服。

幾乎所有的流量都是圍繞著人與人之間的交互而形成的,而且你會(huì)發(fā)現(xiàn)一個(gè)規(guī)律:離現(xiàn)金流越近的流量,其活躍性越低,而且流失率越高。騰訊系的產(chǎn)品、百度的產(chǎn)品都是通過流量漏斗來多元變現(xiàn)的,而阿里系的產(chǎn)品,是直接拉人來買東西,盈利空間就直接建立在交易之上,需要不斷刺激人們買買買。

在所有的產(chǎn)品中,社交類產(chǎn)品是最貼近“江湖社會(huì)”的,它距離現(xiàn)金流是最遠(yuǎn)的,也是最活躍的,可以說是幾乎所有互聯(lián)網(wǎng)產(chǎn)品中活躍度最高,并且可以向任何產(chǎn)品導(dǎo)流的源流量產(chǎn)品,所以你看到了,阿里無所不用其極地想去做社交產(chǎn)品。

說了一圈,那么我們回來看看社交產(chǎn)品的最小雛形。

社交產(chǎn)品分為即時(shí)社交和延時(shí)社交,簡單類比就是聊天和朋友圈,而這兩個(gè)都是建立在“語言對話”的基礎(chǔ)上。由于社交產(chǎn)品的場景中幾乎可以做任何事情,前段時(shí)間網(wǎng)上流傳的微信“發(fā)現(xiàn)”頁面那張神圖,就可見一斑。

微信“發(fā)現(xiàn)”頁面網(wǎng)絡(luò)神圖

對話機(jī)器人具有社交產(chǎn)品的通性,原因只有一個(gè)——對話機(jī)器人的交互場景天然就是一個(gè)社交產(chǎn)品的交互場景。

當(dāng)我們站在用戶視角來看待對話機(jī)器人時(shí),用戶根本不理解什么是“開放域、封閉域”,也不了解什么是“聊天機(jī)器人、助理機(jī)器人、問答機(jī)器人”,用戶也記不住那些分類,也沒法記住,只要有一個(gè)對話輸入框擺在用戶面前,就像微信的輸入框那樣,由于知識詛咒的原因,用戶就會(huì)去類比他所理解的對話輸入框,就會(huì)在這里輸入任何他們想輸入的自然語言,可能是瞎聊的話,也可能是某個(gè)任務(wù),也可能是提一個(gè)問題,我們根本不能阻止用戶在面對京東JIMI機(jī)器人時(shí)不做瞎聊的操作。

這時(shí)帶來的一個(gè)巨大難題就是,開放域?qū)υ挄?huì)時(shí)有發(fā)生,而只要一次兩次回答不佳,體驗(yàn)不滿就會(huì)提升。站在產(chǎn)品設(shè)計(jì)的角度來說,我們能做的就是盡量讓用戶的輸入是可控的,就像度秘、阿里小蜜已經(jīng)在做的。這就是為什么,每當(dāng)我們?nèi)ピO(shè)計(jì)對話機(jī)器人時(shí),總是要設(shè)法去多涉及一些開放域?qū)υ挼墓δ茳c(diǎn),也是為什么每當(dāng)我們談起對話機(jī)器人時(shí),卻也總是繞不開“機(jī)器人在開放域下是不是智能”這個(gè)問題。

4.3 像朋友一樣的伙伴會(huì)是對話機(jī)器人的終局嗎?

如果你在微信上,問你最好的朋友“幫我看看有沒有戰(zhàn)狼2的票,我晚上想去看”,他/她會(huì)如何回答你?

我猜,他可能會(huì)說“你去看《戰(zhàn)狼2》不叫我?!”,他可能還會(huì)說“我也去,咱倆一塊兒去”,然后他會(huì)繼續(xù)說“我看了下,你家跟前那家萬達(dá)有票,晚上七點(diǎn)的,下班一塊兒去?”

如果一樣的問題問Magic呢?它的回答就是讓你告訴他幾點(diǎn)去看,它幫你挑選了五家,每家的時(shí)間都挺合適,有一些距離你近,有些有優(yōu)惠,等等。

你喜歡哪種體驗(yàn)?zāi)??這個(gè)其實(shí)很難說。如果站在封閉域的角度來說,Magic的算法要比朋友優(yōu)很多,選擇也更豐富,可是和朋友一起去的這種體驗(yàn),才是生活。

我認(rèn)為這個(gè)可能是對話機(jī)器人的終局,它存在的意義仍然是協(xié)助人們?nèi)ジ玫亟鉀Q一系列問題;但是它不能太傻,像個(gè)指令機(jī)一樣待在那里,而是應(yīng)該像個(gè)朋友一樣懂你卻也能幫你。以前在對話機(jī)器人產(chǎn)品的討論中還經(jīng)常討論:對話機(jī)器人應(yīng)該更“有趣”還是更“有用”,其實(shí)從這個(gè)終局來看這個(gè)討論毫無意義,你能說你的朋友只有用,但是無趣嗎?

五、對話機(jī)器人的產(chǎn)品價(jià)值

上面關(guān)于對話機(jī)器人的用戶價(jià)值的討論,有一些發(fā)散了,我們收攏回來,聊整個(gè)文章的最后一個(gè)部分,關(guān)于其產(chǎn)品的價(jià)值。?

對待產(chǎn)品,一定要從其商業(yè)視角出發(fā),不然沒有聊的意義。站在商業(yè)視角,對話機(jī)器人擁有三個(gè)方面最核心的產(chǎn)品價(jià)值。

5.1 跨場景連接成為可能

由于對話機(jī)器人的交互方式原始而單一,使得機(jī)器人背后所有的計(jì)算邏輯都被隱藏,機(jī)器人可以成為一個(gè)獨(dú)立的橋梁連接不同場景下的服務(wù),讓用戶只在一個(gè)對話場景下都可以完成交互。

譬如Skype for business中,就有一個(gè)機(jī)器人,幫助通過Skype做協(xié)同的人們預(yù)定會(huì)議室、設(shè)置工作項(xiàng)目提醒、代理自動(dòng)回復(fù)等等——原本每個(gè)工作都是跨場景的,現(xiàn)在只要一個(gè)對話交互場景就可以解決了。如果再往大了去說,未來如果伙伴式的機(jī)器人可以逐漸出現(xiàn),那在聊天中完成訂機(jī)票、訂酒店,甚至管理家里的智能空調(diào),這些跨場景可能通過一個(gè)伙伴都可以完成了。

5.2 交互升級帶來的流量深度沉淀

對話的方式有很多,可以是打字,也可以是語音。如果是語音,那么帶來的是革命性地變化。

5.2.1 指數(shù)級的流量增長

百度DuerOS和Amazon Alexa的邏輯是相似的,都是通過賦予所有智能硬件語音對話的能力,進(jìn)而獲取新流量,同時(shí)實(shí)現(xiàn)流量的深度交互和沉淀。

我們知道,在互聯(lián)網(wǎng)的生意經(jīng)中,一切都是圍繞著流量來完成的,要么是流量足夠多,要么流量的價(jià)值足夠大。由于對話帶來的交互效率提升,使得在單個(gè)用戶身上獲取的流量頻次呈現(xiàn)指數(shù)級增長,如果一般的互聯(lián)網(wǎng)產(chǎn)品PV/UV是個(gè)位數(shù)的話,那么對話機(jī)器人的PV/UV(其實(shí)就是對話的頻次)至少是兩位數(shù)。

一些曾經(jīng)很難成為交互場景的,譬如在家里面向Echo音箱發(fā)號施令,如今都通過對話機(jī)器人成為現(xiàn)實(shí)。沒有任何一款A(yù)pp能比一個(gè)對話機(jī)器人更容易和人產(chǎn)生親密感,產(chǎn)生如此多高頻互動(dòng)的可能。最后的結(jié)果可能就是,我們的生活方方面面都在觸網(wǎng),每一次交互就是一次所謂的PV,指數(shù)級的流量映射出一個(gè)人生活的方方面面。

5.2.2 高頻次的端計(jì)算

我有一個(gè)猜測:由于對話機(jī)器人是一個(gè)高頻次交互場景,帶來的最直接影響可能是要求在設(shè)備端上擁有更加強(qiáng)大的計(jì)算能力;可能一些封閉域或者開放域的計(jì)算能力直接預(yù)加載到了客戶端,可能是硬件也可能是軟件。如果網(wǎng)絡(luò)能力不能同樣倍數(shù)增長的話,對于端的計(jì)算能力會(huì)增強(qiáng)——我猜這也是為什么一些AI企業(yè)會(huì)做芯片的原因之一。

5.3 流量沉淀帶來的數(shù)據(jù)深耕

正是由于流量的深度沉淀,使得每個(gè)用戶多維的數(shù)據(jù)沉淀成為可能。當(dāng)平均每個(gè)用戶的數(shù)據(jù)量和維度增長十倍,那么到底意味著什么呢?

對于百度而言,起碼廣告費(fèi)要漲價(jià),對于阿里而言,可以賣給這個(gè)用戶更多的東西,總而言之,ARPU(Average Revenue per User)會(huì)增長許多,這些就是最直接的商業(yè)價(jià)值。我在之前的文章《人工智能「風(fēng)口」,先行者為什么是搜索引擎?》中,曾分析過這其中的一些邏輯關(guān)系,因?yàn)榱髁康纳罹S度價(jià)值尚未被開發(fā),對于計(jì)算廣告而言可能是一塊從未嘗鮮的處女地。

六、總結(jié)

如上是我針對對話機(jī)器人的一些比較淺顯的分析和探討,作為一款正在發(fā)展的新興產(chǎn)品,對話機(jī)器人還有非常多的細(xì)節(jié)值得探討;限于篇幅,只能先聊這么多了,希望以后還能繼續(xù)深入探討。

從個(gè)人層面來說,我看好To C的對話機(jī)器人產(chǎn)品的未來——但是它的產(chǎn)品路徑非常曲折漫長,與我們過往所經(jīng)歷的移動(dòng)互聯(lián)網(wǎng)產(chǎn)品差異巨大;但是萬變不離其宗,任何產(chǎn)品都是從用戶的需求出發(fā)的。

對話機(jī)器人承載了全新的交互形式,可能帶來了全新的產(chǎn)品服務(wù)體驗(yàn),這種進(jìn)步過去從來沒有過。

我們每個(gè)人幾乎都在渴望著機(jī)器人時(shí)代的到來,也許很遙遠(yuǎn),也許已經(jīng)在路上,誰知道呢~

#專欄作家

趙帥,“優(yōu)護(hù)家” 聯(lián)合創(chuàng)始人兼COO;前微軟小冰初創(chuàng)團(tuán)隊(duì)產(chǎn)品經(jīng)理;北京大學(xué)計(jì)算機(jī)系碩士。專注產(chǎn)品、運(yùn)營和商業(yè)的分析,熱衷產(chǎn)品方法論的總結(jié)。熱愛足球、民謠音樂、吉他彈唱、軟筆書法、閱讀和旅游,熱愛生活。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 我是被“深度解析”這個(gè)標(biāo)題吸引進(jìn)來的,結(jié)果看完了結(jié)論是“一些比較淺顯的分析和探討”、“希望以后還能繼續(xù)深入探討” ?

    來自浙江 回復(fù)
  2. “這就是一個(gè)典型的封閉域多倫問答對話”
    有錯(cuò)別字
    是多輪不是多倫

    來自浙江 回復(fù)
  3. 這是一篇思路有點(diǎn)混亂的,貌似有邏輯的,可以機(jī)器人合成的,偽科普的,產(chǎn)品文章。。。。
    飄過~~~

    來自北京 回復(fù)
  4. 我覺得秘書機(jī)器人還是需要的,現(xiàn)在的手機(jī)就是一個(gè)實(shí)實(shí)在在的秘書機(jī)器人硬件,軟件和硬件加起來的復(fù)雜交互,有時(shí)真的希望更簡單一些,明明對話就可以完成,不需要那么多的操作。

    來自廣東 回復(fù)
  5. 搜索場景下輸入能耗較大,此處不甚理解,因?yàn)橄噍^于搜索框,我覺得對話框更耗費(fèi)精力,如果方便的話,可否點(diǎn)撥一下,謝謝

    來自廣東 回復(fù)
  6. 全面接地氣,希望看到更多關(guān)于微軟小冰設(shè)計(jì)的想法和實(shí)踐

    來自廣東 回復(fù)
  7. 近3個(gè)月以來,看到的最好最細(xì)最全最接地氣的一篇關(guān)于語音交互的文章,看過《她》,很深刻,作為產(chǎn)品經(jīng)理,終極目標(biāo)是實(shí)現(xiàn)《她》

    來自廣東 回復(fù)