“閑聊”的當前現(xiàn)狀及未來展望
“閑聊”短時間內還是需要產品驅動,而長時間則可能是依賴技術驅動。
現(xiàn)狀梳理
人機對話的發(fā)展還處在起步階段,音箱之間的大戰(zhàn)就是一個很好的開始,未來會有更多的設備被賦予對話的能力。
目前整個過程最大的問題在于自然語言處理(即NLP),在這個NLP中最不好處理的就是開放域的閑聊了,這也是無論那個公司的”對話系統(tǒng)(廣義上的語音交互設備所搭載的系統(tǒng))“,都會出現(xiàn)答非所問的情況。
用戶體驗角度
1. 了解競品(這里指狹義上的競品)
目前知名度最高的閑聊機器人就是小冰,小冰也是業(yè)內首個提出用“交互次數(shù)(即CPS)”來作為衡量閑聊質量的方式,而其他公司大多都還在用“單輪準確率”來衡量聊天的好壞,這里最大的問題是評判標準過于主觀。當然也有公司以其他相關轉化率為目標,不在分析范圍內。
所以這里主要分為:以提升CPS為目標的小冰和以提升單輪準確率為目標的其他公司。
2. 競品優(yōu)劣
前面已經分析過了,各個公司的優(yōu)化目標不同,所以他們出現(xiàn)的問題也會有所差異。
小冰:由于小冰以CPS為目標,所以導致小冰非常善于引導對話,也就是說小冰的主動性太強了,就像你有一個非常愛嘮嗑的朋友,時不時還帶著你一起跑題。帶來的問題就是小冰常常會回復的答非所問,讓人感覺不知所云。
還有小冰為了實現(xiàn)上下文的關聯(lián)性,他們聊天庫的語料是進行分類的,也就是當你談到某個話題時,他會在當前的聊天中,固定出現(xiàn)該話題的語料,使用戶感覺到一直再聊一個事情。帶來的問題就是和小冰閑聊很難跳出該話題,不能夠更靈活的應對用戶的反饋。
其他公司:那些重視單輪準確率的閑聊,單獨拿出來每句話看,給人的感覺是很難區(qū)分這是人還是機器人。但是整體一起看,很容易就能看出來,其中前后矛盾,指代不明的現(xiàn)象頻繁出現(xiàn),很難堅持聊下去。
由于為了提高單輪準確率,最簡單的方式補充聊天庫,即Q-A語料。這時候的閑聊機器人是被動的,也就是你問他,他才會回復,當你不知道該說什么的時候,對話就結束了。
綜合考慮,就用戶體驗的角度來講,CPS為目標更加客觀,更能滿足用戶的需求。
3. 潛在價值
閑聊無用論現(xiàn)在是大家的共識,這也是除小冰外,很少見大公司把這個當作核心來做。其實這主要因為沒有明確的商業(yè)模式,而且技術瓶頸明顯,但是市場規(guī)模還是很大的。因為聊天對話是人類的天性,每個人都需要一個可以說心里話的人,目前技術是主要瓶頸,無法支撐開放域的自由對話,讓人感覺沒有人會和機器人聊天。
想要從閑聊的角度抓住用戶,那一定是要滿足情感的需求。
技術解決角度
面對開放域閑聊各種各樣的問題,也有各種各樣的解決方法,我按照自己的理解,大致分為三種方式算法、正則、兜底。
1. 算法
隨著深度學習的發(fā)展,算法這個詞逐漸進入人們眼中,給人一種高深莫測的感覺,但是在自然語言處理中,所能起到的作用還是很有限的。按照回復方式,現(xiàn)在算法主要分為:匹配算法(計算兩個句子的是否匹配)、解析算法(先給輸入進行分類,再按照預設類別回復)和生成算法(直接生成回復)
匹配算法:這應該是閑聊最重要的算法了,主要是從海量聊天庫中找到相似的句子,和搜索用到的算法較一致。
解析算法:目前很多公司都用到了,主要就是通過模型對輸入進行分類,也是目前算法的主流用法。
生成算法:很少有公司用這類算法,主要還是回復結果并不可控,據說中文版的小冰有10%的回復使用該算法。
2. 正則
正則指得就是正則表達式,這是比較傳統(tǒng)的方式,雖然簡單,但是效果立竿見影。這種方式在技能上比較常見,我覺得正則即可以準確到完全匹配,也可以泛化到關鍵詞回復。
3. 隨機
所謂隨機就是不做任何解析,隨機回復我們預設好的回復。這往往用來解決超過機器人能力范圍時,給用戶的一個反饋。在明知無法滿足用戶需求的情況下,回復的話術就會很重要,不同產品需要不同的設計思路。
語言的本質
之前在一篇文章當中看到一個對語言本質的理解,說“語言時思維的映射”。也就是說如果你不會思考,那么你的語言終究是假的,是存在于表面的。而現(xiàn)在的深度學習,也只是在利用大量的數(shù)據進行特征提取,并沒有因果關系的推理,所以當前的深度學習在NLP領域,能力有限。而想要實現(xiàn)真正像人一樣的閑聊,還是需要一定的時間,短時間內無法速成。
未來展望
理解了閑聊的現(xiàn)狀,想象一下閑聊的未來,目前閑聊在對話系統(tǒng)中的位置可能如下:
1. 隨著人機對話的普及,會有越來越多的產品搭載對話系統(tǒng),閑聊將長時間會作為一個”兜底“的存在,用來解決技能以外的輸入。當技能識別率和技能資源趨于一致的情況下,對話系統(tǒng)中的閑聊將會成為一個加分項的。
2. 閑聊如果可以收集到用戶畫像,那么基于閑聊的推薦系統(tǒng)將會發(fā)揮很大的作用,這個需要根據不同的產品進行設計。如果做推薦,想到最好的入手點還是前面說到的情感,情感一方面可以造成用戶粘性,另一方面可以獲得用戶的信任。
我按照對語言本質的猜測,將閑聊未來的發(fā)展分成兩部分,分割線就是技術是否可以讓技術實現(xiàn)思考:
1. 閑聊短時間內還是需要產品驅動,而產品即需要了解當前技術瓶頸,也需要了解用戶需求,甚至需求背后的人性,還有閑聊在整個產品中的定位,才有機會提升閑聊的用戶體驗。
2. 閑聊長時間的未來可能是技術驅動,而產品只是一個輔助的角色。先進的技術可以讓機器人思考,調整相關的參數(shù),就可以改變機器思考的方式,這個時候產品的作用就不再那么重要。
本文由 @我叫人人 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
不錯