聊天機器人的技術原理和未來的發展

lll
0 評論 9229 瀏覽 28 收藏 9 分鐘

近年來,人工智能越來越火,那你們真的知道人工智能嗎?

一、人工智能是什么

人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。

李開復 對人工智能做過這樣的定義:

  • 首先是感知,包括視覺、語音、語言;感知可能是幫助識別一張圖里,一個嬰兒在沙發上抱著泰迪熊;
  • 然后是決策,包括識別、推薦、預測、判斷;比如GoogleNow通過你過去做的事情推測你接下去要做什么;
  • 最后是反饋,包括生成、機器人、自動化;比如無人駕駛汽車通過各種傳感器捕捉的信息后,用來做最后的決策——比如怎么去操作方向盤、油門、剎車等。

人工智能里面有很多先進的技術,自然語言處理、語音識別、計算機視覺等,下面,我們首先來了解一下自然語言處理技術以及其典型應用。

二、自然語言處理應用——聊天機器人

自然語言處理(NLP)是計算機科學,人工智能,語言學關注計算機和人類語言之間的相互作用的領域。核心技術有機器翻譯、聊天對話等,主要的應用有搜索引擎、問答系統等。

問答系統本質上是一個信息檢索(IR)系統,只是它從文本中獲取更多信息,返回更加精準的答案。

傳統的問答系統將按照以下的流程工作:(1)問題解析(2)信息檢索(3)答案抽取。

典型的就是聊天機器人,一種自動的問答系統。模仿人的語言習慣,通過模式匹配的方式來尋找答案。在它們的對話庫中存放著很多句型、模板,對于知道答案的問題,往往回答比較人性化,而對于不知道的問題,則通過猜測,轉移話題,或者回答不知道的方式給出答案。

聊天機器人主要解決下面四個問題:

第一個怎么讓你的“女朋友”能聽你的話并想出應該回復什么

針對內容為導向的對話,系統中有內容管理模塊,會在網上爬取信息,然后選取相關內容進行對話;

第二個問題是怎么樣進行開放式的話題,讓聊天一直持續下去

在開放式話題上,該機器人需要涵蓋很廣的內容,并且需要區分領域和話題。會首要響應用戶的需求,同時將內容推薦作為潛在任務來推進對話的進行;

第三個問題是怎么樣貼合用戶愛好,聊相關話題

聊天機器人以用戶為中心,以內容為導向。構建了為對話設計的知識圖譜,里面涵蓋了比較多樣化,高質量的內容,所以能進行一些風格多樣化的對話;

第四個是面對多樣的用戶是怎么讓各種用戶都滿意的?

根據對話的歷史以及內容的屬性來選取最優的策略進行對話。通過心理學的問題來了解用戶的性格從而更好地進行內容推薦。

基本實現過程如下:用戶輸入數據 -> 分析用戶意圖 -> 抓取關鍵參數 -> 匹配最佳回答 –> 輸出回答。

基本原理就是我們的目標給定輸入句子X,生成目標句子Y,對輸入句子X進行編碼,將輸入句子通過非線性變換轉化為中間語義表示C,根據句子X的中間語義表示C和之前已經生成的歷史信息y1,y2……yi-1來生成i時刻要生成的單詞yi。每個yi都依次這么產生,那么看起來就是整個系統根據輸入句子X生成了目標句子Y。

利用上述框架,聊天機器人可以根據用戶當前輸入Message自動生成應答Response,形成了一個有效的問答對話系統。

相對基于檢索類或者機器翻譯類傳統技術而言,基于深度學習框架的聊天機器人具有如下明顯優點

  1. 構建過程是端到端(End-to-End)數據驅動的,只要給定訓練數據即可訓練出效果還不錯的聊天系統,省去了很多特征抽取以及各種復雜中間步驟的處理。
  2. 語言無關,可擴展性強。只需要使用不同語言的聊天數據進行訓練,不需要專門針對某種語言做相關的特定優化措施,這使得系統可擴展性大大加強。
  3. 訓練數據擴大有助于持續提升系統效果,一般通過不斷增加訓練數據就能夠帶來持續的效果提升。

也存在下面缺點

  1. 評價標準方面還有待深入研究,很多工作是通過人工來進行效果評價,還沒有特別合適的專用于聊天機器人的評價標準,這是阻礙聊天機器人技術持續發展的一個障礙。
  2. 缺乏標準化的大規模訓練數據。標準化的特大規模人與人對話數據相對缺乏。如果能夠有大規模的標準聊天數據,很明顯將能夠極大促進技術進步。
  3. 技術仍處于發展初期。技術手段也好,實際系統效果也好,都有非常大的進步空間。

三、聊天機器人的未來發展

聊天機器人已開始滲透到了我們的日常生活中,只不過,它們還沒有變成主流。電腦需要更好地理解人類的語言、情感和意圖。人工智能必須在幾個重要的方面獲得發展,才可能有機會得到廣泛的應用。

1. 自然語言處理方面得到改善

聊天機器人越來越火,且應用至各行各業,微信、微博、QQ等眾多社交平臺紛紛選擇嵌入人工智能,尤其能理解對話的語境與語義的虛擬聊天機器人成為核心,得益于日益成熟的人機自然交互技術,提升了用戶體驗。

2. 了解消費者

人工智能要發揮作用,最關鍵的問題就是理解背景信息。正如營銷和銷售會以360度的視角來了解消費者,聊天機器人也需要更深入地了解它們互動的對象:他們是誰,他們是如何變成現在這個樣子的,他們在尋找什么,以及他們過去做過什么。

3. 閱讀人類的情感

如果聊天機器人能夠閱讀人類的面部表情或語音變化,從而理解與它們交流的人的情感變化,那么它們將無疑能夠提供更好的服務。聊天機器人現在只能應付簡單的客戶服務。如果用戶感到失望或惱怒,那么聊天機器人可能需要將對話交給人類客服人員了。

 

本文由 @?lll 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自 Pexels,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!