音箱狂歡之后:對話式AI的價值與沉默
如何解決對話式AI的后狂歡之痛?
今年的消費者AI領域,最受關注的一場大戰,肯定是智能音箱的狂飆突進。
這場堪稱狂歡的運動中,除了一大波硬件產品的快起快落,更大的收獲在于,我們看到了對話式AI的技術本身也許有超越音箱的價值。
在智能音箱的快速落地之后,消費者和資本一方面開始認識到語音交互可能帶來的想象空間與增值潛力,一方面也意識到智能音箱在技術體驗上存在巨大技術局限——甚至有聲音斷言,對話式AI本身不提高,所有今天假想的語音AI生態都是空談。
泡沫過后,后狂歡時代中對話式AI亟待解決的問題開始浮現。今天的對話式AI中,產業格局暴露了哪些提升空間?如何理解其所面臨的問題與機遇?谷歌、亞馬遜、百度等巨頭又在嘗試哪些破局方案?
音箱狂歡之后:對話式AI的價值與沉默
所謂對話式AI,是指機器與人在對話服務場景中展現出的AI技術集成。
智能音箱的快速進入市場的價值,不僅是是為AI開了個好頭,更重要的是讓受眾與資本看到了對話——這種人類最基本的信息釋放模式可能帶來怎樣的價值想象力。
不僅是內容與電商的激活,高度貼合用戶習慣,且具備多種能力的對話式AI也許有能力成為接下來的家庭中心與個人生活助手、商業秘書。其延伸的商業價值當然不難想象。并且對話式AI是牽動其他多種AI語音交互的關鍵,涉及語音理解、語義判斷、語言增強記憶和深度語言交互等多個技術端口,可謂NLP技術向未來發展的軸心。
但問題是,在音箱狂歡逐漸趨于理性之后,很多對話式AI在系統端的技術能力問題開始浮現。比如理解能力有限、喚醒成本過大、深入用戶溝通能力缺失等等。
這些技術瓶頸導致了對話式AI全面轉向個人與家庭助手的過度將被限制,很多創意性的語言與聲音AI應用也成了無本之源。無論是學界、巨頭還是創業者,都在共同期待智能語音完成一個快速的躍升。
三重門:強AI語音應用的難題何在
擺在強語音交互的對話式AI面前,最急需解決的是三大問題。跨過這三重門,或許終端硬件與服務將帶給用戶完全不同的認知體驗,甚至重新定義對話式AI。
- 對用戶語音的貼合認知:消弭噪聲、方言、多人、語音不清等因素帶給人機交互的障礙,讓用戶在現實環節中與智能體溝通沒有磕絆,達到無成本溝通。
- 極限化降低喚醒成本:完成對喚醒行為的無死角響應,因為喚醒效率低往往導致用戶徹底放棄一次人機交互。但如何在復雜環境中隨時能被喚醒,做到無處不在,其中有很多技術場景需要挑戰。
- 從語義理解到記憶理解:從“我說你聽”到“共同探討”是一個非常劇烈的改變,智能體能否記憶并分析用戶的語境、上下文,給出智能化更高的應對方案,甚至主動服務與建議,可說是對話式AI的未來核心。
這三道技術挑戰擺放在我們面前,而最有可能的破局者,當然是行業中的幾大技術巨頭。
對話式AI難題的破解思路
在對話式AI的破局路徑中,幾個AI巨頭也在嘗試不同的方案。
比如谷歌更多是通過收購相關項目與API解決方案,加強對谷歌大腦技術的訓練強度,來獲得對話式AI的提升。在以谷歌大腦為中心的對話式AI研發中,谷歌嘗試使用不同的語料因素和學習樣本來強化智能體在對話時的記憶強度與修辭模式。通過對文學作品、社交媒體資料的學習,來完善對話式AI的強度溝通可能。另一方面,谷歌也在不斷加強研發和收購對話式AI與硬件銜接之間的解決方案,通過軟硬件結合達成更好的AI體驗。
而在Echo上比較成功的亞馬遜,目前更多資料顯示還是在產業端戰略布局。在持續研發升級對話AI技術的同時,也與智能家居產品、個人助手軟件,以及其他公司的對話式AI產品形成聯動模式。依靠使用體驗的強化加深產業占有率。
就在剛剛,百度發布了一項針對對話式AI的計劃:DuerOS普羅米修斯計劃。計劃包含開放數據集、跨學科合作等多種計劃,還將設立100萬美元的基金用以資助和培養對話式AI領域的優秀項目和人才。
這個計劃與歐美巨頭之間,在兩方面展現了差異:1是將產業研發與學術研發結合起來,引導學術力量破解產業問題;2是相比大公司普遍的秘密研發計劃,這個計劃的特點是開放。把研究工具進行開源,然后期待回收以這些工具完成的研發結果。
其中最重要的,顯然是對大量對話式AI數據集的開源。因為此前的對話式AI領域中,數據集普遍非常古老,不適應今天的平臺,并且基本需要收費且為全英文。對于中文語言交互的研發非常不利。
目前所知,百度剛剛開源的數據集包括:遠場喚醒方面五十萬條“小度小度”和其他主流的中文喚醒詞錄音數據、數百小時的誤喚醒錄音數據;遠場識別方面則有數千小時中文遠場語音識別數據;多輪對話方面含有萬段對話數據。
開源資料與工具包,然后以競賽的方式回收成果,是我們此前在機器學習與神經網絡方面經常見到的模式,但語音交互領域這樣的計劃還非常稀少。不難看出,巨頭對于對話式AI的發展已經表現出了更加急迫的期待?;蛟S在接下來的短時間內,國內外巨頭推出更加激進、開放的對話式AI研究計劃會成為主流。
對話服務與AI,可以說來到了臨門一腳的重要時期,但最后如何完成射門,可能是大公司們正在頭疼的問題。
本文由 @腦極體 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖有作者提供
- 目前還沒評論,等你發揮!