人工智能的3種人機(jī)語(yǔ)義形式
?人工智能的發(fā)展走過(guò)了從機(jī)器智能到感知智能的階段,正在邁向認(rèn)知智能的階段。然而由于人類(lèi)復(fù)雜的語(yǔ)言系統(tǒng),一問(wèn)一答形式的人機(jī)交互已經(jīng)滿足不了用戶的真實(shí)需求,機(jī)器必須學(xué)會(huì)處理人類(lèi)復(fù)雜的語(yǔ)言。
隨著語(yǔ)音識(shí)別、NLP等技術(shù)的成熟,多輪對(duì)話交互系統(tǒng)將成為人機(jī)交互的重要紐帶和橋梁。
目前市場(chǎng)上人機(jī)對(duì)話交互主要分為三種類(lèi)型:任務(wù)型、問(wèn)答型、閑聊型。
任務(wù)型主要目的就是根據(jù)用戶描述的問(wèn)題,收集必要的參數(shù)信息以完成用戶的任務(wù);問(wèn)答型主要通過(guò)模型的解析,匹配知識(shí)庫(kù)的答案并提供給用戶;閑聊型主要以調(diào)節(jié)情緒,在用戶當(dāng)下的使用場(chǎng)景,以貼近用戶情感為目的,拉近用戶的距離。
人機(jī)對(duì)話交互中,機(jī)器處理自然語(yǔ)言時(shí)需要用到不同的語(yǔ)義表達(dá)形式來(lái)處理。主要有分布式語(yǔ)義、框架式語(yǔ)義、模型式語(yǔ)義。
01 分布式語(yǔ)義
可以簡(jiǎn)單的理解為相似句模型解析。分布式語(yǔ)義需要標(biāo)注大量的訓(xùn)練數(shù)據(jù),大量的知識(shí)點(diǎn)會(huì)形成一個(gè)向量空間。當(dāng)用戶問(wèn)題過(guò)來(lái)時(shí),機(jī)器先將用戶的問(wèn)句進(jìn)行分詞,根據(jù)分詞結(jié)果匹配詞庫(kù),也可以將語(yǔ)義理解成向量,機(jī)器根據(jù)空間向量分布判斷給出最優(yōu)解。
日常在進(jìn)行模型調(diào)優(yōu)時(shí),我們主要從數(shù)據(jù)和算法兩個(gè)方面進(jìn)行調(diào)優(yōu),再根據(jù)模型的正確率和召回率,找到最優(yōu)的f值,給定模型的閾值。
目前大量的機(jī)器學(xué)習(xí)都用的是分布式語(yǔ)義,依靠數(shù)據(jù)來(lái)處理語(yǔ)義間的關(guān)系,但分布語(yǔ)義理解比較淺,很難處理深層的語(yǔ)義。
02 框架式語(yǔ)義
現(xiàn)在市場(chǎng)上有很多的語(yǔ)音助手產(chǎn)品,通過(guò)獲取用戶問(wèn)題中的關(guān)鍵參數(shù),然后將參數(shù)填入?yún)f(xié)議中,完成用戶的任務(wù)操作。
例如“查一下7月1日上海到洛杉磯的航班”,這句話中我們需要獲取到用戶的四個(gè)信息槽位:
- 首先我們明確用戶的場(chǎng)景,用戶是想查飛機(jī)的航班信息,所以結(jié)果里肯定不能出現(xiàn)汽車(chē)、火車(chē)等場(chǎng)景;
- “7月1日”對(duì)應(yīng)的肯定是時(shí)間的參數(shù)time,所以查詢的結(jié)果里肯定是7月1日當(dāng)天的一個(gè)航班信息;
- 用戶的出發(fā)地是上海,目的地是洛杉磯,分別對(duì)應(yīng)參數(shù)里的origin、destination,所以這邊兩個(gè)參數(shù)不能顛倒,不然查詢的結(jié)果就不是用戶真實(shí)想要的信息了。
可以看到框架式語(yǔ)義最重要的就是要識(shí)別語(yǔ)義中的參數(shù)信息,缺一個(gè)都不能完成用戶的真實(shí)需求。所以在框架式語(yǔ)義中,框架識(shí)別和參數(shù)識(shí)別是非常重要的。
但用框架語(yǔ)義處理一些指代詞等高級(jí)的語(yǔ)言或需要結(jié)合上下文理解的時(shí)候,會(huì)因?yàn)槿鄙倌骋粋€(gè)槽位,而丟失用戶信息,所以現(xiàn)在很多框架語(yǔ)義配置時(shí)用了“平行槽位”。
首先明確在某一場(chǎng)景下,我們需要獲取哪些槽位信息,當(dāng)配置了平行槽位后,用戶語(yǔ)義中缺少哪一個(gè)槽位信息,通過(guò)配置追問(wèn)話術(shù),將槽位信息補(bǔ)全,以完成用戶的最終目的。
03 規(guī)則式語(yǔ)義
規(guī)則式語(yǔ)義就是將用戶問(wèn)句通過(guò)表達(dá)式的形式進(jìn)行匹配,當(dāng)滿足規(guī)則要求時(shí),給出結(jié)果回復(fù)。
要讓用戶問(wèn)句能通過(guò)規(guī)則匹配問(wèn)題,首先要明確走規(guī)則匹配邏輯要優(yōu)先于相似句匹配。規(guī)則也需要獲取問(wèn)句中的實(shí)體信息,滿足要求后,即可匹配上。
下面就舉一個(gè)例子:
我們看這條規(guī)則由?() {} . & | : # 等標(biāo)點(diǎn)符號(hào),也有字段等信息組成的一條規(guī)則??催@規(guī)則會(huì)覺(jué)得比較亂,但細(xì)細(xì)分析,其實(shí)還是很簡(jiǎn)單的一條規(guī)則。
首先明確這個(gè)規(guī)則的意圖,是一個(gè)打開(kāi)動(dòng)作,說(shuō)明是一個(gè)指令。后面需要填寫(xiě)的槽位信息就是A股、港股、美股的槽位信息、最后一個(gè)就是欄目。所以可以確定這條規(guī)則就是一個(gè)“打開(kāi)某只股票的個(gè)股資料”。
因?yàn)槊總€(gè)標(biāo)點(diǎn)代表的意思是不同的,這就不細(xì)細(xì)說(shuō)明了。所以當(dāng)用戶問(wèn)句滿足這個(gè)規(guī)則要求,就滿足了這個(gè)規(guī)則對(duì)應(yīng)的標(biāo)準(zhǔn)句,那用戶就能得到該標(biāo)準(zhǔn)句對(duì)應(yīng)的答案了。
不同的語(yǔ)義處理形式邏輯都不同,但最終的目的還是為了能完成用戶下達(dá)的任務(wù)或操作。隨著分詞技術(shù)、實(shí)體抽取、NLU等技術(shù)的成熟,人機(jī)交互會(huì)更加和諧,處理效率會(huì)越來(lái)越高。
本文由 @vilionwang 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!