AI閱讀理解技術(shù):有可能成為人類幫手?
閱讀理解能力是人類智能中最關(guān)鍵的能力之一,AI閱讀理解技術(shù)有著十分廣泛的應(yīng)用前景,可能那還很遠(yuǎn),也可能很近,但比起超越人類,AI應(yīng)該更有可能成為人類幫手。
“三長(zhǎng)一短選最短, 三短一長(zhǎng)選最長(zhǎng),參差不齊C無(wú)敵?!?/p>
還記得上學(xué)期間流傳在“學(xué)渣們”之間的所謂閱讀理解的“做題法寶”嗎?
當(dāng)然,這只是學(xué)渣們給自己的心理安慰。閱讀理解作為一道考察學(xué)生理解能力、思辨能力的題型,絕不僅僅是一道口訣就能解決的,它需要大量的練習(xí)與不斷地揣摩。
不管如何,相信大家都有一個(gè)共識(shí):閱讀理解這件事當(dāng)然是人類的專項(xiàng)。
然而事實(shí)上,近日,在美國(guó)斯坦福大學(xué)發(fā)起機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD中,阿里巴巴開發(fā)的人工智能模型獲得了82.44的高分,超過(guò)了人類平均值82.304的分?jǐn)?shù)。這是機(jī)器首次在此類測(cè)試中獲得超過(guò)人類的分?jǐn)?shù),而微軟的AI模型獲得了82.650的分?jǐn)?shù),排名首位。
智能體在閱讀理解領(lǐng)域開始“跑分”,AI能夠進(jìn)行全文理解,已然成為了AI界的大事件。此時(shí),我們首先要面對(duì)的問(wèn)題就是,當(dāng)AI已經(jīng)能夠比人類更快速、更精準(zhǔn)地對(duì)文本中的信息進(jìn)行回答時(shí),AI究竟是人類的替代者還是幫助者呢?AI閱讀理解在未來(lái)又會(huì)如何落地呢?這些問(wèn)題看似簡(jiǎn)單,卻有很多值得討論的地方。
AI閱讀理解技術(shù)之思
整體來(lái)說(shuō),我們認(rèn)為至少可以從這兩點(diǎn)思考。
1、AI閱讀理解只是自然語(yǔ)言處理(NLP)的進(jìn)化
雖說(shuō)AI閱讀理解近期才進(jìn)入人們的視線,但AI閱讀理解技術(shù)究其根本還是繼語(yǔ)義分析、語(yǔ)音識(shí)別后的又一在自然語(yǔ)言處理技術(shù)中取得的突破。
(圖來(lái)自億歐網(wǎng))
自然語(yǔ)言處理發(fā)展得很早,計(jì)算機(jī)剛剛發(fā)明之后,人們就開始了自然語(yǔ)言處理的研究。機(jī)器翻譯是其中最早進(jìn)行的NLP研究。那時(shí)的NLP研究都是基于規(guī)則的,或者基于專家知識(shí)的。而閱讀理解技術(shù)是怎么發(fā)展而來(lái)的呢?在圖像識(shí)別和語(yǔ)音識(shí)別領(lǐng)域的成果激勵(lì)下,人們逐漸開始引入深度學(xué)習(xí)來(lái)做NLP研究,于是閱讀理解技術(shù)應(yīng)運(yùn)而生。
這類技術(shù)也面臨很多挑戰(zhàn)。具體來(lái)講,包括:
- 如何跟知識(shí)學(xué)習(xí)——有效地把知識(shí)包括語(yǔ)言學(xué)知識(shí)、領(lǐng)域知識(shí)用起來(lái);
- 如何跟環(huán)境學(xué)習(xí)——通過(guò)強(qiáng)化學(xué)習(xí)的方式提升系統(tǒng)的性能;
- 如何跟上下文學(xué)習(xí)——利用上下文進(jìn)一步增強(qiáng)對(duì)當(dāng)前句子的處理能力;
- 如何利用用戶畫像體現(xiàn)個(gè)性化。
每個(gè)環(huán)節(jié)若出現(xiàn)偏差都有可能導(dǎo)致結(jié)果的不準(zhǔn)確。
2、AI閱讀理解缺乏真正的思考
讓我們先來(lái)看一道語(yǔ)文考試中常見(jiàn)的閱讀理解題目——
- 老師提出問(wèn)題:為什么作者描寫的“窗簾”是藍(lán)色的?
- 學(xué)生答:“因?yàn)榇昂熓撬{(lán)色的?!?/li>
- 老師說(shuō):“錯(cuò)!藍(lán)色的‘窗簾’具有愁緒的意味,表達(dá)作者當(dāng)時(shí)困郁的心境……
這種類型的閱讀理解,大家都很熟悉吧。目前,AI在中文閱讀理解的簡(jiǎn)答題型方面表現(xiàn)如何還沒(méi)有具體的數(shù)據(jù)可以說(shuō)明(值得一提的是,百度即將籌辦中文閱讀理解比賽,競(jìng)賽將于2018年3月1日正式開啟報(bào)名通道)。但是針對(duì)這類題型,人類早已總結(jié)出了一套答題技巧,更何況是收集了大量數(shù)據(jù)文本的機(jī)器呢?在為AI建立模型時(shí),完全可以達(dá)到以某個(gè)詞匯來(lái)刺激AI作出相應(yīng)答案的程度。比如上文中的“藍(lán)色”對(duì)應(yīng)“惆悵,困郁”,再如“書信”對(duì)應(yīng)“思念”等等。但是,這種操作下,AI閱讀理解在做題時(shí)用的不是“理解”,而是“套路”;因?yàn)闄C(jī)器沒(méi)有“思考”,只有“運(yùn)算”。
為什么這么說(shuō)呢?我們大概能在AI閱讀理解的做題流程中找到答案:
- Embedding Layer(相當(dāng)于是人的詞匯級(jí)的閱讀知識(shí)):一般采用的都是在外部大規(guī)模數(shù)據(jù)上預(yù)訓(xùn)練的詞向量(例如Glove等),以及基于循環(huán)神經(jīng)網(wǎng)絡(luò)或者卷積神經(jīng)網(wǎng)絡(luò)的從字符到單詞的詞向量(表示),這樣就可以得到問(wèn)題和文章段落里面每個(gè)單詞的上下文無(wú)關(guān)的表示。
- Encoding Layer(相當(dāng)于人通覽全文):一般采用多層的循環(huán)神經(jīng)網(wǎng)絡(luò)得到問(wèn)題和文章段落的每個(gè)詞的上下文相關(guān)的表示。
- Matching Layer(相當(dāng)于帶著問(wèn)題讀段落):得到問(wèn)題里面的詞和文章段落詞之間的對(duì)應(yīng)(或者叫匹配)關(guān)系?;臼遣捎米⒁饬Γ╝ttention)的機(jī)制實(shí)現(xiàn),常見(jiàn)的有基于Match-LSTM和Co-attention兩種,這樣就得到文章里面每個(gè)詞的和問(wèn)題相關(guān)的表示。
- Self-Matching Layer(相當(dāng)于人再讀一遍進(jìn)行驗(yàn)證):在得到問(wèn)題相關(guān)的詞表示的基礎(chǔ)上再采用self-attention的機(jī)制進(jìn)一步完善文章段落中的詞的表示。
- AnswerPointerLayer(相當(dāng)于人綜合線索定位答題):對(duì)文章段落里面的每個(gè)詞預(yù)測(cè)其是答案開始以及答案結(jié)束的概率,從而計(jì)算文章段落中答案概率最大的子串輸出為答案。
所謂一千個(gè)讀者有一千個(gè)哈姆雷特,我們?nèi)祟愒诶斫庖黄恼碌臅r(shí)候往往會(huì)帶上自己的主觀色彩,每個(gè)人都會(huì)生成自己的看法。而AI呢?在做題之外又能否對(duì)文章生成不一樣的看法?
AI瘋狂“跑分”,其結(jié)果是成為人類更好的幫手
之所以大家都認(rèn)為AI閱讀理解超越了人類,是因?yàn)閺募夹g(shù)原理來(lái)講,AI閱讀理解超越人類是一件非常合理的事情。
首先,AI“閱讀”的能力正在一天天提升,自然語(yǔ)言處理技術(shù)的突破,很可能取代人類的“理解力”。其次,深度神經(jīng)網(wǎng)絡(luò)模型能夠模擬人類在做閱讀理解問(wèn)題時(shí)的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問(wèn)題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。于是,自然語(yǔ)言處理技術(shù)和深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,使得AI可以進(jìn)行超乎人類的閱讀理解,似乎就成為了順理成章的一件事。
于是很多人開始思考,AI閱讀理解是否會(huì)替代由人工完成的規(guī)則、對(duì)話、服務(wù)信息類的相關(guān)理解工作?事實(shí)上,這種想法僅僅是理論上成立,但在實(shí)際應(yīng)用時(shí)還有很多問(wèn)題。
首先是把閱讀理解這件事過(guò)分簡(jiǎn)單化了。閱讀理解的題目分為精準(zhǔn)匹配和模糊匹配,前者是硬性的閱讀理解,即看到一段文字提取對(duì)應(yīng)的信息,并進(jìn)行簡(jiǎn)單的加工處理得到直觀的信息;后者則是通過(guò)一段文字或一篇文章,結(jié)合文字背后的背景信息以及現(xiàn)實(shí)世界中的社會(huì)、人文背景以及讀者的閱歷等諸多方面,經(jīng)過(guò)邏輯和“感性”的思考得出的理解和感受。換句話說(shuō),閱讀理解是包含了語(yǔ)境理解、人文理解以及對(duì)內(nèi)容熟稔之后的綜合工作。這些顯然是AI無(wú)法替代的。
再者,AI閱讀理解的“跑分”結(jié)果是有著前提約束條件的,比如在確定的題庫(kù)和測(cè)試時(shí)間,并且只是成年人平均理解水平。而要進(jìn)一步推動(dòng)閱讀理解技術(shù)的發(fā)展,就得跟無(wú)人駕駛汽車分級(jí)測(cè)試一樣需要設(shè)定問(wèn)題的難度,逐級(jí)增加難度,對(duì)每一個(gè)級(jí)別建立訓(xùn)練和評(píng)測(cè)集合。
總之,擁有超越人類的理解力,還是今天的AI所無(wú)法做到的。這也意味著,AI更合適成為人類幫手,而非替代者。二者結(jié)合最好的方式,應(yīng)該是AI進(jìn)行基礎(chǔ)處理,人類用AI來(lái)提升工作效率。這種人機(jī)交互的關(guān)系,其實(shí)在大部分“可能被AI替代的工作崗位”中都能找到。
這個(gè)閱讀理解的“跑分高手”,還能在哪里幫助人類
我們認(rèn)為目前這兩個(gè)方面AI閱讀理解能大展拳腳:
1. 貼近真實(shí)需求,助力人機(jī)交互
在購(gòu)買家電時(shí)你是非為那些枯燥無(wú)聊的“使用手冊(cè)”感到十分頭痛?在各種軟件下載中的“用戶協(xié)議”上你只能傻傻地點(diǎn)擊“我同意”?有了AI閱讀理解技術(shù),這一切都有了更好的解決辦法。
例如智能客服中,可以使用機(jī)器閱讀文本文檔(如用戶手冊(cè)、商品描述等)來(lái)自動(dòng)或輔助客服來(lái)回答用戶的問(wèn)題。
在搜索引擎中,機(jī)器閱讀理解技術(shù)可以用來(lái)為用戶的搜索(尤其是問(wèn)題型的查詢)提供更為智能的答案。目前R-NET的技術(shù)已經(jīng)成功地在微軟的必應(yīng)搜索引擎中得到了很好的應(yīng)用。我們通過(guò)對(duì)整個(gè)互聯(lián)網(wǎng)的文檔進(jìn)行閱讀理解,從而直接為用戶提供精確的答案。同時(shí),這在移動(dòng)場(chǎng)景的個(gè)人助理如微軟小娜(Cortana)里也有直接的應(yīng)用。
在辦公領(lǐng)域,機(jī)器閱讀理解技術(shù)也有很好的應(yīng)用前景,比如使用機(jī)器閱讀理解技術(shù)處理個(gè)人的郵件或者文檔,然后用自然語(yǔ)言查詢獲取相關(guān)的信息。
2. 友好嵌入環(huán)境,“技術(shù)”成為“助手”
此外,機(jī)器閱讀理解技術(shù)在垂直領(lǐng)域也有非常廣闊的應(yīng)用前景,例如在教育領(lǐng)域用來(lái)輔助出題,法律領(lǐng)域用來(lái)理解法律條款,輔助律師或者法官判案,醫(yī)療領(lǐng)域理解醫(yī)療信息,幫助病人咨詢,以及在金融領(lǐng)域里從非結(jié)構(gòu)化的文本(比如新聞中)抽取金融相關(guān)的信息等。
正如阿里巴巴研究院自然語(yǔ)言處理首席科學(xué)家司羅在一份公告中所說(shuō)的一樣,對(duì)于像“天為什么會(huì)下雨”這樣的客觀問(wèn)題,機(jī)器給出的答案準(zhǔn)確率會(huì)很高。公告稱,其中的技術(shù)可以逐步應(yīng)用于諸如客服、博物館指南、在線解答患者醫(yī)療問(wèn)題等廣泛的實(shí)際應(yīng)用領(lǐng)域,從而以一種前所未有的方式減少人力投入的需求。
更甚者,機(jī)器閱讀理解技術(shù)可以做成一個(gè)通用的能力,釋放給第三方用來(lái)構(gòu)建更多的應(yīng)用。
總結(jié)
微軟團(tuán)隊(duì)負(fù)責(zé)人周明老師曾在訪談中說(shuō)到,
“超越人類不能作為媒體的報(bào)道噱頭,我們?cè)诳吹郊夹g(shù)進(jìn)步的同時(shí),更應(yīng)該冷靜思考模型的不斷完善和技術(shù)應(yīng)用落地。這是一個(gè)生態(tài),需要所有業(yè)界同仁一起健康競(jìng)爭(zhēng),把現(xiàn)階段面臨的難題攻克,而非停留在比賽第一這樣的階段性喜悅中?!?/p>
閱讀理解能力是人類智能中最關(guān)鍵的能力之一,AI閱讀理解技術(shù)有著十分廣泛的應(yīng)用前景,可能那還很遠(yuǎn),也可能很近,但比起超越人類,AI應(yīng)該更有可能成為人類幫手。即使它在許多人類制定的規(guī)則項(xiàng)目中“贏”了人類,真正“超越人類”的還是人類自己。
作者:顏璇,微信工眾號(hào): “智能相對(duì)論(ID:aixdlun)”
本文由 @顏璇 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
對(duì)于大量人類心理模型,行為模型的積累,模仿。AI必定會(huì)超過(guò)人類,做出更具人性的判斷。