99久久成人国产精品免费,欧美三级韩国三级日本三斤

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

AI閱讀理解技術(shù)：有可能成為人類幫手？

智能相對(duì)論

2018-01-23

2 評(píng)論 3147 瀏覽 13 收藏

14 分鐘

閱讀理解能力是人類智能中最關(guān)鍵的能力之一，AI閱讀理解技術(shù)有著十分廣泛的應(yīng)用前景，可能那還很遠(yuǎn)，也可能很近，但比起超越人類，AI應(yīng)該更有可能成為人類幫手。

“三長(zhǎng)一短選最短, 三短一長(zhǎng)選最長(zhǎng),參差不齊C無(wú)敵?！?/p>

還記得上學(xué)期間流傳在“學(xué)渣們”之間的所謂閱讀理解的“做題法寶”嗎？

當(dāng)然，這只是學(xué)渣們給自己的心理安慰。閱讀理解作為一道考察學(xué)生理解能力、思辨能力的題型，絕不僅僅是一道口訣就能解決的，它需要大量的練習(xí)與不斷地揣摩。

不管如何，相信大家都有一個(gè)共識(shí)：閱讀理解這件事當(dāng)然是人類的專項(xiàng)。

然而事實(shí)上，近日，在美國(guó)斯坦福大學(xué)發(fā)起機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD中，阿里巴巴開發(fā)的人工智能模型獲得了82.44的高分，超過(guò)了人類平均值82.304的分?jǐn)?shù)。這是機(jī)器首次在此類測(cè)試中獲得超過(guò)人類的分?jǐn)?shù)，而微軟的AI模型獲得了82.650的分?jǐn)?shù)，排名首位。

智能體在閱讀理解領(lǐng)域開始“跑分”，AI能夠進(jìn)行全文理解，已然成為了AI界的大事件。此時(shí)，我們首先要面對(duì)的問(wèn)題就是，當(dāng)AI已經(jīng)能夠比人類更快速、更精準(zhǔn)地對(duì)文本中的信息進(jìn)行回答時(shí)，AI究竟是人類的替代者還是幫助者呢？AI閱讀理解在未來(lái)又會(huì)如何落地呢？這些問(wèn)題看似簡(jiǎn)單，卻有很多值得討論的地方。

AI閱讀理解技術(shù)之思

整體來(lái)說(shuō)，我們認(rèn)為至少可以從這兩點(diǎn)思考。

1、AI閱讀理解只是自然語(yǔ)言處理（NLP）的進(jìn)化

雖說(shuō)AI閱讀理解近期才進(jìn)入人們的視線，但AI閱讀理解技術(shù)究其根本還是繼語(yǔ)義分析、語(yǔ)音識(shí)別后的又一在自然語(yǔ)言處理技術(shù)中取得的突破。

（圖來(lái)自億歐網(wǎng)）

自然語(yǔ)言處理發(fā)展得很早，計(jì)算機(jī)剛剛發(fā)明之后，人們就開始了自然語(yǔ)言處理的研究。機(jī)器翻譯是其中最早進(jìn)行的NLP研究。那時(shí)的NLP研究都是基于規(guī)則的，或者基于專家知識(shí)的。而閱讀理解技術(shù)是怎么發(fā)展而來(lái)的呢？在圖像識(shí)別和語(yǔ)音識(shí)別領(lǐng)域的成果激勵(lì)下，人們逐漸開始引入深度學(xué)習(xí)來(lái)做NLP研究，于是閱讀理解技術(shù)應(yīng)運(yùn)而生。

這類技術(shù)也面臨很多挑戰(zhàn)。具體來(lái)講，包括：

如何跟知識(shí)學(xué)習(xí)——有效地把知識(shí)包括語(yǔ)言學(xué)知識(shí)、領(lǐng)域知識(shí)用起來(lái)；
如何跟環(huán)境學(xué)習(xí)——通過(guò)強(qiáng)化學(xué)習(xí)的方式提升系統(tǒng)的性能；
如何跟上下文學(xué)習(xí)——利用上下文進(jìn)一步增強(qiáng)對(duì)當(dāng)前句子的處理能力；
如何利用用戶畫像體現(xiàn)個(gè)性化。

每個(gè)環(huán)節(jié)若出現(xiàn)偏差都有可能導(dǎo)致結(jié)果的不準(zhǔn)確。

2、AI閱讀理解缺乏真正的思考

讓我們先來(lái)看一道語(yǔ)文考試中常見(jiàn)的閱讀理解題目——

老師提出問(wèn)題：為什么作者描寫的“窗簾”是藍(lán)色的？
學(xué)生答：“因?yàn)榇昂熓撬{(lán)色的?！?/li>
老師說(shuō)：“錯(cuò)！藍(lán)色的‘窗簾’具有愁緒的意味，表達(dá)作者當(dāng)時(shí)困郁的心境……

這種類型的閱讀理解，大家都很熟悉吧。目前，AI在中文閱讀理解的簡(jiǎn)答題型方面表現(xiàn)如何還沒(méi)有具體的數(shù)據(jù)可以說(shuō)明（值得一提的是，百度即將籌辦中文閱讀理解比賽，競(jìng)賽將于2018年3月1日正式開啟報(bào)名通道）。但是針對(duì)這類題型，人類早已總結(jié)出了一套答題技巧，更何況是收集了大量數(shù)據(jù)文本的機(jī)器呢？在為AI建立模型時(shí)，完全可以達(dá)到以某個(gè)詞匯來(lái)刺激AI作出相應(yīng)答案的程度。比如上文中的“藍(lán)色”對(duì)應(yīng)“惆悵，困郁”，再如“書信”對(duì)應(yīng)“思念”等等。但是，這種操作下，AI閱讀理解在做題時(shí)用的不是“理解”，而是“套路”；因?yàn)闄C(jī)器沒(méi)有“思考”，只有“運(yùn)算”。

為什么這么說(shuō)呢？我們大概能在AI閱讀理解的做題流程中找到答案：

Embedding Layer（相當(dāng)于是人的詞匯級(jí)的閱讀知識(shí)）：一般采用的都是在外部大規(guī)模數(shù)據(jù)上預(yù)訓(xùn)練的詞向量（例如Glove等），以及基于循環(huán)神經(jīng)網(wǎng)絡(luò)或者卷積神經(jīng)網(wǎng)絡(luò)的從字符到單詞的詞向量（表示），這樣就可以得到問(wèn)題和文章段落里面每個(gè)單詞的上下文無(wú)關(guān)的表示。
Encoding Layer（相當(dāng)于人通覽全文）：一般采用多層的循環(huán)神經(jīng)網(wǎng)絡(luò)得到問(wèn)題和文章段落的每個(gè)詞的上下文相關(guān)的表示。
Matching Layer（相當(dāng)于帶著問(wèn)題讀段落）：得到問(wèn)題里面的詞和文章段落詞之間的對(duì)應(yīng)（或者叫匹配）關(guān)系?；臼遣捎米⒁饬Γ╝ttention）的機(jī)制實(shí)現(xiàn)，常見(jiàn)的有基于Match-LSTM和Co-attention兩種，這樣就得到文章里面每個(gè)詞的和問(wèn)題相關(guān)的表示。
Self-Matching Layer（相當(dāng)于人再讀一遍進(jìn)行驗(yàn)證）：在得到問(wèn)題相關(guān)的詞表示的基礎(chǔ)上再采用self-attention的機(jī)制進(jìn)一步完善文章段落中的詞的表示。
AnswerPointerLayer（相當(dāng)于人綜合線索定位答題）：對(duì)文章段落里面的每個(gè)詞預(yù)測(cè)其是答案開始以及答案結(jié)束的概率，從而計(jì)算文章段落中答案概率最大的子串輸出為答案。

所謂一千個(gè)讀者有一千個(gè)哈姆雷特，我們?nèi)祟愒诶斫庖黄恼碌臅r(shí)候往往會(huì)帶上自己的主觀色彩，每個(gè)人都會(huì)生成自己的看法。而AI呢？在做題之外又能否對(duì)文章生成不一樣的看法？

AI瘋狂“跑分”，其結(jié)果是成為人類更好的幫手

之所以大家都認(rèn)為AI閱讀理解超越了人類，是因?yàn)閺募夹g(shù)原理來(lái)講，AI閱讀理解超越人類是一件非常合理的事情。

首先，AI“閱讀”的能力正在一天天提升，自然語(yǔ)言處理技術(shù)的突破，很可能取代人類的“理解力”。其次，深度神經(jīng)網(wǎng)絡(luò)模型能夠模擬人類在做閱讀理解問(wèn)題時(shí)的一些行為，包括結(jié)合篇章內(nèi)容審題，帶著問(wèn)題反復(fù)閱讀文章，避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。于是，自然語(yǔ)言處理技術(shù)和深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合，使得AI可以進(jìn)行超乎人類的閱讀理解，似乎就成為了順理成章的一件事。

于是很多人開始思考，AI閱讀理解是否會(huì)替代由人工完成的規(guī)則、對(duì)話、服務(wù)信息類的相關(guān)理解工作？事實(shí)上，這種想法僅僅是理論上成立，但在實(shí)際應(yīng)用時(shí)還有很多問(wèn)題。

首先是把閱讀理解這件事過(guò)分簡(jiǎn)單化了。閱讀理解的題目分為精準(zhǔn)匹配和模糊匹配，前者是硬性的閱讀理解，即看到一段文字提取對(duì)應(yīng)的信息，并進(jìn)行簡(jiǎn)單的加工處理得到直觀的信息；后者則是通過(guò)一段文字或一篇文章，結(jié)合文字背后的背景信息以及現(xiàn)實(shí)世界中的社會(huì)、人文背景以及讀者的閱歷等諸多方面，經(jīng)過(guò)邏輯和“感性”的思考得出的理解和感受。換句話說(shuō)，閱讀理解是包含了語(yǔ)境理解、人文理解以及對(duì)內(nèi)容熟稔之后的綜合工作。這些顯然是AI無(wú)法替代的。

再者，AI閱讀理解的“跑分”結(jié)果是有著前提約束條件的，比如在確定的題庫(kù)和測(cè)試時(shí)間，并且只是成年人平均理解水平。而要進(jìn)一步推動(dòng)閱讀理解技術(shù)的發(fā)展，就得跟無(wú)人駕駛汽車分級(jí)測(cè)試一樣需要設(shè)定問(wèn)題的難度，逐級(jí)增加難度，對(duì)每一個(gè)級(jí)別建立訓(xùn)練和評(píng)測(cè)集合。

總之，擁有超越人類的理解力，還是今天的AI所無(wú)法做到的。這也意味著，AI更合適成為人類幫手，而非替代者。二者結(jié)合最好的方式，應(yīng)該是AI進(jìn)行基礎(chǔ)處理，人類用AI來(lái)提升工作效率。這種人機(jī)交互的關(guān)系，其實(shí)在大部分“可能被AI替代的工作崗位”中都能找到。

這個(gè)閱讀理解的“跑分高手”，還能在哪里幫助人類

我們認(rèn)為目前這兩個(gè)方面AI閱讀理解能大展拳腳：

1. 貼近真實(shí)需求，助力人機(jī)交互

在購(gòu)買家電時(shí)你是非為那些枯燥無(wú)聊的“使用手冊(cè)”感到十分頭痛？在各種軟件下載中的“用戶協(xié)議”上你只能傻傻地點(diǎn)擊“我同意”？有了AI閱讀理解技術(shù)，這一切都有了更好的解決辦法。

例如智能客服中，可以使用機(jī)器閱讀文本文檔（如用戶手冊(cè)、商品描述等）來(lái)自動(dòng)或輔助客服來(lái)回答用戶的問(wèn)題。

在搜索引擎中，機(jī)器閱讀理解技術(shù)可以用來(lái)為用戶的搜索（尤其是問(wèn)題型的查詢）提供更為智能的答案。目前R-NET的技術(shù)已經(jīng)成功地在微軟的必應(yīng)搜索引擎中得到了很好的應(yīng)用。我們通過(guò)對(duì)整個(gè)互聯(lián)網(wǎng)的文檔進(jìn)行閱讀理解，從而直接為用戶提供精確的答案。同時(shí)，這在移動(dòng)場(chǎng)景的個(gè)人助理如微軟小娜（Cortana）里也有直接的應(yīng)用。

在辦公領(lǐng)域，機(jī)器閱讀理解技術(shù)也有很好的應(yīng)用前景，比如使用機(jī)器閱讀理解技術(shù)處理個(gè)人的郵件或者文檔，然后用自然語(yǔ)言查詢獲取相關(guān)的信息。

2. 友好嵌入環(huán)境，“技術(shù)”成為“助手”

此外，機(jī)器閱讀理解技術(shù)在垂直領(lǐng)域也有非常廣闊的應(yīng)用前景，例如在教育領(lǐng)域用來(lái)輔助出題，法律領(lǐng)域用來(lái)理解法律條款，輔助律師或者法官判案，醫(yī)療領(lǐng)域理解醫(yī)療信息，幫助病人咨詢，以及在金融領(lǐng)域里從非結(jié)構(gòu)化的文本（比如新聞中）抽取金融相關(guān)的信息等。

正如阿里巴巴研究院自然語(yǔ)言處理首席科學(xué)家司羅在一份公告中所說(shuō)的一樣，對(duì)于像“天為什么會(huì)下雨”這樣的客觀問(wèn)題，機(jī)器給出的答案準(zhǔn)確率會(huì)很高。公告稱，其中的技術(shù)可以逐步應(yīng)用于諸如客服、博物館指南、在線解答患者醫(yī)療問(wèn)題等廣泛的實(shí)際應(yīng)用領(lǐng)域，從而以一種前所未有的方式減少人力投入的需求。
更甚者，機(jī)器閱讀理解技術(shù)可以做成一個(gè)通用的能力，釋放給第三方用來(lái)構(gòu)建更多的應(yīng)用。

總結(jié)

微軟團(tuán)隊(duì)負(fù)責(zé)人周明老師曾在訪談中說(shuō)到，

“超越人類不能作為媒體的報(bào)道噱頭，我們?cè)诳吹郊夹g(shù)進(jìn)步的同時(shí)，更應(yīng)該冷靜思考模型的不斷完善和技術(shù)應(yīng)用落地。這是一個(gè)生態(tài)，需要所有業(yè)界同仁一起健康競(jìng)爭(zhēng)，把現(xiàn)階段面臨的難題攻克，而非停留在比賽第一這樣的階段性喜悅中?！?/p>

閱讀理解能力是人類智能中最關(guān)鍵的能力之一，AI閱讀理解技術(shù)有著十分廣泛的應(yīng)用前景，可能那還很遠(yuǎn)，也可能很近，但比起超越人類，AI應(yīng)該更有可能成為人類幫手。即使它在許多人類制定的規(guī)則項(xiàng)目中“贏”了人類，真正“超越人類”的還是人類自己。

作者：顏璇，微信工眾號(hào)： “智能相對(duì)論（ID：aixdlun）”

本文由 @顏璇原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash，基于 CC0 協(xié)議

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App