親愛的,你已經(jīng)連閱讀理解都做不過AI了

4 評論 2522 瀏覽 0 收藏 9 分鐘

機(jī)器理解力,讓我們在未來面前不止是個孩子。

提起“閱讀理解”這四個字,你會想到什么?

被四六級雅思托福支配的恐懼?語文試卷上連原作者都搞不懂的選擇題?

不管哪種答案,肯定都逃不出一個規(guī)律:進(jìn)行閱讀理解這項有益身心運動的主體,必然是跟你我一樣的人類。

畢竟嘛,這東西需要閱讀一大段文字,然后理解了意義之后再做題目,堪稱一場考試中最復(fù)雜最費腦筋,也最考驗綜合能力的一個環(huán)節(jié)。所以你的英語老師一定說過這樣一句話:得閱讀理解者得天下。

然而,可是,但是,如果告訴你今天得這個天下的已經(jīng)不再是人類,而是AI了,你會怎么想?也許此前我們想象過單詞聽寫、句子翻譯甚至寫作都可以被AI完成,但是閱讀理解這件事人類已經(jīng)被甩在了AI身后,大概很多人都沒想到。

可事實就是這樣:

1月11日,斯坦福大學(xué)著名的機(jī)器閱讀理解賽事SQuAD刷新了全球排名,阿里巴巴憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,超越了人類82.304的平均得分。

當(dāng)然了,AI是不會去跟你比托福刷分的,這件事的背后,腦洞有點大哦…

什么是機(jī)器閱讀理解?

機(jī)器閱讀理解,雖然看起來只是讓AI上陣來一場考試。但是卻是自然語言處理技術(shù)中,繼語音判斷、語義理解之后最大的挑戰(zhàn):讓智能體理解全文語境。

而斯坦福大學(xué)發(fā)起的SQuAD挑戰(zhàn)賽,則是業(yè)內(nèi)公認(rèn)的機(jī)器閱讀理解最高水平賽事。

SQuAD挑戰(zhàn)賽的基本規(guī)則,是通過眾包的方式構(gòu)建一個包含10萬個問題左右的大規(guī)模數(shù)據(jù)集,并給出來源于維基百科長度大約在幾百個單詞左右的文章。參賽者提交的AI模型在閱讀完數(shù)據(jù)集中的一篇短文之后,回答若干個基于文章內(nèi)容的問題,答案與標(biāo)準(zhǔn)答案進(jìn)行比對,最終得出成績。

由于閱讀理解這項“智能”調(diào)整,需要運用到大量邏輯、細(xì)節(jié)和結(jié)構(gòu)分析能力,并且直接作用于現(xiàn)實中的文本資料,所以實際價值很大。

比如說,我們首先要面對的問題就是,假如人工智能已經(jīng)比人類平均水平更擅長在對文本中精準(zhǔn)信息進(jìn)行理解和回答,會帶給我們什么呢?

當(dāng)AI的“閱讀理解”得分超越人類,意味著什么

舉個例子或許可以很簡單的理解這個問題:英語考試上,當(dāng)機(jī)器可以翻譯單詞的時候,我們一點都不驚奇;但機(jī)器可以聽寫整句話的時候,我們會感嘆技術(shù)進(jìn)步了;當(dāng)機(jī)器自己做閱讀理解的時候,我們大概會想:還要我考這個試干什么?

這里面的差別,在于處理閱讀理解相關(guān)問題時,AI不只是要運算和記錄,而是要主動去分析和理解,所以閱讀理解問題一直被人問是NLP的標(biāo)志性臨界點。但這個點被AI破解,直接意味著很多必須人類才能完成的工作已經(jīng)正式能夠被AI接管。

因為閱讀理解問題,不只是要處理語音和簡單的語義,而是要理解和關(guān)注詞匯、語句、篇章結(jié)構(gòu)、思維邏輯、輔助語句和關(guān)鍵句等等元素構(gòu)成的復(fù)雜組織網(wǎng)絡(luò)。

機(jī)器閱讀理解“達(dá)標(biāo)”,最直接的產(chǎn)業(yè)影響,是大多數(shù)今天還必須由人工完成的規(guī)則、對話、服務(wù)信息類的相關(guān)理解工作,都可以被人工智能所取代。比如說客服、信息管理和推薦類的工作,都可以考慮用不妙不休、高運算速度的機(jī)器來取代。

機(jī)器閱讀理解如何工作

或許我們都注意到了這樣一個問題:今天的互聯(lián)網(wǎng)世界,在變得越來越多文本內(nèi)容,各種各樣的信息爆炸而來。太多你知道的、你不知道的、你以為自己知道的卻實際不知道的事情呼嘯而過。甚至你雙11想要剁個手,都有各種各樣的游戲規(guī)則等著你。自己讀吧,太累太痛苦還沒時間,問客服吧,很可能出錯還很慢,簡直是薛定諤式問題。

這里或許就可以用機(jī)器閱讀理解來解決了。比如客戶對某個電商促銷規(guī)則有疑問,就可以直接向AI提問,而AI就可以把這個問題當(dāng)做一道閱讀理解問題來進(jìn)行解決方案回饋。

機(jī)器閱讀理解能力,將在如何向客戶提供非模板式的智能客服服務(wù)中發(fā)揮作用。而當(dāng)AI在這些能力上超越人工,那么機(jī)器客服的利用價值將可能快速提升。換句話說:機(jī)器客服終于可以不那么機(jī)器了…..

由此不難看出,這種關(guān)鍵能力的標(biāo)桿性突破,對大量強(qiáng)調(diào)與普通消費者交互的產(chǎn)業(yè)線益處最多。

推而廣之,機(jī)器閱讀能力也是文娛領(lǐng)域進(jìn)行內(nèi)容尋找和推薦的有效方式,比如閱讀用戶提出的復(fù)雜需求,進(jìn)行精準(zhǔn)推薦;與IoT產(chǎn)品相結(jié)合,給出對用戶大段語言的回饋,乃至對話互動,都必須以機(jī)器理解能力為依托。

理解力,讓我們在未來面前不僅是個孩子

除了知道AI可以充當(dāng)更好的客服之外,究竟我們?yōu)槭裁磻?yīng)該關(guān)注機(jī)器閱讀理解這件事?或許關(guān)鍵,是我們應(yīng)該知道“理解力”在目前AI世界中的重要程度和期待指數(shù)。

AI作為一種從計算機(jī)科學(xué)下的分支,一個智能體先天具備的是運算能力,而希望進(jìn)行仿人類智慧的智能模擬,第二步就是模仿人類的感知。今天我們看到的機(jī)器視覺、語音識別、語義理解,都是在做這件事。而第三步,就是讓AI產(chǎn)生理解力。

顯然,識別有著龐大的應(yīng)用場景,并會在接下來很長一段時間內(nèi)占據(jù)主流。但是AI的理解能力是大多數(shù)識別能力的進(jìn)化,假如單純的識別出卻無法產(chǎn)生輸出,那么AI無非是更靈活的傳感器而已。

從這個邏輯上看,閱讀理解這道題絕不僅僅是個測試,或者商業(yè)應(yīng)用的技術(shù)加持,更重要的是開啟AI紀(jì)元里理解力的加速器。

更廣闊的意義在于,我們或許距離永遠(yuǎn)不用測試機(jī)器閱讀理解更近了一步。當(dāng)我們不再考慮機(jī)器是否能理解人類文本和語言,那么DeepNLP將可能達(dá)成,人機(jī)交互的范圍將級擴(kuò)大。機(jī)器智能可以開始捕捉人類的邏輯和函指。

可能那還很遠(yuǎn),也可能很近,但機(jī)器理解力讓我們在未來面前不止是個孩子,應(yīng)該是毫無疑問的。

 

作者:腦極體,微信公眾號:腦極體

本文由 @腦極體 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 讓AI來閱讀中文啊,這么簡單的意思給老板意思意思,不要不好意思,不是那個意思就是小意思。

    來自上海 回復(fù)
  2. 這遠(yuǎn)遠(yuǎn)不代表計算機(jī)超越了人類的閱讀理解水平,因為這樣的跑分結(jié)果是有一個前提條件約束的,比如在確定的題庫和測試時間,并且只是成年人平均理解水平。

    來自福建 回復(fù)
  3. 看完樓主這篇文章,說實話我想到了終結(jié)者,想到了ai取代人類,人類獲取知識容量,面,時間,效率有限,不像是機(jī)器存儲數(shù)據(jù),現(xiàn)在都能通過語境去邏輯分析了。。。說到底大數(shù)據(jù)太偉大了!

    來自廣東 回復(fù)