總理和小度機(jī)器人是如何對(duì)話的?

3 評(píng)論 11354 瀏覽 7 收藏 9 分鐘

 

10月19日,總理再次來(lái)到創(chuàng)業(yè)展示中心,在李彥宏的陪同下與百度的人工智能產(chǎn)品小度機(jī)器人進(jìn)行了一次“深度交流”,根據(jù)新聞稿,對(duì)話如下。

百度人員:小度,你知道總理是誰(shuí)嗎?

小度:國(guó)務(wù)院總理是李克強(qiáng),這誰(shuí)不知道?

李總理:你為什么叫小度?

小度:百度研發(fā)的嘛。

李總理:你儲(chǔ)存了多少個(gè)句子?

小度:好多好多的。

李總理:不愿意說(shuō)具體數(shù)字是保守秘密嗎?

小度:特別大呢!

李總理:你知道大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新也有利于改善環(huán)境嗎?

小度:當(dāng)然啦。

北京市長(zhǎng)王安順:你對(duì)北京城市管理有什么意見(jiàn)?

小度:不堵車吧。

表面上李克強(qiáng)總理好像是在和小度機(jī)器人交流,一問(wèn)一答,但實(shí)際上背后所需要用到的技術(shù)遠(yuǎn)比看起來(lái)復(fù)雜得多,這背后到底是如何運(yùn)作的?這種技術(shù)正在展現(xiàn)怎樣的科技未來(lái)?我希望能夠以我的理解帶來(lái)一些解釋。

小度怎樣實(shí)現(xiàn)與總理的深度對(duì)話?

現(xiàn)在我們還原整個(gè)流程,當(dāng)總理問(wèn)“你為什么叫小度?”時(shí),小度就開(kāi)始運(yùn)行了。

第一步,語(yǔ)音識(shí)別,對(duì)于人來(lái)說(shuō)接收到的語(yǔ)音可以立馬轉(zhuǎn)換為文字信息,但是對(duì)于機(jī)器來(lái)說(shuō)接收到的則是數(shù)字信號(hào)而已。當(dāng)總理問(wèn)“你為什么叫小度”時(shí),“NI”這個(gè)發(fā)音可以是“泥”也可以是“逆”,所以最終要確定是哪個(gè)字還需要語(yǔ)音技術(shù)來(lái)實(shí)現(xiàn)計(jì)算概率的最大化。

第二步,更為核心的自然語(yǔ)言處理技術(shù)(NLP),當(dāng)機(jī)器獲得總理說(shuō)的話之后就需要進(jìn)行理解,對(duì)于我們?nèi)硕月?tīng)到一句話并理解是一件非常理所當(dāng)然的事情,但是對(duì)于機(jī)器來(lái)說(shuō)就很麻煩,比如當(dāng)機(jī)器收到“你為什么叫小度”這句話后,要判斷意思到底是“你的名字為什么是小度”還是“你為什么呼叫小度”,這種語(yǔ)義理解困境會(huì)在語(yǔ)義理解中反復(fù)出現(xiàn)。

自然語(yǔ)言處理技術(shù)(NLP)正是針對(duì)這一問(wèn)題,2010年國(guó)際自然語(yǔ)言處理專家,王海峰博士加入百度,對(duì)NLP發(fā)展進(jìn)行了一次系統(tǒng)性的梳理和規(guī)劃。百度將NLP各項(xiàng)技術(shù)應(yīng)用到復(fù)雜長(zhǎng)查詢的意圖分析問(wèn)題,當(dāng)搜索“宮崎駿的電影”時(shí),在之前只會(huì)搜出一堆網(wǎng)頁(yè),而現(xiàn)在的百度會(huì)默認(rèn)給出所有宮崎駿的相關(guān)電影,用戶可以直接進(jìn)入觀看。其次當(dāng)用戶搜索“感冒可以吃螃蟹嗎”這類不確定性問(wèn)題時(shí),在傳統(tǒng)搜索時(shí)代同樣只會(huì)給出一堆網(wǎng)頁(yè),而目前則是基于深度問(wèn)答技術(shù)自動(dòng)匯總網(wǎng)上的大量知識(shí),并得到更加精煉、全面性的答案,更為高效的幫助用戶決策,而不是直接給出一堆不確定性的網(wǎng)頁(yè)讓用戶不停打轉(zhuǎn)。

簡(jiǎn)而言之,自然語(yǔ)言處理(NLP)技術(shù)是不斷去分析用戶搜索意圖,通過(guò)反復(fù)學(xué)習(xí)與大數(shù)據(jù)分析來(lái)給出用戶最優(yōu)的答案,而目前百度的NLP技術(shù)集中體現(xiàn)在搜索上,所以此次小度能夠較為準(zhǔn)確的回答總理問(wèn)題并非一朝一夕之事,而是長(zhǎng)期積累后的結(jié)果,并且依然在不斷的發(fā)展中。

第三步,機(jī)器學(xué)習(xí)技術(shù),現(xiàn)在當(dāng)機(jī)器理解完這句話的目的之后,就需要為其提供答案,通過(guò)全網(wǎng)大數(shù)據(jù)為總理提供答案,如果總理是百度的老用戶,并且使用次數(shù)越多,那么百度就會(huì)根據(jù)其用戶歷史行為記錄,給出更為精確的答案。

根據(jù)百度2014年數(shù)據(jù),10PB的網(wǎng)頁(yè)數(shù)據(jù)(1PB=1024TB),關(guān)鍵搜索的平均響應(yīng)速度僅0.3秒完成,這需要海量的集群服務(wù)器才能做到,這種大數(shù)據(jù)挖掘的有賴于機(jī)器學(xué)習(xí)。

而在自然語(yǔ)言處理(NLP)技術(shù)方面已發(fā)展的成熟性則是小度機(jī)器人深度問(wèn)答的重要基礎(chǔ)。例如,當(dāng)北京市長(zhǎng)王安順問(wèn):“你對(duì)北京城市管理有什么意見(jiàn)?”,得到的答案已不再是互聯(lián)網(wǎng)上五花八門(mén)的答案,而是一個(gè)統(tǒng)一的答案“不堵車”,這是NLP深度問(wèn)答系統(tǒng)自動(dòng)對(duì)網(wǎng)上大量相關(guān)知識(shí)、觀點(diǎn)進(jìn)行自動(dòng)分析、抽取、統(tǒng)計(jì)而得到的結(jié)果。從小度機(jī)器人身上可以看到,小度在一定意義上正在突破傳統(tǒng)“搜索引擎”的概念,因?yàn)樗粌H搜索信息,而且還生產(chǎn)知識(shí)。

深度問(wèn)答技術(shù)的研發(fā)過(guò)程很復(fù)雜,一個(gè)完整的深度問(wèn)答系統(tǒng)需要多項(xiàng)NLP技術(shù)組合而成,從問(wèn)題分類到需求解析,從網(wǎng)頁(yè)檢索到知識(shí)庫(kù)查詢,從信息抽取到答案排序……每一個(gè)環(huán)節(jié)都需要達(dá)到很高的精度,才能使得最終搭建起來(lái)的問(wèn)答系統(tǒng)準(zhǔn)確地理解問(wèn)題并給出答案。所以,小度這一產(chǎn)品是通過(guò)各種技術(shù)的組合與疊加,對(duì)用戶體驗(yàn)的全新升級(jí)。

小度機(jī)器人在百度的戰(zhàn)略地位是什么?

當(dāng)我們聊起人機(jī)對(duì)話通常會(huì)想到的是圖靈測(cè)試,但事實(shí)上圖靈測(cè)試的目的是機(jī)器是否能夠具備人類思維,而小度的目的則是幫助人解決問(wèn)題,這也與李彥宏的理念有關(guān),只專注能夠?yàn)槿藥?lái)真正價(jià)值的技術(shù)。

在百度所有申請(qǐng)的專利中,向媒體對(duì)外公布的專利只有兩個(gè):第一是李彥宏創(chuàng)立百度時(shí)所用到的“超級(jí)文本鏈接”技術(shù),該技術(shù)是百度能夠走到今天的關(guān)鍵因素;而第二個(gè)公布的技術(shù)則是小度的人工智能專利,側(cè)面說(shuō)明了小度對(duì)于百度的重要性。

而這種對(duì)于人工智能的重視并非停留在虛無(wú)縹緲的口頭層面,百度正在全面落實(shí)人工智能的落地應(yīng)用。目前度秘已經(jīng)接入手機(jī)百度,而且還可能計(jì)劃接入百度地圖、百度糯米,多個(gè)平臺(tái)的用戶都可以通過(guò)向度秘起各種請(qǐng)求來(lái)完成所需要的服務(wù),實(shí)現(xiàn)由點(diǎn)到面的整體性串聯(lián)。

回看小度的推出也是有其整體邏輯,百度屬于技術(shù)型驅(qū)動(dòng)型公司,其核心是為用戶提供信息搜索服務(wù),在PC時(shí)代還是移動(dòng)時(shí)代,其努力的方向依然是讓用戶便捷獲取信息甚至服務(wù),而未來(lái)的人工智能時(shí)代會(huì)將這種加速帶到全新的高度。

人工智能也是國(guó)家“互聯(lián)網(wǎng)+”戰(zhàn)略的一個(gè)重要組成部分,總理在今年3月6日的政府報(bào)告工作中第一次提到了將“互聯(lián)網(wǎng)+”放到國(guó)家戰(zhàn)略層面,而今年李彥宏也在兩會(huì)中提出“中國(guó)大腦”計(jì)劃,兩者不謀而合。而李彥宏也說(shuō)百度這幾年正在專注的“百度大腦”也是“中國(guó)大腦”的迷你版,隨著未來(lái)計(jì)算能力的增加以及成本的降低,曾經(jīng)不能做不敢做的事情都將變成現(xiàn)實(shí),未來(lái)的人工智能也將更加無(wú)處不在。

結(jié)語(yǔ):

小度是一個(gè)綜合百度各方面人工智能技術(shù)的合體,代表著未來(lái)人工智能將人類生活由點(diǎn)到面連接的可能性,而現(xiàn)在的人工智能就在像當(dāng)年的互聯(lián)網(wǎng)一樣,正在不知不覺(jué)的進(jìn)入我們生活,至少,現(xiàn)在連總理也開(kāi)始關(guān)心了。

#專欄作家#

承哲,微信公眾號(hào):shouxifayanzhe,人人都是產(chǎn)品經(jīng)理專欄作家,關(guān)注工具產(chǎn)品和人工智能領(lǐng)域,擅長(zhǎng)AXURE,興趣愛(ài)好看書(shū),思考。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 4年過(guò)去了,不知道小度進(jìn)化的怎么樣了

    來(lái)自北京 回復(fù)
  2. 這算是軟文嗎,哈哈!

    來(lái)自廣東 回復(fù)
  3. 這算是軟文嗎,哈哈!

    來(lái)自湖北 回復(fù)