當(dāng)百度成為「大腦」,它是怎樣思考的?

0 評(píng)論 13103 瀏覽 0 收藏 13 分鐘

[核心提示] 本文重點(diǎn)解讀百度三層設(shè)計(jì)中(百度大腦,數(shù)據(jù)工廠,開放云)最頂層的設(shè)計(jì),百度大腦計(jì)劃,讓我們來(lái)一次詳細(xì)的百度大腦解刨。

近日百度終于發(fā)布了讓人期待已久的百度大數(shù)據(jù)計(jì)劃,而本文重點(diǎn)解讀百度三層設(shè)計(jì)中(百度大腦,數(shù)據(jù)工廠,開放云)最頂層的設(shè)計(jì),百度大腦計(jì)劃,讓我們來(lái)一次詳細(xì)的百度大腦解刨。

而該計(jì)劃究竟是什么讓我們來(lái)一次深入了解,必須從三層架構(gòu)一層層解刨。

第一層:開放云

作為一個(gè)人類嬰兒,最重中之重的事情就是記憶,而記憶也是一切的發(fā)展前提。同樣,我們將百度人腦看成人腦的話,那么第一件事情,必然是存儲(chǔ)。人類沒有記憶就沒有關(guān)聯(lián),也更不用提決策與創(chuàng)造,而人類之所以能夠在靈長(zhǎng)類動(dòng)物中立足,正是有著極大的可以存儲(chǔ)記憶的腦容量,那么機(jī)器要模仿人腦也必然要建立在擁有龐大的存儲(chǔ)能力之上,百度在真正積累數(shù)據(jù)到一定程度后才開始該項(xiàng)目。

我們來(lái)看下百度存儲(chǔ)能力的發(fā)展過程:2010 年,百度的機(jī)器學(xué)習(xí)能力并不是很高,只擁有幾百臺(tái)的服務(wù)器,特征向量只有十萬(wàn)。兩年后也就是 2012 年,百度的單集群規(guī)模達(dá)到了幾十萬(wàn),已經(jīng)完全能夠做到讓這些機(jī)器在同一時(shí)間做同一件事情,特征向量從十萬(wàn)上升到兩百億!

而當(dāng)在百度達(dá)到兩百億后機(jī)器學(xué)習(xí)就到達(dá)了一定瓶頸,就算特征向量增加到三百億,四百億,對(duì)機(jī)器學(xué)習(xí)的幫助并不是很大,而此時(shí)擁極強(qiáng)存儲(chǔ)能力的百度開始了在機(jī)器學(xué)習(xí)上的“深度學(xué)習(xí)”的分支發(fā)展,進(jìn)而升級(jí)已有的人工智能大腦。

備注:

機(jī)器處理能力的評(píng)判標(biāo)準(zhǔn)有兩個(gè):第一個(gè)是看服務(wù)器規(guī)模,第二個(gè)是看特征向量大小。

特征向量:將文本語(yǔ)音圖像視頻等內(nèi)容轉(zhuǎn)化為機(jī)器能夠讀懂的一連串關(guān)鍵數(shù)據(jù),數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的就會(huì)越好,用戶的搜索結(jié)果就會(huì)越精確,對(duì)用戶的搜索體驗(yàn)效果也會(huì)隨之上升,但對(duì)服務(wù)器的壓力也會(huì)相應(yīng)加大。百度能夠僅用兩年時(shí)間從 10 萬(wàn)直接飆升到 200 億,足以見得百度服務(wù)器技術(shù)實(shí)力的雄厚。

此外這一段并非只講存儲(chǔ),同時(shí)也是在講百度大腦的發(fā)展,因?yàn)橛辛擞洃浘蜁?huì)發(fā)生關(guān)聯(lián),進(jìn)而產(chǎn)生決策,這是一個(gè)整體前進(jìn)的過程。

第二層:數(shù)據(jù)工廠

作為一個(gè)人,要調(diào)取某部分的記憶,就會(huì)很自然的聯(lián)想到某個(gè)詞,某個(gè)畫面,某個(gè)音樂等等就能記起很多事情,比如當(dāng)你聽老歌時(shí),看到童年的玩具時(shí),洶涌的記憶總會(huì)被調(diào)出來(lái)。

當(dāng)然這是因?yàn)槿祟惔竽X的神經(jīng)連接結(jié)構(gòu)允許我們這樣去檢索,而機(jī)器是不允許的,數(shù)據(jù)存儲(chǔ)在硬盤上,機(jī)器想要找到某個(gè)數(shù)據(jù),必須一個(gè)個(gè)訪問過去,機(jī)器沒有分類的概念,就像在圖書館中,機(jī)器是一個(gè)不會(huì)看分類的管理員,他要找某一本書時(shí)只能一本一本的找過去,十分笨拙。

也就是說,機(jī)器要想搜索什么內(nèi)容時(shí),必須有人來(lái)幫助它建立起分類,但最矛盾的就是,在錯(cuò)綜復(fù)雜的語(yǔ)言結(jié)構(gòu)中,我們很難為一個(gè)詞去下定義,比如當(dāng)你在說“蘋果”這個(gè)詞的時(shí)候,你如何告訴機(jī)器他的分類?”蘋果”究竟是一個(gè)名詞,還是一個(gè)公司?而決定一個(gè)詞的意義的則是語(yǔ)境,也就是機(jī)器要依靠其他詞語(yǔ)的出現(xiàn)來(lái)為這個(gè)詞做模糊的定義,不能完全給它下死定義而是要根據(jù)環(huán)境來(lái)下,并且它還應(yīng)當(dāng)是動(dòng)態(tài)的,不斷變化的。

這種搜索技術(shù)也依然要百度的大腦配合才能達(dá)到,對(duì)每一個(gè)詞的定義應(yīng)該是一個(gè)庫(kù),而這個(gè)庫(kù)中的每一個(gè)詞又都各自構(gòu)成庫(kù),百度的數(shù)據(jù)工廠所創(chuàng)造的算法,就是在這么一個(gè)數(shù)據(jù)之海中去為他們建立管理,然后去索引。

數(shù)據(jù)工廠相當(dāng)于人腦中的記憶關(guān)聯(lián)過程:將某個(gè)詞同時(shí)與其他詞或是某個(gè)場(chǎng)景等等建立起動(dòng)態(tài)關(guān)聯(lián)的過程。

第三層:百度大腦

人腦有了記憶,有了關(guān)聯(lián)之后就會(huì)進(jìn)行決策,比如小孩子碰到開水,燙到了手下次就不會(huì)碰,就是因?yàn)橛洃浟碎_水和燙手的痛苦,并將這兩個(gè)記憶關(guān)聯(lián)在了一起,才有了下次不去碰開水的決策。而百度大腦就是在模仿這些行為,做記憶關(guān)聯(lián)之后的決策、行動(dòng)、創(chuàng)造。

我之前關(guān)于開放云和數(shù)據(jù)工廠的分析完全是建立在搜索引擎之上,只是站在了百度對(duì)漢語(yǔ)能力的理解而已,而那時(shí)百度的人工智能也確實(shí)只是剛出生的嬰兒而已,只能在 PC 端爬行,但是當(dāng)智能手機(jī)誕生,可穿戴智能設(shè)備的出現(xiàn)后,百度開始成為可以走路的嬰兒,此時(shí)百度大腦的智力已是高達(dá)兩歲的嬰兒水平。

從搜索引擎智能到硬件智能,這是一個(gè)平面到立體,二維到三維的過程。原因是以前百度搜集到的數(shù)據(jù)只能夠是 PC 端用戶的搜索行為,這之中充其量只有文字內(nèi)容罷了,百度所能夠建立的僅僅只是語(yǔ)言理解,對(duì)用戶的輸入文字?jǐn)?shù)據(jù)做不斷的處理與反饋,但是到了手機(jī)端,智能硬件端則完全變天,百度可以收集到的不僅僅只會(huì)是語(yǔ)言數(shù)據(jù),更會(huì)收集到一整套的使用場(chǎng)景數(shù)據(jù)!

此時(shí),百度從為用戶提供搜索結(jié)果的搜索引擎開始轉(zhuǎn)變?yōu)橄蛴脩籼峁┤轿唤鉀Q方案的人工智能,想象力無(wú)窮。

那么,百度大腦將會(huì)如何模仿人類的感知,再到思考,以至于最后產(chǎn)生決策、生產(chǎn)、創(chuàng)造呢?

感知部分:

這里,我們還是先回看百度在 PC 時(shí)代的處理方式,百度通過海量的用戶輸入的相同信息,以及他們對(duì)網(wǎng)頁(yè)的排序進(jìn)行的點(diǎn)擊,加上自身算法的種種規(guī)則,進(jìn)而對(duì)搜索結(jié)果進(jìn)行排序,將最優(yōu)的結(jié)果前置于用戶面前。那么以此類推在移動(dòng)時(shí)代,百度能做的則是,通過海量的用戶的發(fā)起行為,然后根據(jù)他們最后的選擇行為,再根據(jù)用戶的周邊環(huán)境場(chǎng)景,建立起強(qiáng)大的數(shù)據(jù)關(guān)聯(lián),進(jìn)而再為其決策。

而這里的感知?jiǎng)t與 PC 時(shí)代完全不同,PC 時(shí)代感知的只是某個(gè)詞匯數(shù)據(jù),但是這里感知的有兩者:第一是用戶的交互數(shù)據(jù),用戶對(duì)機(jī)器做了什么,說了什么,輸入了什么圖片,人工智能會(huì)將這些行為轉(zhuǎn)化為機(jī)器能夠理解的特征向量等數(shù)據(jù)輸入進(jìn)機(jī)器。第二是物的數(shù)據(jù),場(chǎng)景數(shù)據(jù),比如用戶拍照中的場(chǎng)景,百度可以對(duì)其進(jìn)行智能識(shí)別,判斷其在哪里,是在餐館還是在旅游途中等等,并也將這些場(chǎng)景轉(zhuǎn)化為機(jī)器能夠讀懂的特征向量等數(shù)據(jù),讓二者進(jìn)行一些必要的關(guān)聯(lián)。

當(dāng)然這些收集行為和 PC 時(shí)代一樣都是匿名的,百度根本不在乎任何一個(gè)單用戶的信息,百度在乎的是群體的決策信息,并利用這些信息進(jìn)行判斷后再為個(gè)體用戶作決策推薦。

思考部分:

同樣是類比于百度在 PC 時(shí)代的思考方式,百度拿到用戶搜索的數(shù)據(jù),再拿到網(wǎng)站的數(shù)據(jù)后為語(yǔ)詞進(jìn)行了相關(guān)性關(guān)聯(lián),為其進(jìn)行了群體模糊解釋,那么毫無(wú)疑問,百度會(huì)為其感知到的信息再次進(jìn)行模糊解釋,將感知到的信息進(jìn)行與其他感知的關(guān)聯(lián)處理,并且還會(huì)將之前已經(jīng)在搜索引擎上積累的信息融合進(jìn)來(lái),進(jìn)而為人類整體行為做出解釋,并為個(gè)人想要選擇做某些事情的時(shí)候提供最優(yōu)方案。

就像嬰兒牙牙學(xué)語(yǔ)一樣,開始觀察周圍大人的說話與表情,并在自己的大腦中建立這一切的關(guān)聯(lián)性,開始嘗試學(xué)習(xí)大人說話的內(nèi)容,并說出來(lái)。

決策、生產(chǎn)、創(chuàng)造部分:

同樣是類比于百度在 PC 時(shí)代的思考方式,百度所做的決策就是幫用戶提供最優(yōu)的搜索結(jié)果,然后前置。那么也很好理解百度大腦在移動(dòng)設(shè)備時(shí)代會(huì)如何幫助用戶決策,百度會(huì)根據(jù)各個(gè)已經(jīng)在數(shù)據(jù)庫(kù)中已有的常規(guī)用戶行為場(chǎng)景,再為某個(gè)用戶提供具體的方案。

當(dāng)百度大腦的思考過程執(zhí)行完畢后,就完成了對(duì)某件事的動(dòng)態(tài)理解,而理解完后就要去為用戶產(chǎn)生最優(yōu)質(zhì)的結(jié)果,并再根據(jù)用戶的反饋進(jìn)行不斷調(diào)整。

就像嬰兒一樣,雖然還在牙牙學(xué)習(xí),但是已經(jīng)開始在用積木搭建自己的城堡了。

案例:

百度大腦最大價(jià)值在于幫助用戶利用大數(shù)據(jù)做好預(yù)測(cè)工作,例如用百度大腦來(lái)預(yù)測(cè)城市熱度,目前百度根據(jù)海量的用戶行為(感知)已經(jīng)可以預(yù)測(cè)出某個(gè)城市兩周后的旅游熱度(思考與創(chuàng)造),如果是景點(diǎn)的話可以預(yù)測(cè)兩天后的熱度。而這些預(yù)測(cè)也為用戶出行旅游提供了極大的參考價(jià)值。

結(jié)語(yǔ):

百度在 PC 時(shí)代有過很多成就,但在移動(dòng)智能設(shè)備上再次迎來(lái)全新的挑戰(zhàn),在 PC 時(shí)代百度只需要解讀語(yǔ)言就夠了,但是在移動(dòng)時(shí)代需要解讀的東西會(huì)更多,圖像識(shí)別,人臉識(shí)別,語(yǔ)音識(shí)別等等都是移動(dòng)時(shí)代需要重新再深耕的新技術(shù),并且用戶使用場(chǎng)景的復(fù)雜性要遠(yuǎn)遠(yuǎn)大于 PC 時(shí)代。但挑戰(zhàn)的同時(shí)也更藏著極大的機(jī)遇,這是一個(gè)從 PC 跨越到移動(dòng)時(shí)代的人工智能大機(jī)遇,物聯(lián)網(wǎng)的日趨成熟必將導(dǎo)致人工智能真正的實(shí)用時(shí)代的來(lái)臨,這也是百度終于可以從二維上升到三維的機(jī)會(huì),再加上百度已經(jīng)在 PC 時(shí)代的人工智能的成熟的積累,繼續(xù)進(jìn)化更像是理所當(dāng)然的事情。

來(lái)源:極客公園

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!