透析大數(shù)據(jù)的泡沫、價(jià)值、應(yīng)用陷阱與展望
我們所生活的世界,就像一片混沌(chaos),大數(shù)據(jù)時(shí)代,我們周圍更是充斥著各種不同的理論、知識(shí)、信息和噪音,數(shù)據(jù)爆炸式增長(zhǎng)和科技高速發(fā)展所帶來的沖擊,加大了未來的不確定性。
大數(shù)據(jù)源起:對(duì)未來不確定性的恐懼
我們所生活的世界,就像一片混沌(chaos),大數(shù)據(jù)時(shí)代,我們周圍更是充斥著各種不同的理論、知識(shí)、信息和噪音,數(shù)據(jù)爆炸式增長(zhǎng)和科技高速發(fā)展所帶來的沖擊,加大了未來的不確定性。當(dāng)我們接收的數(shù)據(jù)和信息越多,面臨的選擇就越多,如若不善于過濾、挖掘和處理,對(duì)各種決策就可能會(huì)造成負(fù)面影響,當(dāng)然也會(huì)放大我們對(duì)未來不確定性的恐懼。小到個(gè)人命運(yùn)大到國(guó)家前途,都是在這樣一片混沌中煎熬著。
如何從混沌中發(fā)現(xiàn)規(guī)律,成為預(yù)測(cè)未來的“先知”,抑或是少出幾只黑天鵝?是歷代人類的夢(mèng)想,不管是古人的占卜、算命還是現(xiàn)在的專家系統(tǒng)、商業(yè)智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能、智慧地球、智慧城市等應(yīng)用,都源于我們對(duì)未來不確定性的恐懼。當(dāng)然還有應(yīng)對(duì)當(dāng)前管理走向的失控,軟件在加速吞噬世界,而大部分人類對(duì)其原理和特性卻知之甚少,就像華爾街的金融交易一樣,系統(tǒng)越復(fù)雜出現(xiàn)黑天鵝的概率就會(huì)增大;社交網(wǎng)絡(luò)的實(shí)時(shí)性打破了時(shí)空限制,信息的流動(dòng)速度和廣度讓也管理者越發(fā)難以掌控。隨著舍恩伯格教授《大數(shù)據(jù)時(shí)代》一書的面世,給我們帶來了“醍醐灌頂”式的認(rèn)知洗禮,難道抓住大數(shù)據(jù)這根救命稻草,我們就有機(jī)會(huì)做“先知”?從而也更有能力把自己和周遭世界管理得更好嗎?在一定程度上是這樣的,但我們也要知道,任何技術(shù)都是把雙刃劍。
舍恩伯格其實(shí)沒有機(jī)器學(xué)習(xí)背景,書上所說的某些內(nèi)容也是有爭(zhēng)議的,不過在教育民眾和政府官員科普方面,還是具有重要意義,至少讓大家知道了什么是大數(shù)據(jù),也能在一定程度上促使我們思考大數(shù)據(jù)的價(jià)值和潛力,從而提升大數(shù)據(jù)應(yīng)用水平以應(yīng)對(duì)管理失控和黑天鵝等問題。
大數(shù)據(jù)泡沫:泡沫是必然但有其深遠(yuǎn)意義
數(shù)據(jù)科學(xué)其實(shí)已經(jīng)興起多年,從早年的專家系統(tǒng)、數(shù)據(jù)挖掘到前些年的商業(yè)智能,不少大型企業(yè)和機(jī)構(gòu)在管理大數(shù)據(jù)方面積累了豐富的經(jīng)驗(yàn),筆者10年前就曾參與過運(yùn)營(yíng)商的數(shù)據(jù)挖掘系統(tǒng)建設(shè),那都是實(shí)實(shí)在在的大數(shù)據(jù),只不過當(dāng)時(shí)技術(shù)手段有限罷了,所以很少人能挖出什么高價(jià)值的東西,更談不上智能化決策了。但這些年的技術(shù)積累和數(shù)據(jù)積累,卻是極大地促進(jìn)了大數(shù)據(jù)領(lǐng)域的發(fā)展,不然也沒有那么多人認(rèn)同舍恩伯格教授書中的觀點(diǎn)。
甲骨文公司CEO埃里森曾說過,高科技是唯一能媲美好萊塢的產(chǎn)業(yè),說明高科技領(lǐng)域的技術(shù)明星也是變換極快的。技術(shù)和產(chǎn)品一樣,有其發(fā)展周期規(guī)律,大數(shù)據(jù)也只是一種技術(shù)手段,最終目的還是要解決現(xiàn)實(shí)問題,不管是科研、商業(yè)還是政府管理問題。關(guān)注大數(shù)據(jù)的人多了,自然就有泡沫,個(gè)人認(rèn)為泡沫主要體現(xiàn)在如下幾個(gè)方面:
- 這幾年社會(huì)上關(guān)于大數(shù)據(jù)的宣傳,媒體人的引進(jìn)和炒作,有部分內(nèi)容是在誤導(dǎo)大家,主要原因還是很多人在盲人摸象,少有系統(tǒng)的研究和理解。
- 只知其然不知其所以然,導(dǎo)致對(duì)大數(shù)據(jù)應(yīng)用的期望太高,大數(shù)據(jù)技術(shù)不是萬金油,在新的技術(shù)泛型和技術(shù)生態(tài)下,現(xiàn)階段技術(shù)的穩(wěn)定性、成熟性和有效性還待進(jìn)一步發(fā)展。
- 關(guān)注重點(diǎn)有問題,導(dǎo)致目前的很多大數(shù)據(jù)應(yīng)用并未涉及到核心業(yè)務(wù)和計(jì)算模型,多是數(shù)據(jù)的采集和存儲(chǔ)管理,這也是造成行業(yè)整體門檻還不夠高,同質(zhì)化競(jìng)爭(zhēng)激烈,沒有發(fā)揮出應(yīng)有價(jià)值的原因。大數(shù)據(jù)泡沫顯然是客觀存在的,但其長(zhǎng)期的應(yīng)用價(jià)值卻不容小覷,泡沫不代表沒有價(jià)值,就像2000年的互聯(lián)網(wǎng)泡沫,泡沫破滅之后的涅磐,讓人類真正跨入了互聯(lián)網(wǎng)時(shí)代。大數(shù)據(jù)泡沫的價(jià)值就是讓全民認(rèn)識(shí)到大數(shù)據(jù)時(shí)代數(shù)據(jù)分析和數(shù)據(jù)決策的重要性,這波泡沫過去,也許我們能正式跨入人工智能時(shí)代。
大數(shù)據(jù)價(jià)值:需要你自己去定義
大數(shù)據(jù)絕不只是數(shù)據(jù)大,不能光看字面意思??梢哉f大數(shù)據(jù)是一套技術(shù)體系,可以說是一種認(rèn)知挖掘過程,也可以說是一種方法論和管理決策思維。
我們要搞懂大數(shù)據(jù)的價(jià)值,首先繞不開數(shù)據(jù)挖掘(或更窄的機(jī)器學(xué)習(xí)、或更廣義的人工智能技術(shù))。數(shù)據(jù)挖掘(Data Mining),又稱為資料探勘、數(shù)據(jù)采礦,或數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(Knowledge-Discovery in Databases,KDD)。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過各種算法挖掘隱藏于其中的規(guī)律和有價(jià)值信息的過程,通常通過統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)、專家系統(tǒng)、模式識(shí)別和在線分析處理等諸多方法來實(shí)現(xiàn)上述目標(biāo)。
現(xiàn)階段大數(shù)據(jù)領(lǐng)域注重?cái)?shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、基礎(chǔ)計(jì)算和可視化等層面,唯獨(dú)對(duì)數(shù)據(jù)挖掘建模和決策支持這兩個(gè)硬骨頭沒有展開深入研究和對(duì)接,這是大數(shù)據(jù)難以落地的根本原因。我們大多數(shù)人決策其實(shí)是靠感覺、個(gè)人經(jīng)驗(yàn)或別人建議,少部分人會(huì)親自對(duì)報(bào)表等小數(shù)據(jù)進(jìn)行客觀數(shù)據(jù)分析。
而大數(shù)據(jù)為我們提供了一種更加可靠的決策支持,畢竟數(shù)據(jù)不會(huì)說假話。大數(shù)據(jù)本身不產(chǎn)生價(jià)值,大數(shù)據(jù)的根本用途是利用大數(shù)據(jù)挖掘分析對(duì)我們的決策提供規(guī)律、知識(shí)和經(jīng)驗(yàn)等科學(xué)依據(jù),客觀上減少面對(duì)未來決策的不確定性。所以,以業(yè)務(wù)決策支持為分析目標(biāo),大數(shù)據(jù)不靠大,小數(shù)據(jù)也一樣有大價(jià)值。為什么大數(shù)據(jù)的價(jià)值需要我們自己去定義呢?因?yàn)閷?duì)于未來、對(duì)于未知領(lǐng)域,我們每個(gè)人或組織面臨的不確定性問題是不一樣的,有的偏個(gè)體(如疾病診斷,犯罪預(yù)測(cè)),有的偏大眾(如廣告營(yíng)銷、客戶細(xì)分),有的偏微觀(如基因序列,個(gè)性化教育),有的偏宏觀(環(huán)境監(jiān)測(cè)、天文數(shù)據(jù)處理),有的關(guān)注資源優(yōu)化配置(如供需匹配,出行服務(wù)),有的關(guān)注宏觀決策(如政府資產(chǎn)分析、綜合管控)…可以說大數(shù)據(jù)分析需求無處不在,而又大不相同。這就需要從自身實(shí)際需求和數(shù)據(jù)、技術(shù)現(xiàn)狀出發(fā),自行設(shè)定大數(shù)據(jù)分析的價(jià)值和應(yīng)用目標(biāo),生搬硬套互聯(lián)網(wǎng)公司那套做法,不可取。
大數(shù)據(jù)陷阱:應(yīng)用前先問自己幾個(gè)問題
綜上所述,大數(shù)據(jù)無疑是好東西,很多組織機(jī)構(gòu)也正在規(guī)劃或建設(shè)大數(shù)據(jù)平臺(tái),很多創(chuàng)業(yè)玩家也正在計(jì)劃或進(jìn)行大數(shù)據(jù)領(lǐng)域的技術(shù)服務(wù)或產(chǎn)品研發(fā)。但大數(shù)據(jù)領(lǐng)域面臨的陷阱也是不少,光看大數(shù)據(jù)、云計(jì)算、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、人工智能、深度學(xué)習(xí)、分布式計(jì)算等目不暇接的技術(shù)和概念,就夠眼花繚亂了,要真正理解各種技術(shù)的原理及相互聯(lián)系就更難,如何才能不畏浮云遮望眼,走出一條扎實(shí)的大數(shù)據(jù)應(yīng)用落地之路。我以個(gè)人粗淺的理解提幾個(gè)問題供大家參考:
(1)第一問:我屬于什么級(jí)別的玩家?
大數(shù)據(jù)的核心優(yōu)勢(shì)在于規(guī)模效應(yīng),你的業(yè)務(wù)量越大、業(yè)務(wù)覆蓋性越廣、數(shù)據(jù)量越大,大數(shù)據(jù)投入的成本就越容易被攤薄,而長(zhǎng)遠(yuǎn)獲取的大數(shù)據(jù)應(yīng)用價(jià)值就越巨大。所以,我一直認(rèn)為政府才是最適合大數(shù)據(jù)應(yīng)用的超級(jí)玩家,這也是為什么大數(shù)據(jù)獨(dú)角獸企業(yè)Palantir的產(chǎn)品只有政府定制版(FBI,CIA專用)和金融定制版(華爾街金融巨頭專用)的原因!一般企業(yè)或個(gè)人根本玩不起大數(shù)據(jù),小的個(gè)體只能像《黑客帝國(guó)》的孵化人為Matirx系統(tǒng)提供生物電池一樣,為超級(jí)玩家貢獻(xiàn)數(shù)據(jù)和技術(shù)還差不多。所以做大數(shù)據(jù)之前,先問問自己,我屬于什么級(jí)別的玩家。我有特定領(lǐng)域的海量數(shù)據(jù)嗎?有數(shù)據(jù)科學(xué)能力相關(guān)的核心技術(shù)(應(yīng)用建模)嗎?有機(jī)會(huì)成為BAT嗎?或者降一級(jí)有機(jī)會(huì)成為Uber、滴滴、摩拜嗎?研發(fā)的產(chǎn)品能否等到大規(guī)模應(yīng)用之時(shí)?提供的技術(shù)是否符合客戶的業(yè)務(wù)需求?因?yàn)橐话銇碇v,大數(shù)據(jù)的初始投入成本是很高的,自我定位很關(guān)鍵。當(dāng)然成不了甲方還是可以做乙方,成不了BAT還是有機(jī)會(huì)被BAT收購的,另外采用敏捷大數(shù)據(jù)方法論,也有低成本的玩法。
(2)第二問:我是搞技術(shù)驅(qū)動(dòng)、業(yè)務(wù)驅(qū)動(dòng)還是數(shù)據(jù)驅(qū)動(dòng)?
當(dāng)前不少公司的大數(shù)據(jù)產(chǎn)品和服務(wù)不接地氣,從開始規(guī)劃上就有一定問題。很多公司都號(hào)稱自己有云計(jì)算和大數(shù)據(jù)方面的產(chǎn)品和服務(wù),覆蓋面從Hadoop、Spark、MPP、NOSQL、OpenStack等,到公有云、私有云、商業(yè)智能、人工智能、深度學(xué)習(xí)等等方面,偌大一片浮云,客觀上促進(jìn)了大數(shù)據(jù)領(lǐng)域的技術(shù)高速發(fā)展,可惜最終少有幾家能活到賺錢。首先,大數(shù)據(jù)領(lǐng)域,沒有幾把刷子是很難玩技術(shù)驅(qū)動(dòng)的,像Hadoop,Spark這些基礎(chǔ)框架,AlphaGo系統(tǒng)、Nvidia的核心產(chǎn)品等,后面都有一幫名校博士、教授等技術(shù)大牛的身影在支持;其次,業(yè)務(wù)驅(qū)動(dòng)最靠譜,但要有足夠的創(chuàng)新和資本支持,最近幾年出現(xiàn)的Uber、滴滴、摩拜、Airbnb、23andMe、貨車幫等創(chuàng)新公司,就是典型的業(yè)務(wù)驅(qū)動(dòng)型大數(shù)據(jù)企業(yè),對(duì)傳統(tǒng)社會(huì)和商業(yè)的沖擊也是顛覆性的,如果能有極好的創(chuàng)意和資本支持,走這條路發(fā)展?jié)摿薮?;而政府和大型壟斷?guó)企擁有真正的大數(shù)據(jù)金礦,有數(shù)據(jù)+業(yè)務(wù)驅(qū)動(dòng)的條件,但由于自身管理體制原因或引入的技術(shù)實(shí)力太弱,大數(shù)據(jù)的價(jià)值遠(yuǎn)遠(yuǎn)沒有被挖掘出來,當(dāng)然這也是大機(jī)會(huì),我們的國(guó)安部門也需要中國(guó)版的Palantir。所以大數(shù)據(jù)應(yīng)用要接地氣,結(jié)合自身實(shí)力,問問自己搞技術(shù)驅(qū)動(dòng)、業(yè)務(wù)驅(qū)動(dòng)還是數(shù)據(jù)驅(qū)動(dòng),是最需要回答的問題。
(3)第三問:我是否清楚大數(shù)據(jù)應(yīng)用的局限?
現(xiàn)階段,大數(shù)據(jù)應(yīng)用面臨諸多挑戰(zhàn),新技術(shù)泛型下標(biāo)準(zhǔn)的大數(shù)據(jù)應(yīng)用體系尚未建立,技術(shù)復(fù)雜度和風(fēng)險(xiǎn)較高,成功案例和最佳實(shí)踐缺乏。很多企業(yè)和機(jī)構(gòu)都知道大數(shù)據(jù)潛力巨大,但卻不知如何著手,更不清楚大數(shù)據(jù)應(yīng)用有哪些局限和潛在的問題。伯克利的Jordan教授是機(jī)器學(xué)習(xí)領(lǐng)域大牛,他提出了一個(gè)很好的比喻:如果大數(shù)據(jù)給出的結(jié)果可靠性低,沒有經(jīng)過充分的驗(yàn)證,就急于應(yīng)用到實(shí)際業(yè)務(wù)中,會(huì)面臨很大的風(fēng)險(xiǎn),就好比是土木工程都沒學(xué)好就開始造橋,結(jié)果只能造出“豆腐渣工程”。所以我們要充分了解大數(shù)據(jù)技術(shù)的局限性,數(shù)據(jù)采集的不全面必然導(dǎo)致數(shù)據(jù)偏見,數(shù)據(jù)質(zhì)量的問題會(huì)導(dǎo)致Garbage In Garbage Out,我們對(duì)分析結(jié)果的不理解,或者不進(jìn)行持續(xù)反饋驗(yàn)證升級(jí),就無法確認(rèn)模型的準(zhǔn)確性和穩(wěn)定性,另外《大數(shù)據(jù)時(shí)代》一書中所說的關(guān)注相關(guān)性不重視因果分析,也會(huì)導(dǎo)致一系列問題。
數(shù)據(jù)科學(xué)發(fā)展到現(xiàn)階段,從某種程度上講還不是一個(gè)足夠嚴(yán)謹(jǐn)?shù)膶W(xué)科,我們有一定的概率做出準(zhǔn)確的預(yù)測(cè),但是使用不當(dāng)或預(yù)測(cè)不準(zhǔn),又會(huì)造成不好的后果。顯然Jordan教授很擔(dān)心現(xiàn)在公眾對(duì)大數(shù)據(jù)技術(shù)的熱情,并不是基于對(duì)這個(gè)領(lǐng)域的深入理解,但是他堅(jiān)信大數(shù)據(jù)領(lǐng)域未來會(huì)誕生很多重要的應(yīng)用,就像AlphaGo系統(tǒng)花一晚時(shí)間,自我學(xué)習(xí)幾百萬盤棋才戰(zhàn)勝李世石,對(duì)于新興技術(shù),我們不能高估它但更不能低估。鑒于此,我們需要對(duì)大數(shù)據(jù)的數(shù)據(jù)質(zhì)量及技術(shù)偏差等做更細(xì)致的考察和評(píng)估,搞清楚大數(shù)據(jù)應(yīng)用技術(shù)所面臨的限制及問題,才能走得更穩(wěn)更遠(yuǎn)。
(4)第四問:我是否準(zhǔn)備好打一場(chǎng)大數(shù)據(jù)應(yīng)用持久戰(zhàn)?
我在《大數(shù)據(jù)應(yīng)用從小做起?談微服務(wù)和大數(shù)據(jù)架構(gòu)》一文中有提到過,大數(shù)據(jù)項(xiàng)目如何頂天立地:立地就是要落實(shí)到一個(gè)個(gè)要解決的具體問題,基于業(yè)務(wù)和數(shù)據(jù)驅(qū)動(dòng);頂天就是要規(guī)劃得目標(biāo)長(zhǎng)遠(yuǎn),大數(shù)據(jù)系統(tǒng)不是搞一錘子買賣,沒有一勞永逸的做法。特別是大型企業(yè)、機(jī)構(gòu)或政府的大數(shù)據(jù)系統(tǒng),一定不能是傳統(tǒng)MIS系統(tǒng)的做法,大數(shù)據(jù)是個(gè)動(dòng)態(tài)增量系統(tǒng),數(shù)據(jù)規(guī)模在變,業(yè)務(wù)在變,模型在變,參數(shù)在變,核心技術(shù)模型的迭代、優(yōu)化、持續(xù)升級(jí)及交付將是常態(tài),長(zhǎng)期目標(biāo)應(yīng)該是智能化的綜合管控,從企業(yè)的生產(chǎn)、產(chǎn)品、銷售、服務(wù)各個(gè)環(huán)節(jié)的一體化智能管控中心,政府各部門聯(lián)席的智能服務(wù)和決策中心,好比Google Brain, Baidu Brain,大型企事業(yè)單位和政府也需要未來的數(shù)字決策大腦。從某種程度上講,大數(shù)據(jù)的關(guān)鍵不在于具體項(xiàng)目,而在于數(shù)據(jù)決策中心的持續(xù)優(yōu)化與運(yùn)營(yíng),大數(shù)據(jù)系統(tǒng)建設(shè)要作為一個(gè)長(zhǎng)遠(yuǎn)的事業(yè)來做,讓每個(gè)成員都融入大數(shù)據(jù)管理思維變革過程中。我在之前的文章中提出了“快、小、證”大數(shù)據(jù)應(yīng)用原則,對(duì)一個(gè)具體的大數(shù)據(jù)項(xiàng)目來講,能做到快速出原型,小分析點(diǎn)切入,證明有效之后再擴(kuò)張的原則,就不用懼怕失敗,失敗后切換到下一個(gè)分析目標(biāo)即可。由于大數(shù)據(jù)項(xiàng)目前期的實(shí)際投入成本遠(yuǎn)遠(yuǎn)大于收益,這就更需要精耕細(xì)作,打一場(chǎng)大數(shù)據(jù)應(yīng)用持久戰(zhàn),可以從小處著手,逐步構(gòu)建統(tǒng)觀全局的分析鏈,從而建立組織未來的大數(shù)據(jù)中心和基于大數(shù)據(jù)分析的輔助決策大腦。
(5)第五問:我是否了解大數(shù)據(jù)風(fēng)險(xiǎn)與數(shù)據(jù)偏見?
大數(shù)據(jù)時(shí)代,信息意味著權(quán)利,不同層級(jí)的信息代表不同層次的權(quán)利。這使得大數(shù)據(jù)集中之后也面臨著技術(shù)風(fēng)險(xiǎn)、成本風(fēng)險(xiǎn)、安全風(fēng)險(xiǎn)和管理風(fēng)險(xiǎn)等多個(gè)層面的問題,每個(gè)層級(jí)玩家面臨的風(fēng)險(xiǎn)各有側(cè)重,需要充分引起重視。大數(shù)據(jù)處理基于全新的技術(shù)泛型,新技術(shù)生態(tài)下技術(shù)本身的穩(wěn)定性、成熟性、擴(kuò)展性等有風(fēng)險(xiǎn);隨著數(shù)據(jù)爆炸增長(zhǎng)需要存儲(chǔ)、計(jì)算包括電力等資源的持續(xù)投入,面臨成本風(fēng)險(xiǎn)(所以才有云計(jì)算的需求);面對(duì)大數(shù)據(jù)信息權(quán)的誘惑,黑客們的犯罪動(dòng)機(jī)也比以往任何時(shí)候更強(qiáng)烈,黑客組織性更強(qiáng),更加專業(yè),敏感數(shù)據(jù)入侵風(fēng)險(xiǎn)急劇增加;在數(shù)據(jù)管理方面還需要面對(duì)數(shù)據(jù)缺失(大數(shù)據(jù)的分析在于全量分析,任何一方面的數(shù)據(jù)缺失,都會(huì)讓算法產(chǎn)生偏見)、數(shù)據(jù)質(zhì)量低下、被操控的假數(shù)據(jù)(如水軍刷榜)等方面的問題。
(6)第六問:我是否理解并能貫徹大數(shù)據(jù)思維?
大數(shù)據(jù)時(shí)代,數(shù)據(jù)驅(qū)動(dòng)決策是我們的必然選擇,畢竟事實(shí)勝于雄辯,數(shù)據(jù)能最大限度地說明問題,數(shù)據(jù)能讓你了解一些以前根本都不知道的事情,除了本身質(zhì)量的問題,數(shù)據(jù)不會(huì)說謊,通過大數(shù)據(jù)挖掘進(jìn)行量化分析有助于精細(xì)化管理和運(yùn)營(yíng),這是大數(shù)據(jù)思維的核心所在。不管是企業(yè)、機(jī)構(gòu)還是政府,在做大數(shù)據(jù)規(guī)劃或應(yīng)用之前,先問問自己,組織人員理解數(shù)據(jù)決策嗎?大數(shù)據(jù)能為他們帶來怎樣的好處?各級(jí)領(lǐng)導(dǎo)有沒有大數(shù)據(jù)決策基因或者這種思維變革的驅(qū)動(dòng)力?所以從數(shù)據(jù)決策角度講,未來大數(shù)據(jù)思維在各行各業(yè)的滲透和如火如荼的大數(shù)據(jù)系統(tǒng)建設(shè)不亞于一場(chǎng)數(shù)據(jù)爆炸時(shí)代的管理變革“啟蒙運(yùn)動(dòng)”。這場(chǎng)運(yùn)動(dòng)由互聯(lián)網(wǎng)企業(yè)發(fā)起并逐漸繁榮,當(dāng)大數(shù)據(jù)思維在傳統(tǒng)企業(yè)、機(jī)構(gòu)和政府普及并落地應(yīng)用之時(shí),很可能就是通用人工智能時(shí)代的開始。
大數(shù)據(jù)展望:當(dāng)大數(shù)據(jù)傍上人工智能。
最后,做一點(diǎn)展望,談?wù)劥髷?shù)據(jù)和人工智能,在之前的文章中,我提到過大數(shù)據(jù)和人工智能的共生關(guān)系,對(duì)連接主義學(xué)派來講,沒有大數(shù)據(jù)就沒有智能,同樣,沒有人工智能的算法支持,特別是深度學(xué)習(xí)這一波技術(shù)熱潮的推動(dòng),大數(shù)據(jù)的價(jià)值也很難被發(fā)掘出來。所以大數(shù)據(jù)傍上人工智能是IT技術(shù)發(fā)展的必然。另外大數(shù)據(jù)與傳統(tǒng)商業(yè)智能技術(shù)在加速融合,如OLAP多維度分析、數(shù)據(jù)倉庫等技術(shù)也在向大數(shù)據(jù)處理靠攏。大數(shù)據(jù)的核心價(jià)值在于全量數(shù)據(jù)分析,而全量數(shù)據(jù)意味著智能誕生的基礎(chǔ),初級(jí)智能誕生之后會(huì)給系統(tǒng)以反哺和回饋數(shù)據(jù),就像AlphaGo的強(qiáng)化學(xué)習(xí)和自我對(duì)抗學(xué)習(xí)一樣(嬰幼兒自己游戲玩耍同理),通過這種自我學(xué)習(xí)迭代過程,強(qiáng)人工智能誕生,人類正式跨入AI時(shí)代。那個(gè)時(shí)候的若干企業(yè)大數(shù)據(jù)中心、政府大數(shù)據(jù)中心和地球上的數(shù)朵大云,將會(huì)插上智能科學(xué)的翅膀,成為AI時(shí)代的關(guān)鍵基礎(chǔ)設(shè)施,到時(shí)大數(shù)據(jù)技術(shù)如何演化,國(guó)家又會(huì)呈現(xiàn)出怎樣的社會(huì)形態(tài),讓我們拭目以待。
作者:杜圣東,ZMTech CEO
來源:http://www.36dsj.com/archives/77989
本文來源于人人都是產(chǎn)品經(jīng)理合作媒體@36大數(shù)據(jù),作者@杜圣東
反著看,也很重要。
a