(1) 最初的大數據
大數據的特征可以用很多詞來描述。2001年Doug Laney最先提出“3V”模型, 包括數量 (Volume)、速度(Velocity)和種類(Variety)。在那以后,業界很多人把3V擴展到了11V,還包括有效性、真實性、價值和可見性等。
(2) 大數據:技術
為什么12年前的老術語突然被放在聚光燈下?這不僅是因為我們現在擁有比十年前更多的數量、速度和種類。而是因為大數據受到新技術的推動,特別是快速發展的開源技術,例如Hadoop和其他存儲和處理數據的NoSQL方式。
這些新技術的用戶需要一個術語來將它們區別于以前的技術,于是大數據成了他們的最佳選擇。如果你去參加大數據會議,你肯定會發現,涉及關系型數據庫的會議會很少,無論他們鼓吹多少個V。
(3)大數據與數據的區別
大數據技術的問題是,大數據有些含糊不清,以至于行業中的每個供應商都可以跳進來聲稱自己的技術是大數據技術。以下是兩種很好的方法來幫助企業理解現在的大數據與過去單純的大數據的區別。
交易、交互和觀察:這是由Hortonworks公司負責企業戰略的副總裁Shaun Connolly提出的。交易是我們過去收集、存儲和分析的主要數據。交互是人們點擊網頁等操作得到的數據。觀察是自動收集的數據。
過程介導數據、人類產生的信息以及機器生成的數據。
(4)大數據:信號
SAP公司的Steve Lucas認為,應該根據意圖和時機來劃分這個世界,而不是根據數據的類型?!芭f世界”主要是關于交易,當這些交易被記錄時,我們已經無法對它們采取任何行動:企業都在不斷管理“失效的數據”。而在“新世界”,企業可以使用新的“信號”數據來預測將會發生什么,并進行干預來改善情況。
相關的案例有,追蹤社交媒體上人們對品牌的態度,以及預測性維護(用復雜的算法幫助你決定何時需要更換零部件)。
(5) 大數據:機會
這是來自451 Research的Matt Aslett,他將大數據定位為“之前因為技術限制而被忽略的數據”。(雖然在技術上,Matt使用了“暗數據”,而不是大數據,但已經非常接近)。這是筆者最喜歡的定義,因為它符合大部分文章和討論中的說法。
(6) 大數據:隱喻
Rick Smolan在其書中寫道,大數據是“幫助這個星球生成神經系統的過程,其中我們人類只是另一種類型的傳感器”。很深奧吧?
(7) 大數據:新瓶裝舊酒
很多項目基本上是使用以前的技術,這些過去被稱為BI或者分析的技術突然跳入大數據的行列中。
底線:盡管大家對大數據的定義有很多爭議,但所有人都同意這個事實:大數據是一個大事件,在未來幾年將帶來巨大的機遇。
來源:cnw網界網。