什么是大數據?大數據能做什么?

6 評論 25343 瀏覽 124 收藏 12 分鐘

本篇文章主要為我們介紹了大數據的概念、發展以及相關應用。

“Big Data is like teenage sex:Everyone talks about it,nobody really knows how to do it,everyone thinks everyone else is doing it,so everyone claims they are doing it too.”

2013年被稱為大數據元年,各行各業都逐漸開啟大數據應用時代。直至現在,大數據依然為人所津津樂道。

何為大數據?

1PB夠大嗎?

如果你沒有直觀印象,可以聯想一下你的電腦硬盤容量,標配是500G-1TB,大部分人用了一兩年,可能這部分容量都沒用完。而1PB=1024TB=1048576GB。

在實際中,一個小有名氣的游戲一天的數據量就在數十TB左右,甚至更多。

如果你以為PB單位已經是最大了?那就大錯特錯了?。。?!

在PB之上,還有EB(Exabyte 百億億字節 艾字節),ZB(Zettabyte 十萬億億字節 澤字節),YB(Yottabyte 一億億億字節 堯字節),而這些單位也只是為了方便統計海量數據所給出的當前單位,在未來還可能出現更大的單位。

因特爾公司首席執行官Brian Krzanich表示,2020年互聯網用戶每天將產生1.5GB的數據。

HIS數據預測,到2025年,全球互聯網(IoT)連接設備的總安裝量預計將達到754.4億,這部分設備每天產生的數據量可想而知。

按照前面的數據關系,得出1ZB大概是1.1萬億GB,等同于全世界沙子數量總和。

從上圖中不難看出,互聯網數據每年都在爆炸式增長。當然,大數據并不只是數據量大而已,它還有其他更深的含義。

對于大數據,麥肯錫全球研究所給出的定義是:

”一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合?!?/p>

大數據具有五大特點,稱為5V。

1. 多樣(Variety)

大數據的多樣性是指數據的種類和來源是多樣化的,數據可以是結構化的、半結構化的以及非結構化的,數據的呈現形式包括但不僅限于文本,圖像,視頻,HTML頁面等等。

2. 大量(Volume)

大數據的大量性是指數據量的大小,這個就是上面筆者介紹的內容,不再贅述。

3. 高速(Velocity)

大數據的高速性是指數據增長快速,處理快速,每一天,各行各業的數據都在呈現指數性爆炸增長。在許多場景下,數據都具有時效性,如搜索引擎要在幾秒中內呈現出用戶所需數據。企業或系統在面對快速增長的海量數據時,必須要高速處理,快速響應。

4. 低價值密度(Value)

大數據的低價值密度性是指在海量的數據源中,真正有價值的數據少之又少,許多數據可能是錯誤的,是不完整的,是無法利用的??傮w而言,有價值的數據占據數據總量的密度極低,提煉數據好比浪里淘沙。

5. 真實性(Veracity)

大數據的真實性是指數據的準確度和可信賴度,代表數據的質量。

數據一直都在,變革的是方式

大數據的意義不僅僅在于生產和掌握龐大的數據信息,更重要的是對有價值的數據進行專業化處理。

人類從來不缺數據,缺的是對數據進行深度價值挖掘與利用??梢哉f,從人類社會有了文字以來,數據就開始存在了,現在亦是如此。這其中唯一改變的是數據從產生,到記錄,再到使用這整個流程的形式。

1. 數據生產

在人類社會的早期,民以食為天,數據的產生大多與商品,食物,土地等掛鉤。舊石器時代的部落人民在樹枝或骨頭上刻下凹痕來記錄日常的交易活動或物品供應。

為了衡量商品長度,中國人發明了尺、里、寸、丈、步、仞等長度單位;為了衡量重量,發明了升、斗,斛等重量單位。

在互聯網時代,數據的生產變得更為容易。美國互聯網數據中心曾指出,互聯網上的數據每年都將增長50%,每兩年便將翻一倍,而目前世界上90%以上的數據是最近幾年才產生的。

每人每天都會產生海量數據,如視頻數據,電商數據,社交數據等等。

全球每60秒產生的數據

2. 數據記錄

千年之前,人們用龜甲石鼓、簡牘絹帛到造紙術成熟后的刻本等一切觸手可及的器物來作為數據的載體。

千年之后,人們用圖書,報紙,硬盤,光盤,存儲器等各種更為靈活,簡便的方式記錄數據。

3. 數據利用

古人利用利用甲骨文占卜判斷兇吉,利用占星術預測朝代興衰;利用螞蟻搬家,燕子低飛,蚯蚓出洞來預測天氣。

互聯網時代,企業或產品利用電商數據為用戶推薦商品,利用社交數據做廣告營銷等等。

在大數據概念興起之前,大部分企業并沒有注意到數據的寶貴價值,只是在純粹的生產和記錄數據。更有甚者視海量數據為累贅,因為數據的存儲與管理需要耗費企業大量的成本,極少有企業能把數據作為一種資源,嗅到大數據背后的價值,從而加以利用。就算到現在,數據資源的整合利用能力依然是考驗每個企業的一大難點。

大數據應用

大數據作為一個能夠改變產業應用的技術,只有切實落地才能帶來真正的價值。

其實大數據的應用范圍非常廣,不單單限于互聯網行業,在其他諸如金融,制造業,交通物流方面也都有非常大的應用價值。

1. 大數據讓借貸款更加放心

在金融行業中,以借貸款為例。在貸款前,貸款借出方會先利用大數據對借款人進行貸前審核,以此來保障貸后的還款率。

借出方從各個渠道合法收集借款人的標簽信息,如學歷,職業,薪資狀況,歷史借還款情況等(據說一個用戶的標簽維度可以達到7000個)。海量數據被放入反欺詐模型,還款能力模型,身份驗證模型等數個中做訓練,最終得出是否通過本次貸款申請,貸款的額度,貸款人的還款意愿等評估信息。

借款人數據收集的越多,標簽維度越細,數據越真實,則審核效果越全面。

2. 大數據讓廣告營銷更高效

廣告作為互聯網行業最常見的變現手段之一,大數據賦能廣告營銷,讓廣告從惹人惱轉變為廣告即內容,廣告即服務。

曾幾何時,你會發現日常生活中看到的廣告居然那么懂你。點開淘寶,你最愛的商品被推薦在Banner首頁;打開微信朋友圈,映入眼簾的是你正想要做的汽車保養;打開百度搜索,你前兩天看的別墅信息赫然出現。

這一切的實現都得益于大數據賦能廣告。

在廣告投放前期,通過大數據手段大量的整合、分析數據,包括用戶的瀏覽習慣、消費行為、瀏覽記錄、對廣告的點擊數量等,并從中挖掘出有效的信息;構建全面的用戶畫像,結合廣告業務,精準定位目標用戶,保證廣告定向投放。

大數據構建用戶畫像

在廣告投放的中后期,通過實時數據反饋,結合用戶所處地域,時間的變化,動態優化廣告素材,調整廣告的呈現方式與廣告的展覽位置,讓同一個用戶在不同的場景下享受不一樣的廣告服務,實現一人千面,增加廣告營銷效果,提升廣告主KPI。

3. 大數據賦能零售

新零售時代,客戶的需求無時無刻不在變化,大數據賦能零售,讓零售在人,貨,場上進行變革。

零售商可以借助大數據對未來市場需求進行預測,搶先一步對庫存進行管理。在流量高發的前期,及時補足庫存,提升商品供應率;在流量散去的前期,及時去庫存,避免庫存積壓。

借助大數據分析用戶地域分布情況,商店流量,消費者習慣等那個,在合適的地區開設商店,建造倉庫。在物流發貨時,從數據出發,合理規劃運輸路勁,降低運輸成本。

利用數據還可以統一上下游供應鏈交互,解決數據不對成問題,減小牛鞭效應,提升供應鏈中每個環節的利用效率。

總結

數據一直都在,大數據變革的只是方式。大數據并不神秘,神秘的是對未知數據的探索與利用。

 

本文由 @pm_SWolf 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 您好,我是寶塔數據市場部的,想問一下您這邊篇文章,可不可以在我們的公眾號里轉載(我們會注明轉載出處)?

    來自上海 回復
  2. 回復
    1. ??

      來自浙江 回復
  3. 好的,朕知道了??

    回復
  4. 感謝分享!

    回復
    1. 謝謝,共同學習!

      回復