談一談數據的時空觀
編輯導語:數據的時空觀是我們認識數據價值的一種新角度,它研究的是數據在時間和空間兩個維度上的價值規律與作用機制,那么該如何理解數據的時空觀?本文作者基于數據的時空觀問題展開了分析,看看如何才能從時空觀中看出數據的取舍之道。
之前談過數據的價值觀,今天想談一談數據的時空觀。
說到時空觀,好像也是大數據領域比較忌諱的。因為一說到時空觀就要扯到相對論了,在大數據領域來聊相對論的話題,大部分專家是不敢搬起石頭砸自己的腳的。
沒關系,反正筆者是大數據領域的一個小角色,胡說八道的聊幾句,也不會掉自己的身價。
所以,今天筆者就打腫臉充胖子,在這里說說自己對數據時空觀的理解。
一、什么是數據的時空觀
開門見山,先說說什么是數據的時空觀。
筆者認為:數據的時空觀是關于數據在時間和空間兩個維度上的價值規律與作用機制的基本看法與認知。這里提到的數據是一種寬泛的說法——既包括傳統的結構化數據,也包括音視頻、文本等非結構化與半結構化數據。
由以上定義可知,數據的時空觀要研究的是數據在時間序列和空間位置上價值變化規律。
時間和空間本身就是人類認知世界經常分析的兩個維度:時間和空間一方面可以對應到數據的縱向深度和橫向廣度,另一方面還可理解為數據在三維立體世界中的生命力,數據的時空價值本身就是數據生命力的體現。
二、如何理解數據的時空觀
1. 數據的時間觀:數據是有溫度的
時間賦予數據以溫度。
絕大部分數據是有時間上的延續性的,隨著時間的推移,數據的溫度或熱度也隨著變化。越是久遠的數據,其“體溫”就越低,而此時此刻的數據則是鮮活的,新鮮出爐的數據就有較高的溫度。
企業根據數據的溫度差異,可以對不同溫度的數據進行差異化處理。
比如:在用戶畫像領域,可以將用戶的數據分為冷數據、溫數據和熱數據三種類型。
- 冷數據:一般指三個月前的數據,這些數據通常比較穩定,長期以來不怎么變化,例如:年齡、性別、常住地、職業等;
- 溫數據:指近三個月內的數據,是半冷不熱的數據,比如:近一個月下載過哪些APP、玩過哪些游戲等等,這些都是具有一定時效性的數據;
- 熱數據:指實時的數據,即此時此刻用戶在做些什么,這些數據都有極高的時效性,把握這些熱數據所產生的商機往往能考驗企業與個人的靈敏度和實時營銷能力。比如:對于滴滴司機來說,搶到更多的實時訂單就意味著空載率越低,其在單位時間內的運營效率就越高,實時訂單就是熱數據,司機獲得高價值的熱數據越多,也就能賺到更多的錢。
商業領域,數據價值一般隨著時間的流逝在衰減。
艾賓浩斯遺忘曲線告訴我們,遺忘是人類的天性,時間越久遠的事物,人類大腦能記住的就越少。
而在商業領域,隨著人類采集和存儲數據的技術日益成熟,數據存儲成本的快速降低,需要人類大腦記住的數據反倒越來越少了,數據的記憶工作大部分都交給了電腦、云盤、服務器等工具。
隨著時間的推移,數據量在增加,數據存儲成本也在增加。
但是,從數據價值的時效性來看,越是新鮮的數據其價值一般會越高,而同樣的數據如果是半年前的,那么其價值就會大打折扣。伴隨著時間的流逝,數據的價值一般呈衰減態勢。
在某些特定領域,時間能為數據主體帶來增值。并非在所有的領域,時間都會讓數據及其主體的價值產生衰減效應。
比如:一些古董或考古文物,對于此類物品有濃厚興趣的玩家,其年代越久遠,物品的價值就越高。
數據此時雖說只是一種記錄或者證明,但是數據珍藏的時間越長久,承載數據的主體其稀缺度就越高,在市場上的估價就越高。
再比如:在很多懸疑偵破類電視劇中,很多歷史上的案件因為缺乏實際有效的證據而被擱置為懸案。此時歷史上的證明資料,可能就是一段視頻文件,這些視頻資料的數據因其重要性和難獲得性,其對于案件偵破的價值就顯得非常高。
當然,還有一些經典的影像資料、音樂作品、藝術作品等,這些作品及其所承載數據也是隨著時間的流逝而會呈現價值增值的。
數據的時間價值是相對的。
價值本身是一個相對的概念,數據在時間維度上的價值也是相對的:一方面與數據本身的價值有關,另一方面也與個人或組織對于數據本身的感知有關。
數據的時間價值是有人文情懷在起作用的,所謂“如人飲水,冷暖自知”,同樣是一段小時候的個人視頻記錄數據,每個人在不同的年齡段去打開觀看時,可能會有不同的體驗。
所以,對數據價值的體驗與個人或組織的經歷、狀態等都有關系,數據的時間價值因人而異、因事而異。
2. 數據的空間觀:數據是有親疏度的
空間賦予數據以距離感和親疏度。
按此角度,數據可粗略分為:遠距離數據和近距離數據。
同樣的數據對處在不同空間位置下的企業或者個人,其影響度是完全不同的。一般來說,距離越遠,數據的鴻溝越大,信息的不對稱就越嚴重。
具體來說,數據在空間上的變化體現在兩個方面:物理距離和業務距離。
1)物理距離
指在地理位置上或者經緯度上的差距,這個是在客觀世界里的真實存在的距離。
比如:如果你身在新疆地區,同樣是新增10個新冠肺炎確診病例,在新疆地區的人對這個數據的感受與身在北京的人是不一樣的,對于身在疫情重災區的美國的留學生來說更是不一樣。
可見,數據所反映事物的影響力與我們當前所處的空間位置有一定的關系,當然也與接收數據的主體對事物的關心程度有關系??傮w趨勢是物理距離越近,數據的價值或影響力就越大。
利用物理距離可以圈定電子圍欄,鎖定圍欄中的目標用戶可以進行精準“打擊”。
比如:美團和高德地圖軟件中都有“附近”這個選項,進入其中就能發現距離當前位置最近的商戶信息,此時如果客戶有訂餐或就餐需求,就可以選擇距離較勁的、符合自身口味的餐廳去就餐。
同樣道理,美團或高德也可以在APP端推送餐廳的信息給圍欄內的客戶,為平臺上商戶進行引流。
物理距離越近,與客戶越親近,為客戶提供的服務就越容易獲得,客戶消費就越便利,這對平臺、商戶和客戶都是有好處的,這其中數據實際上拉近了商戶與客戶之間的物理距離。
數據離客戶或商家越近,其價值就越高。
2)業務距離
一般是指商業領域里數據與業務之間的距離,更具象化的說法是某項指標如果屬于前端業務領域的,那么它就離業務比較近,如果屬于后臺部分的,那么它可能離業務的距離就比較遠。
比如:訂單量、銷售額這樣的數據離業務比較近,對業務人員的價值或影響力比較大,而員工在職人數、會議次數等數據則離業務比較遠,對業務人員來說沒有多大的價值。
一般來說,某項數據離實體業務越遠,其在企業內的重要性就越低,其價值也就越低。
在某些領域,物理距離反而能增加事物的神秘感和探索價值。都說距離產生美,有時候距離也能產生價值。
比如:對于太空迷和天文學家來說,遙遠的太空和外星球是很有吸引力的,有關外太空的深度數據因其稀缺性和難以獲得性,對于太空迷和天文學家是很有價值的。
所以說,在太空探索等特殊領域,物理距離是無法逾越的障礙,但是物理距離反而可以增加太空的神秘感和探索價值。
借助AR/VR技術可以縮短外太空與人類之間的距離,讓我們能產生身臨其境的感覺。可以預見,在5G與AI技術加持下,物理距離將不再是限制事物釋放數據價值的障礙了。
3.? 數據價值的轉換:以時間換空間
時間和空間本身是數據的兩個維度。
在現實生活中,實現物理空間的跨越往往需要時間,而數據從一個位置傳送到另外一個位置時通常是瞬時完成的。
所以,數據可以節省現實世界里實體的空間變化所耗費的時間,也就是用時間換取空間,數據給到了合適的人手中,物理空間上完成了轉換,數據價值也完成了傳遞。
用時間換取空間的例子很多,比如在泰國高分神劇《天才槍手》中,小林想到的跨時區作弊方法,就是利用了SAT考試在不同時區的時間差,在這個時間差內完成考題答案(數據)的空間傳輸。
小林先去澳大利亞參加考試,把所有的考題和答案背誦下來,然后通過藏起來的手機將答案(數據)傳送,老板們通過鉛筆來把答案帶進考場鉛筆上有不同的條形碼粗細代表各不同的選項,而旁邊的數字就是填空題的答案。
一場完美的作弊就是這樣完成的,雖然實際執行過程中出現了一些意外情況。
總之,數據價值可以實現時間和空間的轉換,數據在時間維度的價值可以轉化為在空間維度上的優勢。
在適當的場景下,空間維度的價值也可以轉化為時間維度的價值,這就是數據價值在時空上的統一與轉化。
4. 數據的時空交互:價值的具象化與數據可視化
數據同時在時間和空間上的積累,最終能演化出什么樣的價值呢?
筆者認為,數據在時空上長期的積累至少能證明我們做事情的專注和堅持,這無論對個人還是企業來說,都是一筆可貴的財富,世上沒有白走的路,每一步都算數。
正如《西游記》中唐僧不遠萬里赴西天取經,正是因為佛祖看到了唐僧師徒經過了九九八十一難的數據積累,正是因為佛祖看到了唐僧師徒四人17年(時間數據)跨越了千山萬水(空間數據),才最終給唐僧下發了經書,唐僧等人才得以修成正果。
在《西游記》中,數據在時空上的價值得以具象化,最終換取了佛經和正果。
數據同時在時間和空間維度上都有變化時,數據將呈現怎樣的狀態呢?
此時,數據可視化將會告訴我們答案。
- 從時間上,數據可視化技術可以呈現數據在時間維度上的變化軌跡;
- 從空間上,數據可視化技術將為我們呈現數據在不同位置的浮動和涌現。
比如:天氣預報充分融合分析了天氣相關指標的時空特性,是時空大數據產品的典型代表。
三、從時空觀看數據的取舍之道
綜上所述,數據從時間維度來看是有溫度的,從空間維度來看則是有親疏度的。
通常情況下,數據離我們的時間越長,離我們的距離越遠,數據的價值就越低。由此,引出了另一個話題,那就是數據的取舍。
既然數據的價值跟時間和空間有關系,那么那些時間上離我們很久遠的、距離上離我們比較遠的數據就是垃圾數據,也就是價值不大的數據,這些垃圾數據經年累月的積累下來,就會占據大量的存儲空間、耗費大量的存儲成本。
在數據爆炸的今天,我們應該學會對數據進行適當的取舍了,是時候要放棄一部分低價值數據了。
對于企業來講,做數據資產管理不可貪多求全,適當放棄低價值數據方是正途,建議企業應該更加重視與業務距離較近的熱數據,而對與業務距離較遠的、非熱數據應采取有選擇性的放棄策略。
?四、關于數據的時空觀的小結
數據的時空觀是我們認識數據價值的一種新角度,它研究的是數據在時間和空間兩個維度上的價值規律與作用機制。
時間賦予數據以溫度,將數據分為冷數據、溫數據和熱數據。
從數據價值的時效性來看,越是新鮮的數據其價值一般會越高;空間賦予數據以距離感和親疏度,將數據分為遠數據和近數據,總體趨勢是物理距離或業務距離越近,數據的價值或影響力就越大。
數據在時間上的價值與空間上的價值有時是可以相互轉化的——數據價值在時空特性上可實現統一,可以具象化和形象化。在數據爆炸的時代背景下,企業應懂得數據的取舍之道,學會有選擇性的放棄低價值數據。
以上就是我對數據時空觀的粗淺看法,我在這里等候各位專家拍磚過來。
擴展閱讀:我的數據價值觀:是什么?有什么價值?如何產生價值?
作者:黃小剛,微信公眾號:大數據產品設計與運營
本文由 @黃小剛 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
- 目前還沒評論,等你發揮!