從健康碼出發(fā),聊聊大數(shù)據(jù)的利與弊
疫情期間,健康碼的采用讓使疫情防控更加高效、精準(zhǔn)。這背后,是大數(shù)據(jù)技術(shù)在發(fā)揮作用。但是,大數(shù)據(jù)在為生活帶來(lái)便利的同時(shí),我們的隱私可能也會(huì)受到威脅。文章從大數(shù)據(jù)的概念出發(fā),對(duì)其利弊進(jìn)行了分析,并總結(jié)了它帶來(lái)的機(jī)遇。
2020年,疫情的爆發(fā)使健康碼在各大城市相繼使用,健康碼是以真實(shí)數(shù)據(jù)為基準(zhǔn),識(shí)別人員是不是直接或間接接觸過(guò)一些感染者,從而判斷人員是否需要隔離排查。
杭州市委副書記在接受新聞采訪時(shí)表示,健康碼的評(píng)判來(lái)源于三個(gè)維度:空間維度、時(shí)間維度和人際關(guān)系維度。這說(shuō)明了健康碼的生成充分利用了用戶的數(shù)據(jù),雖官方暫未公開數(shù)據(jù)使用的詳情,但猜測(cè)健康碼會(huì)結(jié)合用戶的人際關(guān)系數(shù)據(jù)、GPS定位數(shù)據(jù)、電信運(yùn)營(yíng)商數(shù)據(jù)、消費(fèi)記錄數(shù)據(jù)、線下掃碼位置數(shù)據(jù)等相關(guān)信息,進(jìn)而判斷人員是否出入高危場(chǎng)地。
健康碼的應(yīng)用,屬于大數(shù)據(jù)技術(shù)的典型案例,網(wǎng)絡(luò)服務(wù)提供者利用收集到的用戶數(shù)據(jù),預(yù)測(cè)用戶的健康情況,使疫情防控更加高效、精準(zhǔn)。
人們?cè)谙硎艽髷?shù)據(jù)帶來(lái)便利的同時(shí),若網(wǎng)絡(luò)服務(wù)提供者不按照規(guī)定使用用戶數(shù)據(jù),也將對(duì)用戶造成騷擾,威脅到用戶的隱私信息。
一、到底什么是大數(shù)據(jù)
“任何理論首先必須澄清雜亂的,或者說(shuō)是混淆不清的概念和觀念。只有對(duì)名稱和概念有了共同的理解,才能清楚而順利地研究問(wèn)題”。——克勞塞維茨《戰(zhàn)爭(zhēng)論》
李笑來(lái)曾經(jīng)提及過(guò),在寫《韭菜的自我修養(yǎng)》這本書之前從來(lái)不會(huì)使用“韭菜”一詞,因?yàn)闆](méi)有弄清“韭菜”一詞的定義,在沒(méi)有弄清一個(gè)詞的定義之前,不應(yīng)該隨便使用。
自從大數(shù)據(jù)概念被提出,我們已經(jīng)廣泛使用了這么多年的“大數(shù)據(jù)”,那么“大數(shù)據(jù)”的具體概念應(yīng)該是什么?
現(xiàn)實(shí)世界中,有很多詞匯是沒(méi)有官方定義的,比如“人工智能”,沒(méi)有哪個(gè)機(jī)構(gòu)說(shuō)他們定義的就是正確的“人工智能”概念。在不同的時(shí)代里人們對(duì)人工智能的定義也是不同的,上個(gè)世紀(jì)60年代,人們認(rèn)為可以下跳棋的計(jì)算機(jī)就是人工智能,但現(xiàn)在看來(lái)這個(gè)說(shuō)法顯然是無(wú)法被人們接受的。
相同的,大數(shù)據(jù)的定義,也沒(méi)有一個(gè)官方機(jī)構(gòu)明確地說(shuō)明什么就是“大數(shù)據(jù)”。早些年對(duì)于政府機(jī)構(gòu)來(lái)說(shuō),數(shù)據(jù)匯集也叫做大數(shù)據(jù),而后出現(xiàn)了一些數(shù)字辦、大數(shù)據(jù)局等新成立的單位,把各地方、各單位的數(shù)據(jù)匯聚起來(lái),以發(fā)揮后續(xù)政府?dāng)?shù)據(jù)的價(jià)值。對(duì)于金融機(jī)構(gòu)來(lái)說(shuō),可以通過(guò)用戶的行為進(jìn)行用戶畫像就是大數(shù)據(jù),通過(guò)用戶的行為數(shù)據(jù),判斷用戶的償還能力及償還意愿,識(shí)別用戶貸款的風(fēng)險(xiǎn)。
麥肯錫對(duì)大數(shù)據(jù)給出的定義是:“一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合?!痹凇洞髷?shù)據(jù)時(shí)代》中,大數(shù)據(jù)指“不用隨機(jī)分析法,而是采用所有數(shù)據(jù)進(jìn)行分析處理?!盜BM提出,“大數(shù)據(jù)是具備5V的特性數(shù)據(jù),5V包括:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)?!痹谏鲜龌A(chǔ)上,業(yè)內(nèi)人士已將大數(shù)據(jù)拓展成了“十字特性”,即:一“大”,二“雜”,三“全”,四“多”,五“快”,六“久”,七“活”,八“簡(jiǎn)”,九“稀”,十“聯(lián)”。
大數(shù)據(jù)的定義如此之多,致使每個(gè)人心中都有對(duì)大數(shù)據(jù)的不同理解。如今多數(shù)情況下,人們提到大數(shù)據(jù),都是在特指通過(guò)數(shù)據(jù)分析,可以得到數(shù)據(jù)中的價(jià)值,具體價(jià)值可以是協(xié)助人們進(jìn)行決策判斷,預(yù)測(cè)未來(lái)事情的變化,發(fā)現(xiàn)事務(wù)中的關(guān)聯(lián)性等價(jià)值體現(xiàn)。本文所說(shuō)的大數(shù)據(jù),就是在遵循這樣的描述。
二、大數(shù)據(jù)的“利”
1. 預(yù)測(cè)
預(yù)測(cè)是自古人們都在向往的活動(dòng),生活中的預(yù)測(cè)無(wú)處不在,比如通過(guò)概率分析法預(yù)測(cè)彩票的中獎(jiǎng)號(hào)碼,通過(guò)價(jià)值分析法預(yù)測(cè)股價(jià)的走勢(shì)。
古代人們利用占卜進(jìn)行預(yù)測(cè),就是通過(guò)多年觀察到的事務(wù)變化,結(jié)合歷史數(shù)據(jù)總結(jié)出來(lái)規(guī)律,應(yīng)用在后續(xù)的占卜活動(dòng)中。占卜并沒(méi)有科學(xué)依據(jù),但實(shí)際上占卜就體驗(yàn)了人們的大數(shù)據(jù)思維,利用對(duì)過(guò)往數(shù)據(jù)的總結(jié),不必非得知道現(xiàn)象背后的因果,只要知道相關(guān)性就可以預(yù)測(cè)未來(lái)。
古代的中醫(yī)從業(yè)者,并沒(méi)有能力提煉出草藥中的成分,哪種草藥可以抑制哪種疾病,完全是在結(jié)合大量的實(shí)際案例,根據(jù)經(jīng)驗(yàn)從數(shù)百種種草藥中挑選出不同的組合,從而醫(yī)治不同的疾病。
預(yù)測(cè)從古代發(fā)展到近代,出現(xiàn)了利用數(shù)學(xué)模型預(yù)測(cè)的方法,比如利用過(guò)往數(shù)據(jù)和數(shù)學(xué)模型的結(jié)合,預(yù)測(cè)未來(lái)幾年的人口增長(zhǎng)情況。
數(shù)學(xué)模型是用數(shù)學(xué)符號(hào)、公式、方程等對(duì)現(xiàn)實(shí)世界規(guī)律的抽象描述。如今的氣象預(yù)報(bào),還在應(yīng)用數(shù)學(xué)模型的方法來(lái)預(yù)測(cè)未來(lái)的天氣,氣象局會(huì)根據(jù)氣象圖的變化趨勢(shì),結(jié)合溫度,壓力,濕度,風(fēng)向,風(fēng)速,陽(yáng)光照射情況等,應(yīng)用數(shù)學(xué)模型預(yù)測(cè)天氣的變化趨勢(shì)。
當(dāng)今的大數(shù)據(jù)分析,就是在結(jié)合了占卜和天氣預(yù)報(bào)的方法,利用歷史數(shù)據(jù),結(jié)合數(shù)學(xué)模型,預(yù)測(cè)未來(lái)、預(yù)測(cè)結(jié)果。健康碼應(yīng)用,通過(guò)我們的電信運(yùn)營(yíng)商數(shù)據(jù)、交通出行數(shù)據(jù)、交易記錄數(shù)據(jù)等信息,預(yù)測(cè)我們是否為高危感染人群,判斷是否需要進(jìn)行隔離觀察,這就是在預(yù)測(cè)結(jié)果。搜索引擎,通過(guò)用戶的搜索喜好,預(yù)測(cè)美國(guó)總統(tǒng)的未來(lái)人選,這就是在預(yù)測(cè)未來(lái)。
預(yù)測(cè)是大數(shù)據(jù)最典型直觀的價(jià)值體現(xiàn),有時(shí)預(yù)測(cè)也被看作人工智能的范疇。在未來(lái),利用大數(shù)據(jù)預(yù)測(cè),將給人們帶來(lái)更多的便利。利用數(shù)據(jù)預(yù)測(cè)可能的疾病,以便提早做出預(yù)防;利用數(shù)據(jù)預(yù)測(cè)學(xué)習(xí)的缺陷,以便精準(zhǔn)教育及練習(xí);利用數(shù)據(jù)預(yù)測(cè)用戶的真實(shí)需求,從而不需要產(chǎn)品經(jīng)理來(lái)瞎猜(估計(jì)到時(shí)候我也就下崗了)……
2. 發(fā)現(xiàn)相關(guān)性
2004年,沃爾瑪從以往數(shù)據(jù)中發(fā)現(xiàn),在季節(jié)性颶風(fēng)來(lái)臨之前,不僅僅颶風(fēng)用品的銷量會(huì)增加,而且蛋撻的銷量也會(huì)大幅增加。因此每當(dāng)季節(jié)性颶風(fēng)來(lái)臨之前,沃爾瑪就會(huì)把蛋撻商品擺放到颶風(fēng)用品旁邊,以便讓快速購(gòu)買颶風(fēng)用品的顧客留意到蛋撻,增加蛋撻商品的銷售量。沃爾瑪?shù)娜艘膊⒉恢罏槭裁吹皳榫统闪孙Z風(fēng)來(lái)臨時(shí)的暢銷產(chǎn)品,但是他們只需要知道颶風(fēng)來(lái)臨時(shí)沃爾瑪?shù)牡皳闀?huì)暢銷就可以了,找到了這個(gè)相關(guān)性之后即使不用找到背后的原因,也可以提升銷量。
大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的因果,只需要發(fā)現(xiàn)相關(guān)性,應(yīng)用到后續(xù)的活動(dòng)中,就可以創(chuàng)造巨大的經(jīng)濟(jì)或社會(huì)價(jià)值。利用大數(shù)據(jù)發(fā)現(xiàn)相關(guān)性,可以加快社會(huì)的進(jìn)步,加快人們的決策,避免了找到“因”,在想清“果”的繁瑣過(guò)程。
三、大數(shù)據(jù)的“弊”
1. 威脅用戶隱私
在大數(shù)據(jù)時(shí)代,人們偶然間發(fā)現(xiàn)自己的隱私受到了威脅,我們的隱私被互聯(lián)網(wǎng)服務(wù)提供商監(jiān)視著,購(gòu)物應(yīng)用監(jiān)視著我們購(gòu)物習(xí)慣,搜索引擎監(jiān)視著我們網(wǎng)頁(yè)瀏覽習(xí)慣,社交軟件監(jiān)視著我們的社會(huì)關(guān)系,理財(cái)產(chǎn)品監(jiān)視著我們的財(cái)富……
互聯(lián)網(wǎng)服務(wù)提供商監(jiān)控著我們的數(shù)據(jù),利用我們的數(shù)據(jù)搞“大數(shù)據(jù)殺熟”,形成“千人千價(jià)”,從而提高自身的利潤(rùn),受害的卻是我們消費(fèi)者。美國(guó)國(guó)家安全局2007年發(fā)起的棱鏡計(jì)劃,通過(guò)互聯(lián)網(wǎng)服務(wù)器中的數(shù)據(jù)監(jiān)聽著我們每一個(gè)人的一舉一動(dòng),在其面前我們沒(méi)有隱私可言,擁有大量數(shù)據(jù)的機(jī)構(gòu),知道我們的每一個(gè)真實(shí)行為,有時(shí)甚至比我們自己都了解我們。
互聯(lián)網(wǎng)服務(wù)提供商不合規(guī)利用數(shù)據(jù)對(duì)我們?cè)斐傻挠绊懮锌稍?,一旦?shù)據(jù)被泄露或非法交易,將造成不可預(yù)知的后果。當(dāng)今泄露事件層出不窮,臉書把用戶的點(diǎn)贊數(shù)據(jù)非法供給了劍橋分析公司,間接性對(duì)美國(guó)大選結(jié)果造成一定影響;雅虎2016年泄露15億人次的用戶信息,使廣大互聯(lián)網(wǎng)用戶的生日,電話號(hào)碼,賬戶密碼在暗網(wǎng)流傳,隨時(shí)有可能流入不法分子之手。
2. 強(qiáng)者愈強(qiáng)
未來(lái)將是人工智能的時(shí)代,從人工智能的歷史發(fā)展中觀察,人工智能算法的優(yōu)化,用程序員主動(dòng)去寫算法,算法的精準(zhǔn)度不如利用大量數(shù)據(jù)去訓(xùn)練算法的效果好。因而數(shù)據(jù)在人工智能的發(fā)展中,將會(huì)起到至關(guān)重要的作用。
企業(yè)擁有的數(shù)據(jù)量越大,其算法的訓(xùn)練越充分;算法訓(xùn)練越充分,產(chǎn)品將越趨于完善;產(chǎn)品越完善,用戶越多;用戶越多,企業(yè)的數(shù)據(jù)量越大。這樣就走到了一種無(wú)限的循環(huán)之中,形成強(qiáng)者愈強(qiáng)的馬太效應(yīng),使小企業(yè)更難趕超大企業(yè)。
四、大數(shù)據(jù)將會(huì)帶來(lái)的機(jī)遇
1. 商業(yè)模式創(chuàng)新
未來(lái)可能會(huì)存在部分企業(yè),不在以向用戶收費(fèi)或廣告商收費(fèi)的方式盈利,而是以產(chǎn)生數(shù)據(jù),售賣數(shù)據(jù)服務(wù)的方式來(lái)達(dá)到盈利的目的。
例如智能冰箱制造企業(yè),免費(fèi)提供智能冰箱給用戶使用,但冰箱中的貨物情況制造企業(yè)需要進(jìn)行監(jiān)控。企業(yè)將監(jiān)控到的數(shù)據(jù)售賣給商超形式的貨物提供企業(yè),貨物提供企業(yè)自動(dòng)對(duì)冰箱中的缺貨情況進(jìn)行補(bǔ)貨,從而承包用戶的全家食材。
同時(shí)智能冰箱制造企業(yè)還可以將用電數(shù)據(jù)賣給電力供應(yīng)商,告知電力供應(yīng)商每戶家庭的冰箱使用及耗電情況。電力供應(yīng)商通過(guò)購(gòu)買全部智能家電的用電情況,從而實(shí)現(xiàn)精準(zhǔn)生產(chǎn)電能,避免造成電能的浪費(fèi)。
2. 數(shù)據(jù)連接企業(yè)
當(dāng)前企業(yè)間、政府間的數(shù)據(jù),無(wú)法做到互聯(lián)互通,形成了一個(gè)又一個(gè)的數(shù)據(jù)孤島,但是一些企業(yè)可能又需要其他機(jī)構(gòu)的數(shù)據(jù),來(lái)實(shí)現(xiàn)自身業(yè)務(wù)的優(yōu)化。例如銀行就需要用戶的房產(chǎn)數(shù)據(jù)、車輛數(shù)據(jù)來(lái)判斷用戶的財(cái)富;保險(xiǎn)機(jī)構(gòu)需要用戶的醫(yī)療數(shù)據(jù)來(lái)判斷用戶的以往病史。
在數(shù)據(jù)互聯(lián)需求的驅(qū)動(dòng)下,未來(lái)將會(huì)催化數(shù)據(jù)連接平臺(tái)產(chǎn)品的誕生。平臺(tái)連接數(shù)據(jù)的供需雙方,成為“數(shù)據(jù)淘寶”,為供需雙方提供數(shù)據(jù)的信息流和資金流。
由于受到法律的制約,直接進(jìn)行數(shù)據(jù)售賣顯然將存在法律風(fēng)險(xiǎn)。因而數(shù)據(jù)連接平臺(tái)的發(fā)展可能會(huì)朝著授權(quán)流通、畫像流通、去標(biāo)識(shí)化流通的方向發(fā)展。
授權(quán)流通就是在用戶的合法授權(quán)之下,把數(shù)據(jù)從供應(yīng)方轉(zhuǎn)移到需求方;畫像流通就是將需求方的用戶畫像模型運(yùn)行于供應(yīng)方的系統(tǒng)之中,從而在供應(yīng)方的系統(tǒng)中只輸出畫像結(jié)果,不輸出原始數(shù)據(jù);去標(biāo)識(shí)化流通就是將用戶的隱私信息去標(biāo)識(shí)化,只流通無(wú)隱私的數(shù)據(jù),例如流通某地區(qū)的用戶購(gòu)買數(shù)據(jù),分析購(gòu)買喜好,但不能對(duì)應(yīng)到具體個(gè)人。
3. 數(shù)據(jù)思維企業(yè)
未來(lái)將會(huì)有越來(lái)越多的企業(yè)需要進(jìn)行數(shù)據(jù)的價(jià)值挖掘,但由于每個(gè)企業(yè)都有自身的業(yè)務(wù),企業(yè)內(nèi)部的員工重點(diǎn)關(guān)注自身業(yè)務(wù)的發(fā)展,對(duì)數(shù)據(jù)價(jià)值挖掘的具體方法不會(huì)特別了解,因此將會(huì)有公司專門提供數(shù)據(jù)價(jià)值挖掘思維的業(yè)務(wù)。如麥肯錫,波士頓,貝恩,四大等,都具備天然的優(yōu)勢(shì)開展此類業(yè)務(wù)。
本文由 @產(chǎn)品工具箱? 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于CC0協(xié)議
你在說(shuō)什么,講的那么虛 無(wú)語(yǔ)
天天gvb.gvb,v.bc.vbcccbcc.涂天.v天vcbbb天兔兔了了天天天了涂他她具體天涂天兔天了他涂天天天兔涂vcvvgv.ccvvbbvccccgvbcccv兔兔808800000800000008858800000888508805805080808000808000000808000080005080800808500080800008088000000天涂天天涂天天天天天b.兔兔b天涂vc天兔兔