透過流調(diào)個人隱私泄露事件,看分布式數(shù)據(jù)采集安全
編輯導(dǎo)讀:冬季到來,疫情開始反復(fù),成都出現(xiàn)了幾起疫情,但是引爆當(dāng)日話題的,是確診患者的個人隱私被曝光,引來全網(wǎng)的傳閱、調(diào)侃和惡意攻擊。本文作者將以這個事件作為切入點,討論分布式數(shù)據(jù)采集安全,希望對你有幫助。
自從入冬以來,國內(nèi)“新冠肺炎”疫情出現(xiàn)一些零星反彈,老百姓本已放下的心,又重新提了起來。特別是2020年12月7日,成都市出現(xiàn)2例家庭聚集性疫情,這是自今年3月份以來,成都首例本土新增新冠肺炎確診病例。病例確診后,成都市很快進入戰(zhàn)時狀態(tài),市疾控中心依托《新型冠狀病毒肺炎防控方案》迅速開展流行病學(xué)調(diào)查工作,并在12月8日很快確診其他3例新增本土病例。
但當(dāng)日引爆朋友圈等社交工具的話題、熱搜,除了成都市當(dāng)日新增3例病例以外,還有第3例病例,成都女孩趙某的個人隱私信息在互聯(lián)網(wǎng)被泄露,引發(fā)全網(wǎng)的傳閱、調(diào)侃和惡意攻擊。雖然,事件很快在公安機關(guān)的介入下,已將散布、泄露趙某個人隱私的王某進行了行政處罰。但3天之后,12月11日,重慶新冠肺炎確診患者徐某的個人信息也遭泄露,患者受到電話騷擾和謾罵。
其實,疫情防控中的個人隱私泄露問題并不是個案,就在2020年春節(jié)前后,超7000名武漢返鄉(xiāng)公民信息遭到了泄露,返鄉(xiāng)人員名單在微信群中肆意轉(zhuǎn)發(fā),大量敏感信息泄露;因?qū)⑸婕靶鹿诓《净颊呒捌溆H屬隱私的調(diào)查報告轉(zhuǎn)給無關(guān)人員,湖南益陽市赫山區(qū)衛(wèi)生健康局副局長被予以黨紀(jì)立案調(diào)查,另有兩人被訓(xùn)勉談話,一人被通報批評;云南的文山州人民醫(yī)院發(fā)生了泄露新冠病毒患者的姓名、家庭住址、工作單位、診療信息等個人信息[1]
在公共衛(wèi)生安全領(lǐng)域,個人隱私權(quán)和公眾知情權(quán)的平衡一直以來都是重要研究課題,國內(nèi)也制定了相關(guān)法律、法規(guī)用于規(guī)范疫情防控過程中出現(xiàn)的個人隱私處理問題,例如:《中華人民共和國傳染病防治法》第六十八條規(guī)定,故意泄露傳染病病人、病原攜帶者、疑似傳染病病人、密切接觸者涉及個人隱私的有關(guān)信息、資料的,構(gòu)成犯罪的,依法追究刑事責(zé)任。另外還有,《 民法總則 》《 刑法修正案(九)》規(guī)定的“侵犯公民個人信息罪”等。
就在我們有法可依的條件下,個人隱私泄露事件依然出現(xiàn)層出不窮,除了公民在個人隱私保護上的法律意識薄弱原因外,還有管理單位在個人隱私信息收集、處理、存儲、使用和披露的管理疏忽問題、相關(guān)信息化系統(tǒng)在隱私數(shù)據(jù)的數(shù)字化管理的長久缺失問題。
本文接下來主要通過系統(tǒng)化建設(shè)角度,討論傳染病流調(diào)過程中存在的個人隱私泄露風(fēng)險和一些技術(shù)性治理辦法,而關(guān)于整個傳染病防控過程中的個人隱私數(shù)據(jù)泄露的完全杜絕,則是一個社會綜合治理問題,這里包括:法律、公共衛(wèi)生、信息系統(tǒng)和公民法律意識整體提高等多種條件,請讀者理性看待。
一、流調(diào)與追蹤過程
那什么是流調(diào)呢?流調(diào)的全稱是“流行病學(xué)調(diào)查”, 是對疾病、健康或衛(wèi)生事件群體現(xiàn)象所進行的調(diào)查與處理。
根據(jù)《新型冠狀病毒肺炎防控方案(第七版)》[2]指導(dǎo),新冠肺炎疫情的流調(diào)主要包括:個案調(diào)查、密切接觸者判定、使用交通工具判定、聚集性疫情調(diào)查,編寫調(diào)查信息報告等工作。根據(jù)《國家突發(fā)公共衛(wèi)生事件相關(guān)信息報告管理工作規(guī)范(試行)》的要求調(diào)查信息報告工作主要又分為:填報事件的基本信息、初次、進展和結(jié)案報告四個階段。根據(jù)流調(diào)收集的《新型冠狀病毒肺炎病例個案調(diào)查表》、《聚集性疫情病例關(guān)鍵信息登記表》收集的信息結(jié)構(gòu)上看,主要有:個人基礎(chǔ)信息、病情健康信息、社會關(guān)系信息、行為軌跡信息等。
流調(diào)的主體流程如圖一:
圖一:流行病學(xué)調(diào)查流程
建立流調(diào)任務(wù)主要是通過國家傳染病網(wǎng)絡(luò)直報系統(tǒng)自動下發(fā)和根據(jù)當(dāng)?shù)匾咔楸l(fā)情況人工建立調(diào)查任務(wù),流調(diào)任務(wù)主要以區(qū)(縣)疾控中心人員、疫情爆發(fā)社區(qū)人員、政府人員、醫(yī)院院感科醫(yī)生、公安、電信等共同等開展。調(diào)查通過基本信息調(diào)查、感染來源調(diào)查、污染范圍調(diào)查、密切接觸者調(diào)查、病例調(diào)查、家庭暴露調(diào)查、聚餐暴露調(diào)查、工作單位暴露調(diào)查、行動交通工具調(diào)查、重點場所暴露調(diào)查等,時間、空間、人群維度開展三間信息收集和分析,最終形成初次流調(diào)報告,形成的流調(diào)報告可繼續(xù)更新和修改至疫情最終結(jié)案,結(jié)案后的流調(diào)報告集中上傳管理。
目前我國這套流調(diào)機制總體上是高效的,特別通過本次新冠肺炎疫情防控的實際檢驗,成效顯著。具有社會動員能力強、疫情撲滅及時等優(yōu)勢,但由于采用了多方協(xié)同防控機制,在個人隱私保護方面還存在泄露隱患。
二、流調(diào)過程的個人隱私保護盲點
1. 多方參與調(diào)查,加大個人隱私泄露風(fēng)險
重大疫情期間(如:新冠肺炎疫情)的流調(diào)和普通疫情期間的流調(diào)方式有顯著區(qū)別,重大疫情爆發(fā)期間的流調(diào)由于時間緊、任務(wù)急、調(diào)查面廣,工作量大,所以需要調(diào)動社會力量共同完成,非專業(yè)人員和法律意識薄弱群體也會接觸到個人隱私信息。
同時,由于大部分是現(xiàn)場調(diào)查,受網(wǎng)絡(luò)和現(xiàn)場環(huán)境限制,大部分調(diào)查依然采用紙質(zhì)表格填報方式,信息的開放度高,泄露風(fēng)險高。成都女孩隱私泄露事件中,警方雖然沒有公布具體的泄露過程,但從泄露的個人隱私信息結(jié)構(gòu)上看,屬于初次調(diào)查報告形成階段,泄露信息有關(guān)鍵字:“初步調(diào)查情況”,說明調(diào)查信息還未歸檔,正在調(diào)查和分析過程中。
2. 流調(diào)過程部分實現(xiàn)了信息化,離數(shù)字化還有差距
雖然我國疾控中心信息中心在2011年研發(fā)上線了流行病學(xué)調(diào)查動態(tài)數(shù)據(jù)采集云平臺(EDDC)[4],該項目作為“中國/世界衛(wèi)生組織衛(wèi)生技術(shù)合作項目”和“十一五科技支撐課題”,截止2017年底,已經(jīng)在澳大利亞衛(wèi)生信息大會、中美新發(fā)再發(fā)傳染病合作項目和發(fā)展中國家培訓(xùn)班上進行推廣。授權(quán)世界衛(wèi)生組織駐華代表處、國內(nèi)各省級疾控中心、各計劃單列市市級疾控中心及其他發(fā)展中國家免費使用[5]。但從EDDC系統(tǒng)的建設(shè)內(nèi)容來看,EDDC注重調(diào)查問卷的制作和數(shù)據(jù)統(tǒng)計工作,對于調(diào)查和分析過程的技術(shù)支持較少[6],還屬于流程信息化階段。見圖二:
圖二 來源:流行病學(xué)動態(tài)數(shù)據(jù)采集平臺在公共衛(wèi)生調(diào)查中的應(yīng)用[6]
所以國內(nèi)部分省級疾控中心也在自建流行病調(diào)查系統(tǒng),例如:2020年北京市疾病預(yù)防控制中心研發(fā)了基于人工智能的新冠肺炎疫情現(xiàn)場數(shù)字化流行病學(xué)調(diào)查系統(tǒng),該系統(tǒng)增加了密切接觸者追蹤管理、流調(diào)管理(支持客戶端圖片、語音智能識別功能)和可視化的決策分析輔助等功能[7],該系統(tǒng)在流調(diào)調(diào)查便捷性和數(shù)字化方面做了一些改進優(yōu)化。
但無論國家疾控中心開發(fā)的EDDC,還是北京疾控中心開發(fā)的數(shù)字化流行病學(xué)調(diào)查系統(tǒng)。從本質(zhì)上還是一個信息收集、處理解析、報告、存儲的流程化信息系統(tǒng),在個人隱私數(shù)據(jù)的確權(quán)、處理與應(yīng)用、知情、流動等數(shù)字化、密碼化保障方面還有不少欠缺。
3. 流調(diào)數(shù)據(jù)安全存在嚴(yán)重木桶效應(yīng)
從圖一,不難看出,將流調(diào)的全過程,簡單劃分為:流調(diào)任務(wù)管理、現(xiàn)場調(diào)查和流調(diào)信息管理三部分,由于流調(diào)任務(wù)管理和流調(diào)信息管理處于網(wǎng)絡(luò)和賬戶安全的雙重保護下,個人隱私泄露的可能性低,安全度高。但在現(xiàn)場調(diào)查環(huán)節(jié),由于缺乏數(shù)字化調(diào)查工具(往往還采用傳統(tǒng)紙質(zhì)表格開展調(diào)查)、參與人員多、法律意識淡薄等問題,個人隱私數(shù)據(jù)泄露風(fēng)險高?,F(xiàn)場調(diào)查的數(shù)據(jù)安全問題,成為了整個流調(diào)體系的短板。就目前爆出的大部分個人隱私泄露事件,也都是從現(xiàn)場調(diào)查環(huán)節(jié)泄露的。
三、數(shù)字化流調(diào)模型優(yōu)化建議
1. 實現(xiàn)流調(diào)信息的模型化、數(shù)字化和分布式采集
流調(diào)雖然是區(qū)(縣)CDC的專業(yè)任務(wù),但在重大疫情爆發(fā)期間,單靠CDC人員獨立開展是遠(yuǎn)遠(yuǎn)不夠的,還需要根據(jù)流調(diào)信息的類型,通過社會其他專業(yè)人員的輔助,分步驟來完成。所以,流調(diào)信息的采集天然是分散開展的,如果依然采用電子表格或紙質(zhì)表格等傳統(tǒng)純文本、信息整體記錄的方式(流調(diào)表格參看附件)無法降低個人隱私泄露風(fēng)險,而建立基于流調(diào)信息記錄的模型化、數(shù)字化和分布式采集體系就尤為重要。
流行病學(xué)調(diào)查過程以調(diào)查人員的聚類分析,可簡單分為:個人核心信息調(diào)查、醫(yī)學(xué)與病毒學(xué)調(diào)查和社會與傳播調(diào)查等3部分,由于這3類的參與調(diào)查的輔助人員有所不同,例如:個人核心信息調(diào)查輔助人員主要是社區(qū)、派出所等人員;醫(yī)學(xué)和病毒學(xué)調(diào)查主要是醫(yī)院和實驗室等人員;社會與傳播調(diào)查需要電信、交通、公安等公共服務(wù)機構(gòu)人員,所以個人基礎(chǔ)信息、社會關(guān)系信息、行為軌跡信息和病情健康信息,并不會同時和由同一批調(diào)查員采集,而是進行模型化、對象化拆分后的分布式采集。
由于社會關(guān)系信息、行為軌跡信息和病情健康信息對個人基礎(chǔ)信息擁有依賴關(guān)聯(lián),所以數(shù)據(jù)體之間應(yīng)采用匿名關(guān)聯(lián)機制,可對個人隱私信息做Hash運算生成的唯一字符串作為匿名關(guān)聯(lián)字段。采用匿名關(guān)聯(lián)后的社會關(guān)系信息、行為軌跡信息和病情健康信息的采集,個人隱私的泄露風(fēng)險將大大降低。
見圖三:
圖三 數(shù)字化流調(diào)信息模型
2. 流調(diào)現(xiàn)場采集的數(shù)字化授權(quán)
無論在國家疾控中心信息中心建設(shè)的EDDC平臺,還是北京疾控中心建設(shè)的數(shù)字化流行病學(xué)調(diào)查系統(tǒng),目前都已經(jīng)支持流調(diào)任務(wù)下發(fā)、流調(diào)問卷管理等功能,也支持基于如:電腦、Pad版等的流調(diào)客戶端,實現(xiàn)問卷下載,離線填寫、在線上傳等功能[8]。
見下圖:
圖四 現(xiàn)場調(diào)查數(shù)字授權(quán)
從整體流行病學(xué)調(diào)查的數(shù)據(jù)安全控制機制來看,流調(diào)任務(wù)下發(fā)依靠的是網(wǎng)絡(luò)授權(quán),問卷管理依賴賬戶授權(quán),而目前在數(shù)據(jù)現(xiàn)場采集中,依然是沿用了賬戶授權(quán)方式。這在平時個案疫情時并無不妥,但在重大傳染病爆發(fā)期間的流調(diào)情況就有所不同,依賴賬戶授權(quán)機制的客戶端,因為需要直接連接CDC流調(diào)系統(tǒng),勢必將可采集數(shù)據(jù)的賬戶限制在很少的范圍,而在大面積流調(diào)實際工作中參與人員多、時間緊迫、工作量大,往往不是一個賬戶多人共同使用、采集、上傳,就是多人填寫紙質(zhì)表格,再通過一人統(tǒng)一上傳的尷尬境地,無論哪種方式,都加大了個人隱私泄露的風(fēng)險和責(zé)任界定難的問題。
其實,我們可依托一臺流調(diào)主客戶端用于問卷的下載和上傳,主客戶端依然使用賬戶授權(quán)。而參與大面積流調(diào)的人員可以使用自有客戶端,通過藍(lán)牙、WiFi、ZigBee等近距通信技術(shù),開展現(xiàn)場數(shù)字授權(quán)。數(shù)字授權(quán)(加密算法可采用ECC或者國密SM2)的公鑰用于采集數(shù)據(jù)的資格驗證;私鑰用于數(shù)據(jù)簽名后的責(zé)任界定。數(shù)據(jù)授權(quán)的驗證通過具備賬戶授權(quán)的主客戶端完成,并最終通過主客戶端向后端流調(diào)系統(tǒng)上傳加密數(shù)據(jù)。
采用現(xiàn)場流調(diào)數(shù)據(jù)授權(quán)方式是平衡流調(diào)數(shù)據(jù)采集的便捷性、高效性和數(shù)據(jù)安全性的有效方法。在保障現(xiàn)有中心化流調(diào)系統(tǒng)的網(wǎng)絡(luò)安全和賬戶授權(quán)體系不變的情況下,提升流調(diào)實際的數(shù)據(jù)安全性和責(zé)任界定的準(zhǔn)確性。
3. 實現(xiàn)采集調(diào)查的責(zé)任鏈
在重大疫情期間的流調(diào)實踐中,體現(xiàn)出任務(wù)多、參與人員和機構(gòu)復(fù)雜、專業(yè)參差不齊、法律意識淡薄、調(diào)查任務(wù)并行開展的特點。如果按照非疫情期間的數(shù)據(jù)安全采集規(guī)范,嚴(yán)格控制調(diào)查人員的準(zhǔn)入授權(quán)、金融級的數(shù)據(jù)安全和法律素質(zhì)培養(yǎng),勢必會降低調(diào)查效率,也存在貽誤疫情防控最佳時間的重大風(fēng)險。
所以,采用強化事后追責(zé)體系是一種有效平衡流調(diào)效率和數(shù)據(jù)安全的手段,通過透明化的事后追責(zé)體系,間接警示參與調(diào)查的人員,嚴(yán)格執(zhí)行個人隱私保護的相關(guān)條例,而一個具備公信力的責(zé)任鏈條是其中關(guān)鍵。通過區(qū)塊鏈技術(shù)將基本信息調(diào)查、病例調(diào)查、家庭暴露調(diào)查、密切接觸者調(diào)查、感染來源調(diào)查、聚餐暴露調(diào)查、工作單位暴露調(diào)查、重點場所暴露調(diào)查、行動交通工具調(diào)查和污染范圍調(diào)查的每個過程,依據(jù)時間順序記錄在流調(diào)責(zé)任鏈中。通過區(qū)塊鏈技術(shù)的信息防篡改、調(diào)查過程透明和多方協(xié)作的優(yōu)勢,可將流調(diào)期間的數(shù)據(jù)隱私泄露風(fēng)險控制在一定范圍內(nèi)。
見圖五:
圖五 流調(diào)責(zé)任鏈
四、總結(jié)
成都女孩的個人隱私泄露問題,并不是個案,只是更多的隱私泄露沒有被互聯(lián)網(wǎng)放大而已。而在重大公共衛(wèi)生事件中的個人隱私保護問題,長久以來一直也都是一個難題,這里牽涉了包括:個人權(quán)利和公眾利益平衡的社會學(xué)難題,疫情期間的個人隱私保護和公眾知情權(quán)的法律問題,數(shù)據(jù)主體、數(shù)據(jù)控制者和數(shù)據(jù)處理者的確權(quán)問題和政府監(jiān)管的執(zhí)法力度問題,以及同重大公共衛(wèi)生事件的應(yīng)急響應(yīng)效率的平衡問題。
簡單說,就是該問題不是單靠立法就能解決的,本文建議的流調(diào)現(xiàn)場數(shù)據(jù)收集改進策略,也只是體系化解決該問題中的一個環(huán)節(jié)而已。
由于重大疫情期間的流調(diào),大部分都涉及“聚集性疫情調(diào)查”,呈現(xiàn)大面積的數(shù)據(jù)分散采集的特點,依靠傳統(tǒng)賬戶授權(quán)機制保障數(shù)據(jù)安全,往往形同虛設(shè)。而采用開放式的數(shù)字化授權(quán)機制,可以在保障流調(diào)效率的前提下,通過流調(diào)數(shù)據(jù)的數(shù)字化模型建立,分散采集數(shù)據(jù)體,隱藏個人隱私信息;通過數(shù)字授權(quán)和區(qū)塊鏈技術(shù)的數(shù)據(jù)寬進嚴(yán)出、透明的事后追責(zé)體系,間接降低個人隱私泄露風(fēng)險。
五、參考文獻
[1].? 余圣琪.(2021).流調(diào)與追蹤中的數(shù)據(jù)法律保護.?河北法學(xué)(01),1-15. doi:10.16494/j.cnki.1002-3933.2021.01.011.
[2].?關(guān)于印發(fā)新型冠狀病毒肺炎防控方案(第七版)的通知 http://www.nhc.gov.cn/jkj/s3577/202009/318683cbfaee4191aee29cd774b19d8d.shtml
[3].?新型冠狀病毒肺炎流行病學(xué)調(diào)查指南 http://www.chinacdc.cn/jkzt/crb/zl/szkb_11803/jszl_11815/202003/W020200309540843000869.pdf
[4].?流行病學(xué)調(diào)查動態(tài)數(shù)據(jù)采集云平臺(EDDC)正式發(fā)布http://www.chinacdc.cn/zxdt/201112/t20111207_55097.htm
[5].?(2017-12-29).?流行病學(xué)調(diào)查動態(tài)數(shù)據(jù)采集云平臺研發(fā)與應(yīng)用.2020-12-15,https://kns.cnki.net/KCMS/detail/detail.aspx?dbname=SNAD&filename=SNAD000001713196.
[6].?孟郁潔,戚曉鵬,馬睿,金水高,蘇雪梅,于石成 & 馬家奇.(2013).流行病學(xué)動態(tài)數(shù)據(jù)采集平臺在公共衛(wèi)生調(diào)查中的應(yīng)用. 醫(yī)學(xué)信息學(xué)雜志(06),18-22. doi:.
[7].?栗圓,高燕琳 & 李剛.(2020).新冠肺炎疫情現(xiàn)場流行病學(xué)調(diào)查系統(tǒng)的建設(shè)與應(yīng)用. 中國衛(wèi)生信息管理雜志(05),627-631. doi:.
[8].?禹雪,楊淑云,李璽琨,楊麗,車明杰,張宇… & 沈貞姬.(2017).流行病學(xué)動態(tài)數(shù)據(jù)采集平臺-安卓版離線采集軟件在接種率調(diào)查中的應(yīng)用. 現(xiàn)代預(yù)防醫(yī)學(xué)(08),1441-1447. doi:.
小插曲
我在參加人人都是產(chǎn)品經(jīng)理2020年度作者評選,希望喜歡我的文章的朋友都能來支持我一下~
點擊下方鏈接進入我的個人參選頁面,點擊紅心即可為我投票。
每人最多可投3票,投票即有機會獲得百萬驚喜禮品&起點學(xué)院千元豪禮哦!
投票傳送門:http://996.pm/7vk2D
#專欄作家#
黃銳,人人都是產(chǎn)品經(jīng)理專欄作家。高級系統(tǒng)架構(gòu)設(shè)計師、資深產(chǎn)品經(jīng)理、多家大型互聯(lián)網(wǎng)公司顧問,金融機構(gòu)、高??妥芯繂T。主要關(guān)注新零售、工業(yè)互聯(lián)網(wǎng)、金融科技和區(qū)塊鏈行業(yè)應(yīng)用版塊,擅長產(chǎn)品或系統(tǒng)整體性設(shè)計和規(guī)劃。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自?Unsplash,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!