一文詳解醫(yī)療機構數(shù)據(jù)治理六大核心環(huán)節(jié)
編輯導語:隨著醫(yī)療數(shù)字化發(fā)展速度加快,關于如何做好數(shù)據(jù)治理的這一問題,也成為推動醫(yī)療數(shù)字化轉型路上亟待解決的問題之一。而要想解決這一問題,你首先需要了解醫(yī)療機構數(shù)據(jù)治理的具體環(huán)節(jié)。本文作者就此做了總結,一起來看一下。
近幾年來,醫(yī)療機構的數(shù)字化進程明顯加快,機構內(nèi)的信息系統(tǒng)越來越多、電子病歷不斷普及、各方面業(yè)務的數(shù)字化基本實現(xiàn)……與之相伴隨而來的,是海量待挖掘應用的數(shù)據(jù)。
艾瑞咨詢發(fā)布的《2022年中國醫(yī)療信息化行業(yè)研究報告》指出,現(xiàn)階段我國整體醫(yī)療數(shù)據(jù)應用水平較低。三級醫(yī)院具備基礎的數(shù)據(jù)資源整合和應用能力,但對于數(shù)據(jù)進一步的分析處理能力還有待加強;而三級以下醫(yī)院超過半數(shù)未開展對于醫(yī)療數(shù)據(jù)的應用業(yè)務,且整體應用能力較之三級醫(yī)院有較大差距。
醫(yī)療數(shù)據(jù)應用難,成為了橫隔在醫(yī)療機構數(shù)字化進程中的一道難題。
一、為何醫(yī)療數(shù)據(jù)應用難?
1. 醫(yī)療大數(shù)據(jù)本身復雜
醫(yī)療健康大數(shù)據(jù)主要可分為四大類:
- 診療輔助類:包括亞健康及患病人群通過醫(yī)療機構、第三方檢驗機構或網(wǎng)絡平臺參與病情的咨詢、預約、診斷、治療等過程所產(chǎn)生的醫(yī)療數(shù)據(jù)。
- 健康監(jiān)測類:指基于移動物聯(lián)網(wǎng)對個人身體體征及日常行為進行監(jiān)測的生命體征類數(shù)據(jù),常被應用于慢性病患者的自我管理。
- 公共衛(wèi)生類:主要指區(qū)域性的醫(yī)療服務平臺、公共衛(wèi)生信息系統(tǒng)等產(chǎn)生的醫(yī)療數(shù)據(jù)。
- 定向生物醫(yī)學類:主要是關于新藥品研發(fā)、生物標本和基因測序的信息,多應用于個性診療、精準醫(yī)療、臨床藥物實驗等醫(yī)學研究。
由于這4類數(shù)據(jù)來源以及作用效果復雜,而且部分醫(yī)療數(shù)據(jù)帶有主觀性質(zhì),醫(yī)療信息存在明顯的階段性特征;再加之疾病的發(fā)生和發(fā)展過程及醫(yī)學影像、病理等信息有很強的時間維度屬性,床旁監(jiān)護等儀器產(chǎn)生的數(shù)據(jù)也具有很強的時效性;信息孤島、信息煙囪及疾病的多發(fā)性常導致醫(yī)療數(shù)據(jù)存在大量垃圾數(shù)據(jù),如常見病病情描述、慢性病患者的重復性檢查等,造成了醫(yī)療數(shù)據(jù)的冗余……
這些醫(yī)療大數(shù)據(jù)的典型特性也為其治理應用加大了難度。
2. 醫(yī)療數(shù)據(jù)孤島化嚴重且缺乏標準體系
健康界研究院發(fā)布的《中國智慧醫(yī)療2021十大發(fā)展趨勢預測》報告中指出,當前智慧醫(yī)療發(fā)展中,亟待需要破解院內(nèi)及院間的互聯(lián)互通實現(xiàn)難、數(shù)據(jù)質(zhì)量低兩個關鍵技術難題。
由于信息系統(tǒng)技術規(guī)范、基礎信息數(shù)據(jù)標準的不統(tǒng)一和缺失,直接導致了醫(yī)療數(shù)據(jù)質(zhì)量低的問題,如數(shù)據(jù)不完整,醫(yī)療記錄有斷點;信息用自然語言描述,自動化分析處理困難等,都導致這些數(shù)據(jù)無法最大化利用。
且醫(yī)院內(nèi)部系統(tǒng)集成受制于醫(yī)院系統(tǒng)多元異構,醫(yī)療數(shù)據(jù)普遍不能互通互認,這也加劇了醫(yī)療行業(yè)的“數(shù)據(jù)孤島”現(xiàn)象,數(shù)據(jù)跨平臺不能完全集成、互聯(lián)互通及共享,數(shù)據(jù)價值難以得到較大程度發(fā)揮。
然而,作為醫(yī)療機構高質(zhì)量發(fā)展的關鍵要素,無論是智慧醫(yī)院建設,還是信息化標準建設,都離不開對大數(shù)據(jù)的應用。而要破解醫(yī)療機構數(shù)據(jù)應用難題,就需要從源頭解決問題,通過數(shù)據(jù)治理,讓數(shù)據(jù)從不可控、不可用、不好用到可控、方便易用且能賦能業(yè)務。
二、醫(yī)療機構如何做好數(shù)據(jù)治理?
醫(yī)療機構進行數(shù)據(jù)治理的過程,就是對其數(shù)據(jù)資產(chǎn)進行管理和控制,支撐并保障數(shù)據(jù)被安全高效地交換與應用的過程。
下圖是可參考的醫(yī)療機構數(shù)據(jù)治理體系。我們接下來主要從6個核心環(huán)節(jié)來詳解醫(yī)療機構如何做好數(shù)據(jù)治理。
1. 環(huán)節(jié)一:設立數(shù)據(jù)治理組織結構
設計健全的數(shù)據(jù)治理組織結構,是全面開展數(shù)據(jù)治理工作的基礎。
醫(yī)療機構需要成立專門的數(shù)據(jù)治理或數(shù)據(jù)管理部門,完成流程和規(guī)范制訂、數(shù)據(jù)質(zhì)量保證和質(zhì)量控制、流程審批等工作,并對數(shù)據(jù)使用方和IT設施建設方進行管理。
目前,諸多醫(yī)院已經(jīng)專門成立了大數(shù)據(jù)部門承擔這項工作,也有醫(yī)院將這項工作放在信息科或病案管理室。
2. 環(huán)節(jié)二:制定數(shù)據(jù)相關流程規(guī)范
制定清晰的數(shù)據(jù)相關流程規(guī)范,有助于幫助實現(xiàn)以下目標:數(shù)據(jù)有明確和準確的定義;數(shù)據(jù)有明確的責任方;數(shù)據(jù)有清晰的存儲方式與合理的時間期限;數(shù)據(jù)加工方法明晰;數(shù)據(jù)訪問方式與控制明確;數(shù)據(jù)內(nèi)容符合標準要求與質(zhì)量要求。
醫(yī)療機構的數(shù)據(jù)規(guī)范,主要從下面這三個方面來制定。
1)信息規(guī)范
信息規(guī)范包含隱私、數(shù)據(jù)權限管控規(guī)范和質(zhì)量評估規(guī)范等。醫(yī)療機構需重點關注這一部分規(guī)范的建設,保障醫(yī)療數(shù)據(jù)合規(guī)。
2)數(shù)據(jù)規(guī)范
數(shù)據(jù)規(guī)范包括不同業(yè)務系統(tǒng),如電子病歷數(shù)據(jù)規(guī)范、醫(yī)院信息系統(tǒng)數(shù)據(jù)規(guī)范。對于數(shù)據(jù)整合過程和整合后的系統(tǒng)來說,需要主數(shù)據(jù)和元數(shù)據(jù)規(guī)范以及相關的數(shù)據(jù)質(zhì)量規(guī)范。
3)流程管理規(guī)范
流程管理規(guī)范規(guī)定了何人在何種應用場景下,通過何人的審批可以操作何種類型的數(shù)據(jù)。
相比數(shù)據(jù)采集、加工與存儲的流程,數(shù)據(jù)使用流程的制度管理更為重要,比如何種職責的科室和醫(yī)生在什么情形下可以導出數(shù)據(jù)、數(shù)據(jù)能否離院、應由哪一級來審批決定,這些都需要具體規(guī)定。除管理規(guī)范外,不同角色的人員如何協(xié)作互動完成既定的工作,也可通過制定流程支撐規(guī)范實現(xiàn)。
3. 環(huán)節(jié)三:搭建數(shù)據(jù)標準體系
要保證醫(yī)療機構各業(yè)務部門、系統(tǒng)間的數(shù)據(jù)的規(guī)范性、流通性和共享性,就要搭建統(tǒng)一的數(shù)據(jù)標準體系。
數(shù)據(jù)治理相關標準分為基礎性和應用性標準,包括數(shù)據(jù)定義與分類(元數(shù)據(jù))、主數(shù)據(jù)、參考數(shù)據(jù)(數(shù)據(jù)字典)、數(shù)據(jù)模型、管理與技術類、質(zhì)量評估類等內(nèi)容。數(shù)據(jù)治理工作組成員以及業(yè)務組人員可參考已有標準,并與現(xiàn)有醫(yī)療系統(tǒng)、業(yè)務流程相結合,開展醫(yī)療健康大數(shù)據(jù)標準體系的建立、實施、修改等工作。
目前,我國針對醫(yī)療大數(shù)據(jù)的相關技術標準正在逐步建立,國家衛(wèi)生健康委員會相繼出臺了多項管理制度,如2018年頒布的《關于印發(fā)大數(shù)據(jù)標準、安全和服務管理辦法(試行)的通知》國衛(wèi)規(guī)劃發(fā)[2018]23號,《關于印發(fā)全國醫(yī)院信息化建設標準與規(guī)范(試行)的通知》國衛(wèi)辦規(guī)劃發(fā)〔2018〕4號,《國家衛(wèi)生健康委辦公廳關于印發(fā)全國醫(yī)院數(shù)據(jù)上報管理方案(試行)的通知》國衛(wèi)辦規(guī)劃函〔2019〕380號等文件,在醫(yī)療大數(shù)據(jù)采集、加工、存儲共享等方面進行了規(guī)范,充分發(fā)揮了標準化在醫(yī)療數(shù)據(jù)治理、應用和發(fā)展過程中的引領作用。
4. 環(huán)節(jié)四:元數(shù)據(jù)管理
針對醫(yī)院信息系統(tǒng)中存在的數(shù)據(jù)模式描述文檔不全、系統(tǒng)之間數(shù)據(jù)關聯(lián)不清晰、系統(tǒng)值域標準不統(tǒng)一等問題,進行元數(shù)據(jù)管理,是獲取業(yè)務系統(tǒng)中數(shù)據(jù)的含義,輔助數(shù)據(jù)理解,增加分析的敏捷的重要手段。
與其他領域相比,醫(yī)療領域的元數(shù)據(jù)規(guī)范相對比較成熟。
如原衛(wèi)生部頒布的《國家衛(wèi)生計生委辦公廳關于印發(fā)住院病案首頁數(shù)據(jù)填寫質(zhì)量規(guī)范(暫行)和住院病案首頁數(shù)據(jù)質(zhì)量管理與控制指標(2016版)的通知》(國衛(wèi)辦醫(yī)發(fā)〔2016〕24號)、《病歷書寫規(guī)范》(衛(wèi)醫(yī)政發(fā)〔2010〕11號)、《電子病歷基本規(guī)范》(衛(wèi)醫(yī)政發(fā)〔2010〕24號)、《衛(wèi)生信息基本數(shù)據(jù)集編制規(guī)范》(WS 370-2012)、《衛(wèi)生管理基本數(shù)據(jù)集》(WS374-2012)與《電子病歷基本架構與數(shù)據(jù)標準》(衛(wèi)辦發(fā)〔2009〕130號)等。
在數(shù)據(jù)值編碼標準方面,國際上有疾病分類編碼ICD-10、手術操作編碼ICD-9以及SNOMED術語庫,國內(nèi)有國家標準《衛(wèi)生機構(組織)分類與代碼表》(WS2182002)、《社會保險藥品分類與代碼》(LD/T90-2012)和《中醫(yī)病證分類與代碼》(GB/T15657-1995)。
然而,在使用過程中,這些標準會根據(jù)應用進行不同程度的刪減和擴充,甚至出現(xiàn)錯誤的使用。因此,基于標準建立一個元數(shù)據(jù)管理系統(tǒng),可方便地在標準上擴充,并可以關聯(lián)不同的應用。
元數(shù)據(jù)管理系統(tǒng)主要由采集層、標準層、分析層和應用接口層組成。采集層從各種醫(yī)療信息系統(tǒng)內(nèi)獲取元數(shù)據(jù),查看元數(shù)據(jù)的變化和更新。標準層保存了元數(shù)據(jù)的標識信息、內(nèi)容信息與模式信息等。由于醫(yī)院信息系統(tǒng)各異,標準層實現(xiàn)了將元數(shù)據(jù)映射到標準集合以及將不同的元數(shù)據(jù)進行互操作的功能。
分析層主要提供了對元數(shù)據(jù)的管理、分析與查詢。元數(shù)據(jù)庫與數(shù)據(jù)源存在對應關系,當用戶通過統(tǒng)一入口提交查詢服務時,可以根據(jù)元數(shù)據(jù)庫提供的特征找到對應的信息資源,重組之后呈現(xiàn)給用戶。因此,應用接口層除了提供元數(shù)據(jù)訪問的限制和保護外,同時還服務于各個應用程序。
5. 環(huán)節(jié)五:主數(shù)據(jù)管理
在構建主數(shù)據(jù)管理庫時,首先需要從多個異構的業(yè)務子系統(tǒng)中以ETL的方式抽取關鍵數(shù)據(jù),然后,利用元數(shù)據(jù)庫對其中的編碼、描述進行標準化。
接著,由于多個業(yè)務系統(tǒng)的數(shù)據(jù)可能不一致,還需要通過匹配算法完成對數(shù)據(jù)的錯誤消除和信息融合。對于匹配不到的孤立信息,要加以監(jiān)控跟蹤,進行人工處理。同時,以增量學習的方式不斷改進匹配算法。最后,將歸整好的主數(shù)據(jù)信息存入主數(shù)據(jù)庫。
醫(yī)療數(shù)據(jù)的主數(shù)據(jù)主要有病人信息和醫(yī)生信息兩類。
以病人信息為例,病人的出生年月、性別等信息在各系統(tǒng)中都有,但由于醫(yī)院信息系統(tǒng)是從身份證讀取的信息,因而相比其他系統(tǒng)采用人工錄入的方式來說更準確。
然而,病人的血型信息通常在實驗室信息管理系統(tǒng)中是更準確的,甚至可能在門診/急診工作站中也沒有這些信息。通過主數(shù)據(jù)管理系統(tǒng),可以從各系統(tǒng)中分別獲取信息,根據(jù)可靠性、一致率等進行信息校驗融合,最后形成該病人的完備信息,然后再將完備信息下發(fā)到各業(yè)務系統(tǒng)。
此外,在多家醫(yī)院之間實現(xiàn)主數(shù)據(jù)共同管理之后,還可以打通醫(yī)院之間的信息壁壘。若患者在A醫(yī)院診斷出患有某慢性病,當他下次去B醫(yī)院就診時,醫(yī)生也能快速得知該患者的這個信息,從而使就診更高效、更準確。
6. 環(huán)節(jié)六:數(shù)據(jù)質(zhì)量管理
醫(yī)療數(shù)據(jù)質(zhì)量問題主要來源于3個方面。
- 原始信息采集有誤差。在醫(yī)療系統(tǒng)內(nèi)數(shù)據(jù)采集主要通過手工方式錄入,在醫(yī)生或護士輸入信息的過程中,可能會有意或無意地將數(shù)據(jù)錯誤引入系統(tǒng)。
- 數(shù)據(jù)融合過程發(fā)生問題。在對不同來源的數(shù)據(jù)進行融合時,數(shù)據(jù)格式和語義可能會有誤差或不一致,導致融合結果有錯。
- 與數(shù)據(jù)的應用場景不匹配。例如,如果要進行病例統(tǒng)計,現(xiàn)有臨床電子病歷數(shù)據(jù)就能滿足統(tǒng)計場景的需求。但如果要做大腸癌療效分析,現(xiàn)有臨床電子病歷數(shù)據(jù)就難以滿足分析場景的要求,還需補充病理數(shù)據(jù)。
所以,對數(shù)據(jù)質(zhì)量的管控,主要從三個方面來進行:數(shù)據(jù)質(zhì)量實時監(jiān)控、數(shù)據(jù)質(zhì)量評估以及數(shù)據(jù)自動修正。
1)數(shù)據(jù)質(zhì)量實時監(jiān)控
主要針對從業(yè)務系統(tǒng)抽取的或是從外部傳送的接口數(shù)據(jù),通常從及時性、有效性和完整性等幾個指標監(jiān)測接口內(nèi)容本身的數(shù)據(jù)質(zhì)量問題,還需要對采集程序進行監(jiān)控,如接口采集程序是否正常啟動、是否正常結束等。
2)數(shù)據(jù)質(zhì)量評估
是指對融合后的數(shù)據(jù)進行質(zhì)量評估。首先從確定評價對象和范圍著手,然后選取數(shù)據(jù)質(zhì)量維度及評價標準,確定質(zhì)量測度及評價方法,之后按照配置的評估指標執(zhí)行評估,產(chǎn)生權重化的評估結果,最后生成質(zhì)量結果和報告。
3)數(shù)據(jù)自動修正
是指對于有錯誤或不一致的數(shù)據(jù),部分數(shù)據(jù)可以進行自動化的探測和更正。例如,時間的表達可以是DD/MM/YY,也可以是YY/MM/DD,可以通過智能算法探測原始系統(tǒng)的表達方式,制定映射規(guī)則,實現(xiàn)日期格式的一致性。
三、小結
經(jīng)過30多年醫(yī)療信息化建設,醫(yī)療機構的數(shù)據(jù)量及其復雜性連年攀升,醫(yī)療行業(yè)的關注焦點已經(jīng)從信息系統(tǒng)建設延伸到了數(shù)據(jù)資源管理和利用。
而要實現(xiàn)數(shù)據(jù)資源的有效利用,數(shù)據(jù)治理是關鍵環(huán)節(jié)。只有做好數(shù)據(jù)治理,讓數(shù)據(jù)應用有效支撐醫(yī)院發(fā)展,才能進一步提高醫(yī)院管理水平,實現(xiàn)數(shù)據(jù)對醫(yī)療業(yè)務發(fā)展的價值賦能。
本文由@ 數(shù)據(jù)分析獅 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自Unsplash, 基于CC0協(xié)議。
拋開技術和硬性的行業(yè)要求來看,醫(yī)院的大小、級別、信息化建設的時間等等因素導致大量生產(chǎn)系統(tǒng)需要改造。
醫(yī)院或醫(yī)療部門的負責人對這方面的認識、認知、精力的傾斜都會對醫(yī)療行業(yè)數(shù)據(jù)治理有非常大影響。
只有做好數(shù)據(jù)治理,讓數(shù)據(jù)應用有效支撐醫(yī)院發(fā)展,才能進一步提高醫(yī)院管理水平,實現(xiàn)數(shù)據(jù)對醫(yī)療業(yè)務發(fā)展的價值賦能。