怎樣從臟亂差的醫療大數據中提取價值(一)

0 評論 10057 瀏覽 37 收藏 11 分鐘

編輯導語:隨著醫療衛生信息化建設進程的不斷加快,醫療數據的類型和規模也在以前所未有的速度迅猛增長。大數據時代,學會分析數據并且將其應用至工作中,不僅可以節省時間,提高效率,還能提取其中的價值,為醫生和患者提供便利。

一、醫療大數據的背景

迫切的需求:

  • 缺乏統一整體的頂層設計:以HIS為核心的堆疊式建設,醫院整體信息化的擴展性較差,很難適應后續的信息化發展;
  • 臨床應用深度不夠:實現醫院以臨床為中心、為患者提供優良的醫療服務,實現全面準確的臨床醫療信息源,提高醫療質量和服務水平;
  • 缺乏運營精細化的支撐:沒有形成資源的集中統一管理,未建立醫院人財物的一體化管理;
  • 缺乏全院的數據整合、數據利用率較低:數據的利用率較低,沒有對臨床和管理起到支撐;
  • 信息系統間交互耦合度過高:基于HIS系統的一體化設計,耦合度較高;數據集中存儲,帶來系統升級和數據安全等問題;
  • 數據標準規范性問題:缺乏全院的數據標準規范,系統間數據共享率低。

二、醫療大數據的來源

1. 病人就醫過程中產生的數據

從掛號開始便將個人姓名、年齡、住址、電話等信息輸入系統;面診過程中病患的身體狀況、醫療影像等信息也會被錄入系統;看病結束以后,費用信息、報銷信息、醫保使用情況等信息被添加到醫院的系統里面。

這就是醫療大數據最基礎、最龐大的原始數據資源。

2. 臨床醫療研究和實驗室數據

臨床和實驗室數據整合在一起,使得醫療機構面臨的數據增長非???,一張普通CT圖像含有大約150 MB的數據,一個標準的病理圖則接近5 GB。

如果將這些數據量乘以人口數量和平均壽命,僅一個社區醫院累積的數據量就可達數萬億字節甚至數千萬億字節(PB)之多。

3. 制藥企業和生命科學

藥物研發所產生的數據是相當密集的,對于中小型的企業也在百億字節(TB)以上的。

在生命科學領域,隨著計算能力和基因測序能力逐步增加,美國哈佛醫學院個人基因組項目負責人詹森·鮑比就認為,到2015年,將會有5000萬人擁有個人基因圖譜,而一個基因組序列文件大小約為750MB。

4. 智能穿戴設備帶來的健康管理

隨著移動設備和移動互聯網的飛速發展,便攜式的可穿戴醫療設備正在普及,個體健康信息都將可以直接連入互聯網,由此將實現對個人健康數據隨時隨地的采集,而帶來的數據信息量將更是不可估量的。

三、醫療大數據的價值

1. 服務居民

居民健康指導服務系統,提供精準醫療、個性化健康保健指導,使居民能在醫院、社區及線上的服務保持連續性。妙健康提供了專業的醫生團隊,能夠在線幫助用戶解決各種病癥,進行健康指導。

居民也可以在其掌上藥房購買日常所需藥品,方便快捷。

2. 服務醫生

臨床決策支持,如用藥分析、藥品不良反應、疾病并發癥、治療效果相關性分析、抗生素應用分析;或是制定個性化治療方案。通過妙健康在線醫生,醫生可以在線進行相關的醫療指導,做出醫療診斷,還能夠有效減少門診量。

3. 服務科研

包括疾病診斷與預測、提高臨床試驗設計的統計工具和算法、臨床實驗數據的分析與處理等方面,如針對重大疾病識別疾病易感基因、極端表現人群、建立個人健康醫療檔案等。

個人健康醫療檔案的建立,能夠讓個人醫療信息共享,讓醫生能直接快捷地了解患者既往病史,避免了重復問診的現象,使患者能夠及時有效地接受治療。

4. 服務管理機構

規范性用藥評價;流行病、急病等預防干預及措施評價;公眾健康監測,臨床路徑的優化等。

5. 公眾健康服務

包括危及健康因素的監控與預警、網絡平臺、社區服務等方面。通過數據采集、風險評估、健康干預等方式來為客戶提供健康管理等一系列服務服務。

四、醫療大數據的現狀

1. 數據異構

多平臺,多種接口,數據類型沒有一個標準,只能是點對點的對接大量數據,內容冗雜、過程繁復、速度緩慢。

2. 主題分散性

就診信息分布在不同的平臺上,不能夠形成以患者為中心的所有電子化就診信息集成,不能提供完整、全面、準確、及時的患者臨床信息。

3. 數據量大

在大數據背景下,行業應用的數據量通常都以億級別計算,存儲通常在TB/PB級別甚至更多。

4. 數據多態

數據模型在數據出現之后才能確定,數據模型隨著數據量增長不斷演變。

五、建立醫療大數據資產目錄

依據衛生部信息化工作領導小組辦公室衛生部統計信息中心2011年3月發布的《基于電子病歷的醫院信息平臺建設技術解決方案——業務部分》所示:

1. 臨床服務域

包含12個二級類目:患者標識、患者服務、入出轉、醫囑、病歷文書、護理文書、檢驗、檢查、手術麻醉、治療、輸血、健康體檢,業務子域共計26個。

2. 醫院管理域

包含4個二級類目:醫療管理、人力資源管理、財務管理、物資及后勤服務管理。共有業務子域共26個。

3. 平臺應用域

包含5個二級類目:區域醫療協同、管理決策、臨床決策、公共衛生信息上報、患者公眾服務。共有業務子域20個。

根據臨床服務、醫院管理、平臺應用三域,梳理建設以業務活動為核心的數據資產目錄,根據業務活動主題梳理數據元標識符,保證每一個數據元的標識符具有唯一性(基本數據集:城鄉居民健康檔案、疾病管理、醫療服務、電子病歷等)。

1)數據元標識符“DE08.10.052.00”來源依據《TCHIA 7.3-2018 高血壓??齐娮硬v數據集 第3部分:高血壓門(急)診處方》

2)數據允許值“WS218–2002”來源依據《WS 218-2002 衛生機構(組織)分類與代碼》

六、從業務系統中抽取數據

關聯映射業務系統表字段,并創建調度任務,如圖五:

映射多表情況下,需要選擇關聯表主外鍵字段,如圖六:

調度任務可支持針對單表、全表,歷史數據抽取,實時數據監聽抽取倆種模式,如果圖七:

七、數據質量質控

具有對數據質量進行評估的完整的指標體系,至少應該有完整性(事件、表單、記錄、表項)、一致性(主數據一致性、邏輯一致性)、唯一性(無二義冗余、指標及計算口徑)、及時性、原始性、可溯源性及可測量性。

八、數據中臺建設

根據數據資產目錄快速定位業務主題,如圖八:

根據不同業務場景,自定義勾選數據元名稱,自動生成API或新的主題庫(數據集市)。

 

本文由 @CTO老王 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Pexels,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!