產品干貨:?醫療大數據平臺建設實踐

1 評論 7241 瀏覽 69 收藏 29 分鐘

編輯導語:這篇文章通過分析醫療大數據平臺的背景和市場現狀,從醫療大數據不同類型的應用和場景、大數據平臺產品建設實踐、醫療數據中臺產品的未來規劃這三個方面向我們講述了醫療大數據平臺的建設理論和相關知識,希望對你有所幫助。

一、背景和市場現狀

在過去的2010-2020的十年里,國內大力投資于醫療系統信息化建設,產生并積累了大量醫療數據,迫切需要通過人工智能及大數據等技術來挖掘和實現數據價值,需要整合更加先進的技術基礎設施以更有效的方式進行數據集成、數據標準化以及數據分析,最終實現醫療大數據更有效的應用。2020年新冠疫情爆發進一步推動了國內醫療健康產業的數字革命,AI、大數據、數字孿生等技術與醫療健康產業不斷結合,促使醫療健康產業對于數據的利用又上了一個新的臺階。

同時,來自不同方面的要素也在推動著醫療大數據產品市場的發展。醫院方面,公立醫院轉型壓力與日俱增,需要引入數字化醫療管理解決方案發揮電子病歷(EMR)的潛力以提高臨床研究效率、降低人工成本、提高疾病診斷和治療質量、更好地管理病人。

醫院正逐漸推出創新業務模式,注重學術研究、臨床治療、轉化醫學及患者管理,推升了對醫療數據集成及應用的需求;許多大型三甲醫院已引入先進醫療系統以提升醫院管理效率,緩解中國醫療資源的短缺和分配不均。政府投資將進一步流入醫院細分市場,支持其繼續升級系統,提升與多個監管機構平臺的數據互連性。

區域衛健方面,經過全民信息健康平臺的初步建設,積累了大量的數據,這些數據如何產生更大的應用價值,如何在區域里面互聯互認,如何跨區域互聯互認方面有明確的需求。醫保局方面,管理每年數萬億的醫?!稿X袋子」,對于如何使用數據來更好地管理醫保基金有強烈的需求。疾控方面,隨著全球疫情的頻繁爆發,如何使用數據來更加快速、精準的進行疫情風險的管控有強烈的需求。

從市場情況來看,根據相關調研報告,中國是2019年世界第二大醫療市場,國內醫療大數據解決方案整體市場規模將從2019年的105億元增至2024年的577億元,復合年增長率達40.5%[1]。

產品干貨:?醫療大數據平臺建設實踐

二、場景和需求分析

我們可以從數據流轉的方向分析醫療大數據不同類型的應用和場景。在醫療行業,絕大部分數據產生于醫療機構內,例如我們去醫院的檢驗、檢查、門診、住院、醫保結算等數據都在醫院里面產生,數據最直接的流轉是在醫療機構內流動。除了醫院使用數據以外,數據也會通過數據上報或者采集的形式流動到對應的政府機構,包括、衛健委、醫保局以及疾控中心等。

因此,醫療大數據平臺面向的主要場景括醫療機構(各類公立、民營的醫院和醫療集團)、衛健委、疾控中心和醫保局。對于不同的場景,其數據的處理方式會存在一些差異。下面按照四個場景進行分析。

1. 醫療機構場景

在醫療健康大數據與電子病歷評級等政策的強驅動下,各級醫院對于醫療大數據平臺的采購有比較切實的需求。信息化程度高的三級醫院(尤其是三甲)出于電子病歷評級、科研論文發表與臨床應用的需求來使用大數據平臺 。對于醫院來說,在數據治理和使用方面以下三個問題[2]。

產品干貨:?醫療大數據平臺建設實踐

  1. 數據質量有待提高,需要加強數據標準化。從醫院業務系統直接產生的原生數據,往往是不符合數據應用的模型標準。所以需要使用對應的數據平臺將原始數據加工和處理成符合數據應用所需要的標準模型。
  2. 院內系統數據壁壘未破除, 院外系統數據饑渴,需加強數據共享。在醫院內不同的子醫院或者不同的科室之間系統和數據存在壁壘,院內數據共享和互通程度低,缺少統一的數據平臺。
  3. 線上線下醫療數據持續增長,海量數據等待挖掘與利用。隨著數據的大量增長使用傳統的平臺和工具已經不能夠滿足大數據下的數據挖掘和利用了。需要采取更加先進的技術和理念。

2. 區域衛健場景

在2016年,國家發布了《國務院辦公廳關于促進和規范健康醫療大數據應用發展的指導意見》明確要實施全民健康保障信息化工程,要全面建成互通共享的國家、省、市、縣四級人口健康信息平臺。

同年,國家衛生計生委規劃與信息司和國家衛生計生委統計信息中心發布了《省統籌區人口健康信息平臺應用功能指引》明確了全面健康信息平臺的核心功能,其中明確要建設數據采集交換、數據規范上報、大數據應用支撐和健康檔案服務等內容。2020年國家衛健委發布了醫院信息互聯互通標準化成熟度評測方案。

產品干貨:?醫療大數據平臺建設實踐

目前區域衛健的全民健康信息平臺各地都有一些基礎的建設,例如三大庫數據完成了一輪采集、有了初步的協同服務、也有了一些例如綜合監管和健康檔案的數據應用。但整體來看也存在部分問題。

  1. 數據使用時數據質量不高。數據采集之后沒有形成業務應用的數據標準,數據治理缺乏深度,數據處于誰使用誰治理的階段。
  2. 協同服務層面,雖然開通了部分共享服務接口,但是新接口的擴展還需要再次付費開發,缺少服務的整體配置和數據服務的業務化。
  3. 數據準備周太長導致數據應用比較少。一方面缺少統一面向數據應用的標準,一方面缺少統一的數據平臺工具,開發一款數據應用數據準備的周期很長,缺少對應的數據準備、開發的工具和數據開發、數據治理的最佳實踐。

針對以上問題,醫療大數據平臺應該解決的問題主要有三點:數據治理、數據協同和更快的數據洞察。

產品干貨:?醫療大數據平臺建設實踐

3. 疾控中心場景

新冠疫情的爆發在疾控場景開辟了數據應用的新戰場,也讓醫療健康行業對數據應用走向了新的階段。例如我們每天的健康碼、核酸檢測、疫苗以及在醫院的就診都會產生大量的數據,這些數據需要在疾控中心和衛健委等系統中進行上報、集成、標準化、治理、匹配融合等等數據加工操作,這些操作都是對應的大數據平臺上進行。

在疾控場景下,數據的處理和應用有獨特的特點。

  1. 數據來源更多源。疫情防控中需要融合多種來源的數據,需要解決不同來源的數據標準不統一的問題。
  2. 對數據實時性要求高。疫情的防控朝夕必爭,是對數據實效性要求非常高的場景。很多來源的數據需要在分鐘級別完成數據的獲取,完成多源數據的融合以及對外提供快速、高效的數據查詢接口。對于大數據處理的引擎和效率有更高的要求。
  3. 需要更快、更準、更智能的數據洞察和分析。疫情防控中對于數據的需求不光是更快的融合,更需要從數據中更快的獲取到蘊含在數據中的洞察。另外,在防疫這種需要快速決策和響應的場景,這些數據洞察要盡可能地準確。對于大量多源數據的融合和分析,需要借助更加智能的能力,例如AI算法模型,才可以讓數據的洞察更加快速、準確和智能。例如,在疾控場景下基于AI算法模型的數據分析洞察和疫情檢測預警。

4. 醫保場景

2018年5月31日,國家醫療保障局正式掛牌。2020年7月國家醫療保障局印發了《醫療保障信息平臺數據歸集技術規范》等四部規范的通知,其中《醫療保障信息平臺數據中臺建設及應用指南》中將數據中臺的建設標準規范進行了詳細的定義。建設內容包括醫保數據數倉建設、數據的歸集建設,數據模型管理、數據質量管理、數據共享管理、數據分析等服務的建設。

相對于醫療機構、區域和疾控等醫療場景,由于國家醫保局的統一規劃,醫保信息平臺和大數據平臺的建設更為靠前,在建設指南出臺前期就有阿里、騰訊等互聯網公司參與了建設指南的輸出,從指南的名字包含”數據中臺”可以看到有互聯網公司大數據平臺建設的印記,建設的范圍和模式跟互聯網公司的大數據平臺更加貼緊。因此,在醫保大數據平臺這個賽道,對于互聯網公司更為有利。

對于省級醫保數據中臺的建設,主要的需求有以下幾點:

  1. 業務應用和數據中臺分開建設。《建設指南》中明確要求14個業務子系統國家統一下發,數據中臺由各個省自行建設。
  2. 匯集醫保業務全部新老數據形成高質量數據資產。由于業務和數據中臺同時建設,業務數據會有歷史數據和增量數據標準不統一的情況,醫保數據中臺需要統一存儲、管理和處理歷史數據和增量數據。
  3. 數據治理和上報標準化、需要緊貼國家考核要求。由于在新的建設方案下各省業務系統數據結構統一,省級通過數據中臺將數據上報到國家,國家會使用統一的規則進行數據質量的評分,因此數據的治理和上報都需要標準化。省級數據中臺的數據質控需要跟國家對齊,保證本省數據上報合規。
  4. 面向主題的、分層的數據倉庫建設,賦能數據應用。在醫保數據中臺建設指南中,國家醫保局給出了一些業務主題的劃分,也明確了醫保數據倉庫建模的一些規范。因此,省級醫保數據中臺需要支持數據倉庫、數據主題的統一建設,方便上層數據應用的數據調用。

三、產品建設實踐

1. 產品洞察分析

基于以上四大目標場景的分析,我們可以得出以下洞察和的對應的產品和服務方案。

(1)四大場景基礎的數據治理場景類似,上層的數據應用存在場景化差異

在以上四個不同的場景里面整體的需求有相似、相通之處,可以總結為底層的大數據引擎、醫療數據治理層,數據應用支撐和上層的數據應用部分。

數據治理及以下部分的功能類似,針對不同的場景內容和配置的方式可能有差異。例如,數據倉庫建模的工具是可以復用的,數據質控平臺的工具是可以復用的,數據加工的工作流工具也是可以復用的,但是針對不同的場景數據建模的方法、數據質控的內容、數據加工的流轉邏輯是有差異的。

上層的數據應用部分,因為都是針對了具體的場景,都有自己的不同之處。例如,醫保場景有基金收支洞察,醫院和區域衛健場景有健康檔案,疾控場景有重點人群管控等。這些應用基于數據的應用,那使用的數據還是底層治理的數據,因此對于上層應用部分可以結合下層的數據和一些應用搭建工具來組裝,當然部分應用還需要定制化的開發。通過數據服務模塊和可視化的報表搭建工具可以完成一些數據應用的快速開發和配置。

因此,整個醫療大數據產品的產品矩陣分為四個部分:大數據引擎、醫療數據治理套件、數據應用支撐、數據應用。

產品干貨:?醫療大數據平臺建設實踐

(2)大部分醫療機構缺乏數據相關的人力儲備,需要提供產品+內置規則+服務的模式

在以上的四個場景中,絕大部分醫療機構都沒有數據部門。部分醫院逐漸的開始在信息科中有一些做數據開發和分析的角色,而其他運用主體都沒有對應角色的人來操作大數據的平臺。在這種情況下,運用主體需要的產品不光是平臺和工具,而是基于平臺和工具的場景化數據服務。有一個形象的比喻叫做『交鑰匙工程』。提供數據質控工具只是服務的一部分,提供數據治理服務和提升數據治理效果才更契合實際需求。

因此,提供平臺以外的基于不同場景下的內容以及對于數據的長期運營和服務。例如醫保場景下我們要提供醫保數據接入、質控、上報的工作流模板,這些模板需要生態合作伙伴商協調完成配置,并持續的運營。隨著信息化、云化的深入滲透,部分醫院開始組建對應的數據運營團隊,部分醫美和私立醫院逐步采用了公有云模式。政府也在成立相關的數據運營公司來運營醫療數據,未來醫療數據運營也會逐步的標準化,服務化,需要提供基于業務的數據加工功能和模板的沉淀,讓運營團隊可以低成本的運營。

(3)抽象醫療數據處理流程,使之產品化

既然要提供大數據平臺+規則+服務的模式,通用的大數據平臺提供的主要是代碼和流程的編輯工具,對于醫療數據規則的積累無法很好的產品化。將醫療數據處理的的過程抽象成可配置化的、面向場景的醫療數據處理步驟是一個不錯的方案。從更直觀的角度來看,可以把這種配置叫做醫療數據加工的算子,每一個算子不單單是通用的數據過濾、數據關聯等操作,而是一個有業務含義的數據處理過程。

例如,把數據質控抽象成一個算子,在工作流中配置一個算子就可以完成整個表的質控;將患者主索引抽象成一個算子,配置患者主索引算子就可以完成主索引數據合并的配置;將醫保數據轉碼抽象成一個算子,在工作流中用一個算子就可以完成醫保數據從地方碼轉換為國家標準編碼。這種經過抽象過的可視化配置算子一方面在產品層面沉淀了醫療數據處理的方法,一方面降低了產品的實施和維護成本。

(4)一體化的大數據平臺

由于醫療數據的處理基于上游的數據采集標準和面向數據應用的數據應用標準。標準的變動會影響到數據處理流程全鏈路的變動,例如標準變更以后對應的數據模型表、數據工作流、數據指標、展示層的BI報表都需要做一些變更。

在這種情況下,割裂的數據平臺和工具會帶來很高的數據治理和運維成本,為醫療數據的使用套上不必要的枷鎖。因此,提供一體化的大數據平臺可以更有效地降低數據治理和運維成本。例如數據標準的變更可以借助于數據資產計算的血緣關系,自動通知到下游的數據工作流、數據指標和報表的變更,進一步降低數據治理的成本,提高數據的可用性。

2. 核心模塊功能特性

基于以上的分析和在具體項目中的實踐,醫療數據中臺提供了四層產品,分別是以下模塊。

(1)大數據處理引擎層

大數據處理引擎:騰訊集團已經有比較成熟的大數據能力和平臺產品套件,包括云Spark、Flink、Hive、數據湖基礎能力。

(2)醫療數據治理套件

數據工作流:將醫療數據處理抽象成具體的可視化配置算子(例如數據質控算子、患者主索引算子、醫保轉碼算子等),通過表和算子的向導配置完成數據工作流的組裝,同時基于TBDS調度和任務運行的能力,生成對應的Spark、Shell、HiveSQL任務下發到TBDS執行。

另外,針對數據工作流提供了更加全面和細致的監控功能。例如每個算子每次實例的數據條數,每個算子的任務運行狀態等。內容沉淀方面,針對具體場景沉淀數據工作流的模板,方便后期在具體項目實施中一鍵配置。

產品干貨:?醫療大數據平臺建設實踐

標準管理平臺:提供了醫療數據標準的管理和維護能力。跟下游的數據工作流、數據質控打通。定義好的數據標準可以直接用于質控規則的生成,避免多次配置,保證規則的一致性。內容沉淀方面,沉淀具體場景下的數據標準,積累各類醫學數據標準。

數據質量平臺:跟數據標準和數據工作流打通。建表后自動創建默認的質量規則,同時提供多種規則模板。配置的質控規則可以在數據工作流中用算子的方式調用,讓數據質控可以在工作流的任何節點以任何頻率發起。

同時,由于醫療場景下的很多數據都不是直接去讀業務的備庫,是有專門的廠商整理好數據到前置機,然后再從前置機同步數據,勢必會造成數據的不一致,所以數據的一致性對賬尤為重要。因此,數據質量平臺提供了從數據接入對賬、到數據接入趨勢監控到醫療機構質量評分三個階段的數據質量保障。

產品干貨:?醫療大數據平臺建設實踐

根據標準自動生成的質控規則配置

在數據質控的展現層面提供面向不同場景的質控Dashboard,做到一份質控數據根據場景的需要按照不同方式展示。內容沉淀方面,沉淀和內置面向場景的質控規則。例如,國家醫保的數據質控規則。

產品干貨:?醫療大數據平臺建設實踐

醫療機構場景下源表-接入表對賬監控

產品干貨:?醫療大數據平臺建設實踐

疾控場景下源表-接入表對賬監控

數據資產平臺:通過從數據工作流、指標管理平臺、數據服務平臺中獲取元數據,通過元數據的計算來生成全鏈路的血緣關系。為數據變更影響分析提供有利的依據。同時,數據資產基于不同的場景提供資產的分類,沉淀場景化的數據資產目錄。

指標管理平臺:指標管理平臺提供原子指標、維度、衍生指標的定義。同時指標的運行會跟數據工作流互通。指標管理平臺的核心在于沉淀各個場景下的常用指標。例如,結合醫保數據倉庫,沉淀醫保運行檢測等數據應用的指標。

(3)數據應用支撐層

數據服務平臺:數據服務平臺處理提供最常見的數據查詢服務以外,也提供了醫療場景下常用的XML數據寫入服務,支持共享文檔等內容可以通過數據服務的方式進行配置。同時,數據資產也可以采集到數據服務的內容,可以分析潛在的數據變更對數據服務的影響。另外,數據服務平臺作為數據應用的開發方式之一,沉淀了健康檔案等數據應用常用的數據查詢服務。

數據可視化平臺:數據可視化平臺包括數據分析平臺和3D可視化數字孿生平臺。數據可視化平臺結合醫療數據中臺的能力,提供了政府監管、醫療運營分析可視化等模板。3D可視化數字孿生平臺基于領先的3D可視化能力,結合醫療數據中臺的數據和智能的AI算法,提供了醫療場景下3D的可視化產品能力。

產品干貨:?醫療大數據平臺建設實踐

(4)數據應用層

數據應用面向不同的場景,結合數據應用支撐層開發面向行業的數據應用。例如360患者瀏覽器、醫?;鹗罩Ф床斓?。

四、未來規劃

當前醫療數據中臺產品已經在大型醫有一些項目在逐步落地,隨著項目的落地產品的能力也在逐漸的補全。未來的產品規劃大概會從以下幾個方面發力:

  1. 提升產品標準化能力。由于在醫療大數據賽道積累時間不算很長,有些產品功能存在項目的定制,對于類似的產品能力需要把能沉淀成功能的沉淀成面向場景的功能,根據不同的場景配置會提供不同的功能,進一步把能力做成可配置化、標準化,提升產品的標準化能力。
  2. 交付和實施標準化。在產品標準化的同時,根據項目中實踐的積累,沉淀出交付標準化的能力,上架對應的標準交付包。除了安裝、部署的標準化之外,不同場景下的數據采集規范、醫療健康數據倉庫建模規范、醫療數據指標配置都可以沉淀成標準產品的能力和標準的交付實施工作。將這些交付工作標準化,進一步減少自研能力的投入,培養更多的醫療數據交付和運營人才。
  3. 引入更符合場景和更先進的技術能力,增加產品的適用性。醫療行業的在大數據方面使用的技術跟互聯網行業還有比較大的差距,在某些場景下數據量也在暴增,數據更新和查詢的需求非常的突出,但是計算資源又投入不多。所以在這種場景下一方面要引入互聯網行業里面成熟的、靠前的技術,另外一方面也需要根據醫療行業特有的情況做評估。例如,目前在醫保的場景下嘗試數據湖來解決數據更新的問題,在疾控的場景下引入ClickHouse來滿足更快的查詢服務。
  4. 完善產品的生態體系。醫療大數據平臺的建設牽扯的流程比較長,參與的角色也比較多,在產品的交付、實施中引入生態合作伙伴可以降低產品規?;桓兜某杀尽A硗?,醫療大數據最終服務的還是面向業務的數據應用,業務的應用是偏向于定制化、多元化的。因此,需要引入面向業務應用的合作伙伴,讓大數據平臺更加的開放,讓合作伙伴也可以一起加入數據應用的開發才能更長久、健康地保障產品的成長。
  5. 加強產品在醫療數據安全方面的建設。醫療數據關系到患者的眾多敏感信息,對于數據敏感性、安全性要求更高。因此,平臺遵循國家衛健印發的《國家健康醫療大數據標準、安全和服務管理辦法(試行)》進行產品的建設,內置符合醫療數據的分類分級產品功能模塊,根據不同的數據分級做針對性的脫敏處理和權限審批處理,保障醫療數據的安全使用。

參考資料:

[1,2] 安信證券.從醫渡科技赴港上市看醫療大數據解決方案行業潛力如何?

 

作者:jayshi,騰訊CSIG產品;公眾號:騰訊大講堂

本文由 @騰訊大講堂 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 文章從醫療大數據平臺的背景和市場現狀,再到使用場景類型,具體建設時間及未來發展,都有作者自己獨到的思考。

    來自江蘇 回復