醫療衛生信息基礎知識解析
作為醫療行業的產品經理,需要對醫療相關知識有一定的了解。本文對醫療衛生信息基礎知識進行了解析,希望對你有所幫助。
一、醫療衛生信息標準認知
1. 基礎介紹
標準是通過標準化活動,按照規定的程序經協商一致制定,為各種活動或其結果提供規則、指南或特性,供共同使用和重復使用的文件。
2. 標準類型
在標準體系模型中,按照標準的適用范圍或級別,可以分為國家標準、行業標準、地方標準、企業標準。其中在GB/T 20000.1-2014中對規范文件進行了相關說明,指規范用于規定產品、過程或服務應滿足的技術要求的文件,可以是標準的一個部分或標準以外的其他標準化文件。標準文件類型分為:國家標準、行業標準、地方標準、團體標準與規范性文件,具體介紹如下:
3.?標準分類
目前,國內沒有醫療健康信息標準的分類規范,國外不同的標準組織對醫療健康信息標準的分類方式也不一樣。
在2009年原國家衛生部衛生信息標準化專業委員會提出信息標準體系架構圖上,將衛生信息標準分類為:
基礎類標準、數據類標準、技術類標準、安全類標準、管理類標準,這也是目前國內通常引用的衛生信息標準分類,具體介紹如下:
- 基礎類標準:信息模型、醫學術語、標識、體系框架;
- 數據類標準:數據元與元數據、分類與編碼、數據集、共享文檔規范;
- 技術類標準:功能規范、技術規范、傳輸與交換;
- 安全類標準:信息安全、隱私保護;
- 管理類標準:建設指南、測試評價、運維管理、監理驗收。
結合信息標準體系架構與實際標準的發布情況,目前元數據服務中信息標準文件的分為12類,具體介紹如下:
醫療衛生信息標準分類圖
4. 標準性質
《標準化法》第二條規定:國家標準分為強制性標準、推薦性標準,行業標準、地方標準是推薦性標準。《行業標準管理辦法》第四條規定:行業標準分為強制性標準和推薦性標準,相關標識如下:國家標準:GB為強制性標準,GB/T為推薦性標準,GB/Z為指導性標準。衛生行業標準:WS為強制性標準,WS/T為推薦性標準。
5. 標準狀態
標準狀態分為現行、廢止。
二、醫療衛生信息標準之數據元
1. 數據元概念
數據元概念(data element concept DEC)是能以一個數據元的形式表示的概念,其描述與任何特定表示法無關。一個數據元概念由對象類和特性組成。如下圖左側:
2. 數據元組成
數據元是一組屬性規定定義、標識、表示和允許值的數據單元。數據單元是信息的基本單位,例如住院病案首頁中的病案號、姓名、入院診斷、主要診斷等都是基本的數據單元,為數據單元賦予屬性就稱為數據元。
數據元的目的是建立標準化的數據表達、采集、存儲和傳輸格式,以實現數據的正確表達和理解。
在一定語境下,構建一個語義正確、獨立且無歧義的特定概念語義的信息單元,同時可理解為數據的基本單元。數據元是衛生信息的最基本的結構化(標準)單元,每一項醫療衛生業務信息都可由若干數據元組成,例如一張標準格式的病案首頁就由100多個數據元組成。圍繞一定業務主題形成的數據元集合稱為數據集,數據元的實際應用通常是以基本數據集的形式實現的。
一個數據元由數據元概念和表示組成,其中表示描述數據的形式,包括值域、數據類型、表示類(可選的),必要時還包括計量單位。如下圖右側:
示例一:數據概念+值域;
【數據元】黃疸部位代碼表
【數據概念】黃疸部位,黃疸是對象詞,部位是特性詞。
【值域】代碼表是表示詞。
示例二:數據概念+計量單位;
【數據元】兒童體檢年齡(月)。
【數據概念】兒童體檢,兒童是對象詞,體檢是特性詞。
【值域】年齡(月)是表示詞。
3. 數據元基本模型
數據元的基本模型是由數據元概念和數據元兩部分組成。
4. 數據元概念與數據元關系
一個數據元由數據元概念和表示組成。
一個數元概念對應多個數據元。
5. 對象
對象類是可以對其界限和含義進行明確的標識,且特性和行為遵循相同規則的觀念、抽象概念或現實世界中事物的集合。
它是我們希望采集和存儲數據的事物。對象類是概念,在面向對象的模型中與類相對應,在實體-關系模型中與實體對應,
例如,患者、醫生、衛生機構等。對象類可能是一般概念。當對象類所對應的對象集有兩個或多個元素時,就是一般概念。患者、醫生、衛生機構等都是一般概念對象類也可以是個別概念。
當對象類對應的對象集僅有一個元素時,就是個別概念,例如“北京市醫療機構”就是個別概念。
6. 特性
特性是一個對象類的所有成員所共有的特征。它用來區別和描述對象,是對象類的特征,但不一定是本質特征,它們構成對象類的內涵。特性也是概念,對應于面向對象模型或實體-關系模型中的屬性。
例如身高、體重、血壓、脈搏、血型等。特性也可是一般概念或個別概念。作為個別概念的例子有:病床總數或醫療收入。
衛生健康信息數據元是衛生這一特定領域的數據元,它的概念和結構遵循通用數據元的概念和結構,但具有自身的特點。醫藥衛生領域包括基礎醫學、臨床醫學、公共衛生、中醫藥學等多個專業,其數據元的表現形式復雜,例如數字人體、醫學影像、基因圖譜、中醫經絡等,除具有通用數據元的屬性外,還具有其鮮明的領域特殊性。
7. 數據類型與表示符
8. 數據元值的表示格式中字符含義描述規則
9. 數據元值的表示格式中字符長度描述規則
應用示例:
示例1:S字符型
AN10 固定為10個字符(相當于5個漢字)長度的字符。
AN..10 可變長度,最大為10個字符長度的字符。
AN4..10 可變長度,最小為4個最大為10個字符長度的字符。
AN..20X3可變長度,最多3行每行最大長度為20個字符長度的字符。
示例2:N數字型
N4固定長度為4位的數字。
N..4最大長度為4位的數字。
N6,2最大長度為6位的十進制小數格式(包括小數點),小數點后保留2位數字。
示例3:T日期時間型
T8采YYYYMMDD格式(8位定長)顯示年月日。
T15采用YYYYMMDDThhmmss格式(15位定長)表示日時分秒。時分秒之前加大寫字母“T。
如2010年1月5日8時10分9秒為20100105T081009。
資料參考:
WS/T 303-2023 衛生健康信息數據元標準化規則
WS/T 363.2-2023 衛生健康信息數據元目錄 第2部分:標識
三、醫療健康信息標準之值域
1. 值域基本模型
值域的基本模型由概念域和值域兩部分組成,一個概念域對應多個值域。
2. 值域
值域(vale domain,VD)是允許值的集合。一個允許值是某個值和該值的值含義的組合。該關聯含義稱為值含義。值域是一個或多個數據元有效值的集合,用于在信息系統和數據交換中確認數據的有效性。它也是描述一個數據元的元數據的必要構成部分。特別是,值域是數據元所表示的數據內容、形式和結構的指南。
值域有兩種(非互斥的)子類:
可枚舉值域:由允許值列表規定的值域;
一個可枚舉值域是包含了它的所有值及值含義的一個列表,例如:患者血型類別代碼。
不可枚舉值域:由描述規定的值域。
一個不可枚舉值域是由一個描述來規定。不可枚舉值域的描述須準確描述屬于該值域的允許值。例如,“傳染病死亡率”數據元的值域是大于等于0且小于等于1的實數。
描述數據有時需要計量單位。例如描述血壓的值域記錄時,為了準確理解值含義,需要使用計量單位moHg或kPa: 年齡值域記錄的計量單位可使用年、月、周、日:血糖值域記錄的計量單位可以是mg/d或mmol/L。所以,計量單位與值域關聯。
3. 概念域
概念的外延構成了概念域,一個概念域是一個值含義集合。一個概念域的內涵是它的值含義。概念域也有兩種(非互斥的)子類:
一可枚舉概念域:由值含義列表規定的概念域:一不可枚舉概念域:由描述規定的概念域。可枚舉概念域的值含義可以明確地列舉。該類型概念域對應于可枚舉類型的值域,例如:
不可枚舉概念域的值含義由“不可枚舉概念域描述規則”來表述。該規則描述了不可枚舉值域中允許值的含義。這種類型的概念域對應于不可枚舉類型的值域,例如:
如果一個計量單位的任何量可以轉化為另一種計量單位下等同的量,則這些計量單位彼此之間是等價的。所有等價的計量單位被認為具有相同的維。例如,長度計量單位(米,厘米等)具有相同的維,年齡計量單位(年、月、周、日) 具有相同的維。所以,維與概念域關聯。
四、醫療衛生信息標準之數據集
在衛生領域信息化的快速發展過程中,積累了大量來自于不同系統、不同機構的異構數據資源。伴隨著對這些數據資源進行整合與交流的需求不斷增長,數據集這一數據組織方式得到了應用和推廣。
1. 數據集
具有一定主題,可以標識并被計算機處理的數據集合,旨在為相關業務數據的登記提供一套術語規范、定義明確、語義語境無歧義的標準,數據元是衛生信息的最基本的結構化(標準)單元,每一項醫療衛生業務信息都可由若干數據元組成,例如一張標準格式的病案首頁就由100多個數據元組成。圍繞一定業務主題形成的數據元集合稱為數據集,數據元的實際應用通常是以基本數據集的形式實現的。
主題:圍繞著某一項特定任務或活動進行數據規劃和設計時,對其內容進行的系統歸納和描述。通常數據集主題應具有劃分性和層級性。劃分性是指主題間可通過不同的命名,將相同屬性的主題歸并在一起形成相同的類,將不同屬性的主題區分開形成不同的類;層級性是指主題可被劃分成若干子主題或子子主題。
可標識:指能通過規范的名稱和標識符等對數據集進行標記,以供識別。標識與名稱的取值需要通過具體的命名或編碼規則來規范。
能被計算機處理:指可以通過計算機技術(軟硬件、網絡),對數據集內容進行發布、交換、管理和算機系統中以數值、日期、字符、圖像等不同的類型表達。
數據集合:指由按照數據元所形成的若干數據記錄所構成的集合。例如,病案首頁數據集由主索引、基本信息、診斷信息、入出院信息、手術信息、費用信息等不同數據組成。
2. 衛生健康信息數據集
衛生健康信息數據集是在衛生健康領域,為滿足政府衛生決策、業務處理、科學研究、信息發布與績效評價等需求,按照數據集概念設計、歸納、整合的主題信息集合。衛生健康領域的數據集主要可以
歸納為三個方面:
- 信息發布類統計數據集:如中國衛生健康統計年鑒中衛生機構設置及規模、衛生人員資源的地區分布、衛生經費的籌集及分配等數據集,各類衛生機構的統計月報、年報,以及滿足某一專項統計需求通過統計收集、歸納、整理、報告形成的數據集。例如:衛生統計指標。
- 業務系統建設類的基本數據集:包括醫療服務、公共衛生、藥品供應、醫療保障、衛生管理等領域為了滿足業務信息系統規范化建設和領域內部以及領域間數據交換與共享需求,設計歸納的各個子系統(或者功能模塊)所包含的最小數據元素的集合。如:兒童出生登記、個人健康檔案、住院病人入出轉、居民死亡登記報告電子病歷基本數據集 、疾病管理基本數據集等數據集。
- 為滿足特定目的收集整理制作的數據集:包括通過調查、觀察、監測、檢測、試驗、實驗等方式獲取的滿足科學研究、業務咨詢或衛生服務決策等需求的數據集。如:近年來國家投入建設的國家人口健康科學數據集、衛生服務調查數據集、疾病及危險因素調查等內容的數據集。
五、醫療衛生信息標準之指標集、統計指標、分類方案
1. 指標集
指標集有一組統計指標組成,目的是衡量特定部門或地區提供、改善服務的情況。
例如,《全國醫院上報數據統計分析指標集 (試行)》目的是為加強醫院上報數據的分析和應用;
《病案管理質量控制指標(2021年版)》、腫瘤專業質量控制指標(2023年版)等,目的是為進一步加強醫療質量管理,規范臨床診療行為,促進醫療服務的標準化、同質化。
2. 衛生統計指標
衛生統計指標(indicators of health statistics ,IHS)是反映一定時期、一定地區居民健康狀況、健康影響因素、公共衛生服務、醫療服務、藥品與材料供應保障、醫療保障、衛生資源和計劃生育的統計指標。通過對衛生統計指標值的分析,可以:
- 了解人群的健康狀況、衛生系統績效及健康影響因素的現狀;
- 可以監測人群健康整體目標的實現進程,為衛生健康政策制定和資源分配等提供支持;
- 為公共衛生政策制定和實施有效的疾病防控措施提供依據;
- 對衛生干預效果進行評估。
3. 分類方案
分類方案是根據對象具有的共同特征將對象進行排列或劃分成組的描述性信息。分類方案是一般是一種官方術語系統,得到國家或國際機構的認可和認可,用于對數據進行分類。
如疾病分類與代碼、手術/操作分類與代碼、職業分類與代碼等。分類方案項是分類方案的內容項,它可以是分類或本體中的一個節點,敘詞表中的一個術語等。
值域是信息層面的數據,分類方案業務層面的數據。通常情況下,分類方案為值域提供相關業務參考,是值域的一個組成部分。但某種情況下,分類方案可以直接被數據元所使用。如分類方案“疾病分類與代碼(ICD-10)“等分類系統得到行業的一致認同與使用。如數據元“疾病診斷代碼”可以直接連接到分類方案“疾病分類與代碼”。
六、醫療衛生信息標準之元數據
1. 數據元的元數據總體模型
數據元的元數據總體模型由概念層和表示層兩個部分組成。概念層包括數據元概念類和概念域類。這兩種類都表示概念。表示層包括數據元類和值域類。這兩種類都表示數據值的容器。
數據元的元數據總體模型
可以給出4個類(數據元、多個數據元、值域、數據元概念)的若干基本事實:
- 一個數據元是一個數據元概念和一個值域的結合體;
- 多個數據元可以共享相同數據元概念,這意味著一個數據元概念可以用多個不同方式表示。例如,患者入院時間是一個數據元概念,它可以有多個表示方法,例如用YYYYMMDD表示患者入院的年月日,如果需表示小時和分,則用YYYYMMDDhhmm表示?!盎颊咝詣e代碼-英文全稱”、“患者性別代碼-1位字母代碼”共享同一個數據元概念患者性別。
- 多個數據元可以共享相同的表示,這意味著一個值域可以被不同數據元重復利用。例如,“住院病人結算費用-元(人民幣)”和“門急診就診費用-元(人民幣)”數據元共享相同的值域“費用-元(人民幣)”。
- 值域不是必然與一個數據元關聯,可以單獨管理:
- 不同值域所有允許值所對應的值含義都相同時,這些值域在概念上是等價的,因此,對應相同的概念域。例如,前述關于性別的值域:性別代碼-1位數字、性別代碼-英文全稱及性別代碼-1位字母代碼的允許值所對應的值含義相同,均表示“男性、女性、未知的性別、未說明的性別”。所以這些值域對應同一個概念域“性別”。
- 不同值域部分允許值所對應的值含義相同時,這些值域在概念上是相關的,因此,在包含有其各自概念域的概念體系中共享一個由共同的值含義構成的概念域。例如,性別代碼-符號的允許值是“♂和♀”,分別表示“男性和女性”。無其他符號表示“未知的性別”和“未說明的性別”,那么性別代碼-符號與性別代碼-1位數字、性別代碼-英文全稱及性別代碼-1位字母代碼值域在概念上相關,共享由共同的值含義“男性和女性”構成的概念域“性別”。
- 一個數據元概念僅與一個概念域相關,因此共享相同數據元概念的所有數據元共享概念上相關的表示。例如,“新生兒體重-N5,2(千克)”和“新生兒體重-N4(克)”是兩個不同的數據元,共享一個數據元概念新生兒體重。兩個數據元的表示在概念上是相關的,共享概念域“體重”。千克和克都是重量的計量單位,稱具有相同的維度。因此計量單位與值域相關,維度與概念域相關。
- 許多數據元概念可以共享相同的概念域。例如,患者體重和新生兒體重是兩個不同的數據元概念,共享一個概念域“體重”。
2. 元數據概念
元數據(Metadata)是描述其它數據的數據(data about other data),或者說是用于提供某種資源的有關信息的結構數據。元數據是描述信息資源或數據等對象的數據,其使用目的在于:識別資源;評價資源;追蹤資源在使用過程中的變化;實現簡單高效地管理大量網絡化數據;實現信息資源的有效發現、查找、一體化組織和對使用資源的有效管理。對元數據不了解的可看這邊書《元數據:用數據的數據管理你的世界》[美]杰弗里·波梅蘭茨。
3. 元數據管理模型
元數據管理是領域內數據類標準的數字化呈現,可提升醫療數據的準確性、一致性和互操作性。這對醫療健康數據,數據的治理至關重要。所有在設計醫療健康相關產品的數據就要有這個思維,也要這也去實施。
本文由 @牙周炎先生 原創發布于人人都是產品經理。未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!