SNOMED發展歷程
1974年,SNOMED第壹版問世,由44587個詞條、6個模塊構成。SNOMED的範疇包括解剖學、形態學、正常與非正常的功能、癥狀及疾病體癥、化學制品、藥品、酶及其他體蛋白、活有機體、物理因素、空間關系、職業、社會環境、疾病/診斷和操作。SNOMED的每壹個術語(詞條)均有壹個編碼與之對應,在疾病/診斷軸內,很多疾病概念還提供了與其他術語的交叉參照關系。1998年,SNOMED演進到3.5版,包括156965個詞條和壓縮過的12個模塊。
近年來,美國國家醫學圖書館與美國病理學會(CAP)簽署了關於使用SNOMED CT的協議書,允許在美國推廣使用SNOMED CT,並且允許壹些組織在國內免費使用SNOMED CT。
英國國民健康保險制度(NHS)也與美國病理學會***同成立了SNOMED CT標準發展組織 (SNOMED CT SDO)用於推動並規範SNOMED CT的使用。
1997年發行的3.4版是中文譯本的原版。中文SNOMED電子版是中文SNOMED 3.4版的電子化產品,含145856個詞條,並且建立起3.2萬個詞條與ICD-9-CM的對照關系。之所以與英文版的詞條數目(146217)不同,是因為兩種語言本身存在的差異(例如同義詞)。它分為11個模塊,其層次結構通過該詞條代碼的樹型構造表達。每個詞條的內容包括: 編碼、中文名、英文名、類別符、層次、與該詞條相關的外部編碼、ICD-9-CM碼、藥品編碼、藥廠編碼、酶編碼及SNOMED相關詞條的交叉參照列表。
SNOMED CT 的概念與構成
SNOMED RT (Systematized Nomenclature of Human and Veterinary Medicine
reference Terminology) 是為了滿足醫學信息處理的廣泛要求,在SNOMED 3.6版基礎上加入了新的設計理念,於2000年面世的。SNOMED RT定義了概念(Concepts)和關系(Relationships)的集合,提供了通用的參考標準,用於全面的醫療保健信息的比較與聚合處理。
SNOMED CT是SNOMED RT的衍生物,於2002年面世。它在SNOMED RT定義的概念中加入了編碼、關系、描述、層面等內容,使之更加清晰完備。SNOMED CT所包含的概念並沒有大幅度增長,大量增長的是描述與關系。其中,描述由2002年1月發布時的40萬條發展到如今的90余萬條,關系則由近80萬條發展到近146萬條。
因此,SNOMED CT由概念(Concepts)、概念ID、描述(Descriptions)、屬性(Attributes)、層面(Hierarchies)、關系(Relationships)(關系又分為IS-A關系與屬性關系)構成。其中,概念、描述、關系是SNOMED CT的核心構件。
1. 概念、描述與層面
SMOMED CT不再使用詞條表的方式對術語進行表示,而是采用概念的形式。概念以理解為醫學中標準的臨床術語,每個概念都有惟壹的概念碼,但每壹個概念都可能有多個描述,並且由993420條描述形成了龐大的描述表――我們可以理解成同義詞表。如“Pain in throat”(咽喉痛),在SMOMED CT中是概念,而在實際應用中,它將會有多種不同的術語表達,如“Sore throat”、“Throat pain”、“Pain in pharynx”、“Throat discomfort”、“Pharyngeal pain”、“Throat soreness”,但它們並不是概念,而只作為描述被收集在描述表中。每壹條概念有若幹描述與之對應,描述表中的每壹條描述也有與之相對應的概念存在。
SMOMED CT不再使用“軸”或“模塊”來劃分術語,而是定義了18個層面(Hiera-rchies),用18個層面區分366170條概念。
實際應用中,上述18個層面中還有細分,如“人體結構”這壹層面中又有細分為“形態學上的反常結構”,下面的列表所示為以壹組解剖病理學中所使用的概念與概念所在層次舉例。
2. 關系
SMOMED CT中的概念與概念間是有壹定“關系”存在的。概念有36萬條,但關系有近146萬條。這種基於概念間的語義關系令數據的獲取充分可靠。在SNOMED CT中,關系分為兩種: IS-A關系與屬性關系。
IS-A在同壹個層面中,表示某些概念間的關系。如關節炎屬於關節系統疾病,而關節系統疾病屬於骨科疾病,這樣關節炎→關節系統疾病→骨科疾病就形成了壹種IS-A關系;
屬性關系表示跨層面的概念間的關系,如“闌尾炎”是壹種疾病,但從形態學上看,“闌尾炎”屬於炎癥的壹種,在屬性關聯中,可由“闌尾炎”引導出“炎癥”。
3. 屬性
在SNOMED CT中,每壹條概念都有若幹種屬性用於準確具體表示概念。同壹層面中的概念的屬性類型是相同的。以臨床表現為例,在臨床表現中的概念的屬性為: 發現部位、聯合詞(如: 之後、導致、因為)、形態學、嚴重程度、發作情況、過程、情景、解釋、病理學、事件等。
SNOMED與本體論
本體(Ontology)是關於概念和概念之間關系的形式化描述系統,在此指形式化的(即可以被機器所處理的)、對***享概念的精確詳細的說明和描述,壹般包括概念的使用類型及約束條件。本體提供了信息交互各方在特定領域的***同知識背景,常用於作為特定領域中可被計算機理解、應用的知識模型,包括領域中的概念、屬性及其相互關系。
SNOMED 是從術語表演進而來,仍然處於不斷的發展與變化之中。當前SNOMED的發展方向和方法學正在走向醫學本體研究與表達,RIM的框架和復雜關系的表達,加上SNOMED多年來在臨床應用受控詞表的經驗,預示著醫學知識本體研究將會有重大進展,而UML(Unified Modeling Language,統壹建模語言)將是重要工具。
SNOMED CT已經成為美國最重要的醫學受控詞表,36萬條的概念與146萬條關系形成了醫學領域本體,反映的是醫學領域理論與本質上的事實。
應用現狀與前景
1.在臨床信息系統中的應用
目前,受控詞表(CMV)在醫學信息交換中位於數據處理的核心地位,它緊緊包裹在臨床數據庫外,臨床信息系統將通過壹系列引擎與受控詞表相連接,從而形成可交互的、能夠保障病人安全協作醫療服務與監控的突發公衛事件系統、電子病歷(EMR)系統、ICU監測系統、臨床診斷支持系統、用藥觀察研究、臨床試驗系統、醫囑處理系統、疾病監測系統、影像學及社區人群健康服務等系統,方便數據挖掘與決策分析。
2.SMOMED CT與UMLS
SNOMED為UMLS(Unified Medical Language System,統壹醫學語言系統)提供醫學術語詞條開始於2004年1月。UMLS是醫學術語研究的重要課題。SNOMED為UMLS提供了最為廣泛和最為重要的醫學術語,是UMLS所包含的多個術語集之壹。UMLS的主要角色是提供多用途的電子化醫學詞典,它使得許多不同源術語集中的相同語義擁有標準格式成為可能。
3.SMOMED CT在醫藥學中的作用
在美國國家醫學圖書館編制的臨床藥學標準術語RxNorm 中,SNOMED CT在公眾領域可以提供壹些特殊的藥品概念與編碼信息。SMOMED CT與RxNorm都可以應用於藥品信息系統。
4.SMOMED CT與英國國民健康信息基礎架構(NHII)
英國制訂的國民健康信息基礎架構(NHII)的目標之壹是: 無論何時何地,讓需要且有權使用電子病歷的人能夠使用,並且以保障其隱私權為前提。為了實現這個目標,NHII參考並采用了壹系列現有衛生信息標準。在消息標準方面,采用了如HL7、DICOM、IEEE、X12N、NCPDP等; 在術語標準中,有LOINC、ICD-9CM、UMLS、SNOMED等。
5.SMOMED CT與其他標準間的映射
SMOMED CT與其他標準間的映射是非常重要的。無論是在美國或英國,SNOMED CT 均在努力完成與其他標準的映射,如ICD-9-CM、ICD-10、ICF等。最初的映射壹般是簡單易行,但後期的基於規則的映射則更顯重要。這些映射的合理性將在實踐中加以檢驗。可以看到,SNOMED CT已經成為國際上使用廣泛的臨床術語標準,更多的研究將涉及其在醫學信息系統中的使用以及與其他醫學標準的映射。(作者單位: 北京協和醫院信息中心)