中国循证医学杂志

期刊导读

基于循证医学的电子病历资源整合与挖掘的宏观

来源:中国循证医学杂志 【在线投稿】 栏目:期刊导读 时间:2021-01-18

[关键词] [摘 要] 1 引言 作为医院信息管理系统(Hospital Information System,HIS)的重要组成部分,电子病历(Electronic Health Record,EHR)诞生伊始即被赋予了“共享病人完整信息、提供医疗提示和报警、提供医疗知识库支持”的公认内涵, [1] [2] 2 构建思路及目标 EHR本身即具有多样性、动态性、冗余性、时间性、多维性以及不完整性等特征, [3,4] 基于上述思路,在确保医疗机构EHR系统数据安全的前提下,可兼容各异质EHR系统,能够实现EHR数据共享与交换,适应循证医学医疗模式,融合国际、国家和区域性标准,满足各种数据挖掘需求的区域性或国家性资源整合与挖掘的平台模型是本研究的构建目标。 3 相关理论、标准与技术 电子病历信息资源整合与挖掘宏观模型的构建必须具有相关理论予以支持,必须遵循国内外相应的有关标准以保证系统的实用性与兼容性,必须通过相关技术予以实现。 3.1 相关理论 循证医学(Evidence-Based Medicine,EBM)是20世纪80年代才从医学实践中独立发展起来的一门新兴学科,也是一门极具生命力的基础理论研究科学。其核心思想就是充分利用客观的临床科学证据进行医疗决策,从而提高医疗质量。目前循证医学已被广泛应用于医学实践的各个领域,如医疗实践、临床科研、医院管理、医学教学等。 循证医学的实践模式与传统模式的差别是碰到问题后医生不仅仅是通过咨询专家、教科书等传统方式获取决策支持,而是要通过获取最新科研证据、最全临床证据方式获取决策证据,达到这一目标必须要有一个便捷、高效、权威、真实、客观的数据中心的支持,而EHR正是最直接、最真实、最客观的临床证据来源之一。EHR最终目标亦即EHR的高级阶段是高度共享和智能化、结构化、构建具有决策支持的国家性或区域性的基础和通用性EHR系统, [5-7] 3.2 相关标准 全球范围内的EHR系统历经40多年的建设与发展,但目前尚未有一个国家建成基础和通用的EHR系统, [6] 3.3 相关技术 本文采用数据中心模式构建EHR资源整合与挖掘模型,涉及的核心技术主要要有数据仓库、数据挖掘、XMLWebServices技术。 3.3.1 数据仓库 数据仓库(DateWarehouse,DW)是面向主题的、集成的、时变的、非易失的数据集合,用以支持决策制定过程。最根本的特点是物理地存放来源于其他数据库中的数据,需建立在一个较全面和完善的信息应用基础之上,用于支持决策分析。 [8] 模型构建拟利用数据仓库技术实现EHR资源整合与挖掘模型的数据库集成与源数据建设。 3.3.2 数据挖掘 数据挖掘(DataMining,DM)又称为数据库中的知识发现(Knowledge Discoveryin Database,KDD),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,获取有效的、新颖的、潜在有用的、最终可理解的模式的信息和知识的非平凡过程。它起源于多种学科,其中最重要的是数据库、机器学习和统计学三个领域。 数据挖掘技术主要有关联规则(Association Rule)发现、分类(Classification)、聚类(Clustering)分析、泛化(Generalization)和预测(Prediction)等;数据挖掘的主要方法有频繁项集和关联规则、决策树(Decision Tree)方法、贝叶斯(Bayesian)方法、人工神经网络(Artificial NeuralNetwork,ANN)等;常用的理论主要有模糊集合(FuzzySets)、粗糙集(RoughSets)理论、树立统计、机器学习(MachineLearning)、人工神经网络、决策树、模式识别(PatternRecognition)、高性能计算等等。 模型构建拟利用数据挖掘技术实现EHR资源整合与挖掘模型的数据挖掘与应用 XMLWebServices WebServices是一种基于透明标准体系的组件化松散耦合技术,其目标是实现不同系统间跨平台、跨编程语言的可互操作性。它是一个基于XML的可编程实体,提供一种特殊的功能元素,可以通过Internet标准,如XML和Http等来访问任何分布式的操作平台,实现应用的互相协同工作。 [9] [10] XMLWeb Services是分布式计算的重要标准,也是未来软件开发的技术趋势,通过XMLWeb Services标准,应用软件之间可以实现跨平台、跨编程语言的联接和互操作。作为微软平台的一个基本功能,基于XMLWebServices标准的.NET开发平台可以实现个人之间、个人与企业之间、企业之间的信息互连,满足人们可以随时随地存取和使用信息的需求。 模型构建拟利用该技术实现EHR资源整合与挖掘模型的数据结构化处理及数据交换,以实现语法互操作。 4 模型构建 目前,EHR资源整合与挖掘常用的模式主要有P2P、索引中心和数据中心三种模式。 [11] P2P模式常用于两个医疗单位间的点对点直接数据通信,对医疗单位的信息化程度要求比较高;索引中心模式通过索引数据库→信息源系统数据库方式实现数据查询与访问,但查询性能不高。P2P和索引中心两种模式都是直接访问医疗单位的EHR等信息源系统获取相关信息,其缺点是:① 对EHR等信息源系统安全威胁较大;② 对EHR等信息源系统资源占用较大;③ 无法支持数据挖掘等深层次的信息处理与共享应用等。而数据中心模式是指通过建立一个集中的数据集散中心,将来自各信息系统的数据进行数据清洗、转换、装载、集成,存储到中心数据库,并以一定的方式与各信息源进行数据同步,从而实现HER等信息源系统的信息资源整合、共享和再开发利用。基于上述分析,本文拟采用数据中心的模式进行EHR资源整合与挖掘的模型构建。 模型可分为四大模块:模块1是源数据模块,是数据仓库的数据源,主要来源于医疗机构的各种操作型信息系统数据库(如HIS系统、EHR系统、PACS系统、RIS系统等)、各种医疗数据文档以及其他相关数据;模块2是数据仓库管理模块,主要是通过数据仓库管理工具、各种规范标准及元数据库等,对模块1的源数据进行清洗、转换、装载、集成,并通过数据建模工具完成各种异质数据及数据结构的统一、规范;模块3是数据仓库,集成了经过标准化、规范化处理后的各种数据,并可根据具体需求建立各种数据集市;模块4是分析应用模块,通过Web Services层完成各种分析应用(如查询工具、C/S工具、OLAP工具、数据挖掘工具等)与数据仓库的数据传输请求。 本模型通过仓库管理模块将各种异质数据源集成于数据仓库中,并通过分析应用模块完成基于Web Services模式的终端应用,即可兼容不同时间、不同区域、不同标准、不同结构的各种源数据资源,避免重复建设和浪费资源,又可以通过各种个性化的工具实现对EHR相关资源的共享与应用,实现基础与通用的EHR系统建设目标。 5 结语 21世纪基于循证医学提供集成的个性化医疗服务已经成为了世界范围内的共识和目标,而这样的医疗服务也必然是建立在基于EBM的、完整的海量信息基础之上,基于EBM的EHR资源的整合与挖掘是实现这一目标的必然之路。但还有许多问题亟待研究解决,尤其是基于EBM信息需求和基于现代医学技术、信息网络技术不断发展的各种临床信息语义、语法及各类标准、规范的研究与制定,仍然是个漫长而艰辛的过程,必须在国家层面予以支持不断完善。 [参考文献] [1]Institute of Computer-Based Patient Record[M].Washington:National AcademyPress,1997:55-56. [2]JohnHalamka.电子病历与临床信息技术革命——美国的现状及深远影响[J].郑强等译.中华医学杂志,2005(22):1513-1515. [3]丁卫平,等.电子病历挖掘:概念、技术及应用[J].计算机工程与设计,2008(2):405-407,410. [4]丁卫平,等.基于频繁概念格的电子病历馆里规则挖掘研究[J].微电子学与计算机,2008(8):125-128,132. [5]李昊旻,等.电子病历与标准化和结构化[J].中国数字医学,2008(10):9-12. [6]徐勇勇,等.电子病历与临床信息标准[J].中华神经外科疾病研究杂志,2005(6):481-485. [7]邱国华.电子病历的临床规范[J].中国医学创新,2009(9):144-145. [8]邵峰晶,等.数据挖掘原理与算法[M].第二版北京:科学出版社,2009. [9]王伟,郑衍衡.基于Web服务的教委财务信息化管理平台的研究[J].计算机应用研究,2006(12):90-91. [10]王碹,李燕.应用WebServices构建多层架构的高效.NET应用 [M].北京:科学出版社,2005. [11]余本功,等.基于第三方的电子病历信息整合平台研究[J].计算机系统应用,2008(5):2-5,19. [中图分类号] [文献标志码] [文章编号] [基金项目] [作者简介] [收稿日期] [责任编辑]