版权归原作者所有,如有侵权,请联系我们

[科普中国]-医院数据处理

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

医学统计学是运用数理统计和概率论的原理,结合医院实际针对医学数据资料进行收集、整理、分析和推断的学科,是医院科研与实践的重要工具,贯穿于以现代科学试验方法为基础的医学研究随着计算机技术在社会生活各个领域的广泛应的整个过程之中。1

医院数据处理即统计信息的加工,是指将业务系统产生的原始数据按照统计主题,按不同的维和定义好的粒度进行统计运算得到信息;处理部分按照一定的统计方法对原始数据完成统计信息的生成和存储。

通常采用两种处理方式:

(1)单一数据的求和运算:将单一的原始数据累加起来得到统计信息,大粒度的统计信息就可以通过其包含的小粒度的统计信息中数据累加得到。如月出院人数可以通过日出院人数得到。通过这种运算得到的统计信息在不考虑查询速度时只保存小粒度的统计信息。

(2)多项数据运算:这种运算用到2项或2项以上的数据,如医疗效率中的平均住院日(平均住院日=住院总天数/出院人数)用到了出院人数和住院总天数两项数据。这种运算得到的大粒度信息和小粒度信息没有函数关系,也就是从小粒度信息推算不出大粒度的信息。因此在保存时要分别保存。2

系统目标在医院业务信息系统的基础上建立比较完善的统计分析系统,为院长决策提供科学依据。

(一)建立全面反映医院运行状况的统计报表体系:该体系要建立起常规的、固定的、自动化的统计系统,在日常业务系统产生的数据的基础上,统计生成各种管理指标信息,满足日常的统计工作需要。

(二)建立为特定管理目的进行专题数据分析的支持系统:在医院日常工作中,经常会围绕着管理的特定需要,提出一些数据统计分析要求。这些要求不能直接从常规的统计报表得到,而需要进行专门的统计分析。2

系统特征信息的多层次按照深度,可以将医院对统计信息的需求分为如下几个层次。

1.动态的原始数据**:**如危重患者情况、新人院患者等,直接取自于业务过程中的原始数据,无需特殊的统计处理,管理层通过它了解最关心的医院动态情况。

**2.日常的统计报表:**是统计分析系统的重点。人们通过统计报表了解当前医院运行的总体状况,与历史情况进行对比,预测未来发展趋势。从时间上,统计报表可以分为日报、周报、月报等;从内容上,统计报表一般包括医疗数质量统计、收入统计、成本统计等能概括医院运行情况的主要方面。统计报表具有相对的固定性,具有固定的统计项目、固定的数据来源和统计方法、固定的格式,便于管理者掌握其内容和与历史数据进行比较。报表应主题明确,每张报表围绕一个主题展开,报表中的各项统计指标准确翔实。

**3.数据分析:**是围绕特定的主题,深层次利用数据,具有较大的随机性,其信息很难以常规的报表形式固定下来,一般只能反映一段时间内统计值的横向变化。要想多侧面反映统计值的变化或者反映数据之间的关系,就需要特定的数据分析。

我们应用数据仓库技术。该技术是一种用于分析的数据库,是将原始的操作数据进行各种处理并转换成综合信息,用联机分析工具对这些信息进行多方位的分析。用户利用数据仓库和联机分析处理技术可以实现对数据多维分析、向下探察分析和变化趋势分析等;掌握各个层次的数据并和前期或同期的数据作对比;分析数据的变化趋势,发现问题,分析产生的原因;辅助决策是对数据更高层次的利用,它需要处理大量的数据来发现数据中隐藏的规律,预测数据的变化。辅助决策的实现不仅要利用数据仓库和联机分析处理技术,还要用到数据挖掘技术。例如,我们要提高门诊发药的速度,首先要查询出用量最大的药,把药摆放在离发药窗口近的地方。进一步我们可分析每一张门诊处方,发现哪两种药或哪几种药出现在同一张处方中的概率大,就可将这几种药摆放在相邻的地方方便药师取药。这种高级分析就要用数据挖掘技术。数据挖掘从数据库中识别出有效的、新颖的、具有潜在效用的并最终可理解的信息。通过这些技术用户可以得到预测性结果,为管理的决策提供科学依据。2

信息的多维性在医院统计中,除了一些时候需要统计指标的全院汇总值外,很多情况下需要统计指标与某些统计的相关因素。如各科室的医疗效率指标、各种费别的医疗收入情况、医疗收入随时间的变化等。这里的相关因素或者影响统计信息的变量就是统计上的维。医院统计关心的维很多,常见的有科室、患者费别、时间、费用分类等。大多数的医院统计报表就是根据这些常见的维变量来展开的。以收入统计为例,收入统计信息中有很多相关的因素,如科室、时间和患者费别等,每个收入事实由特定的科室、特定的时间和特定的病人费别组成。我们可以根据需要,分别选择科室、时间、费别统计与其收入的关系。统计报表是两维结构。一般在横向展示各种统计指标,在纵向展示统计变量。也就是说,一般的统计报表表现的是统计指标与一维变量之间的关系,这样的报表容易阅读理解。但也有些情况下,需要了解统计指标与多维变量之间的关系,如不同科室的不同费别患者的医疗收入情况。要表现这样的关系,或者需要将费别展开到横向维上,或者需要分别通过多张报表反映不同费别的情况。2

用户的多层性统计信息的使用者包括院领导、各职能部门领导、科室主任和统计员等。统计信息一般可以分成院、部、科室个层次来分别满足不同用户的需要。统计人员要掌握各个层次的数据并要进行深入的数据分析工作,完成数据的深层次的利用。院级统计信息是全院各类数据的概括,数据量不大,但其中信息是可以简明扼要地概括医院的运行状况。医院领导在日常工作中主要关心院级的各种信息,如全院的医疗、收入和成本信息,在总体上掌握医院的运行状况。职能部级的统计信息,不仅包括部门工作状况的概要信息,而且也包括其管辖单位的各项细目数据。各职能部门包括医疗、药材和器械等部门。这些部门的领导和工作人员通过查询职能部级的统计信息,直接掌握整个部门的工作状况。科室统计信息反映科室工作状况,主要包括本科室的医疗、收入和成本三个方面的信息。

因为科室统计信息只统计本科室的信息,就是说不包括科室维,这样就可以用更多的其他维来统计数据,如患者费别和时间等。各科室领导查询并了解科室一级信息中的本科室信息,可以在科室管理中做到心中有数;也可以查询其他科室信息,并和本科室做对比,发现差距以改进和加强这方面工作。2

历史数据服务器统计报表只能表面地反映医院的运行状况。用户经常有些特殊的查询要求,如某一时间段内有哪些科室的患者有重复住院(出院当天又入院)等情况。要满足用户的这些特殊查询,要深入发现数据背后的问题就要进行数据分析,建立数据分析环境,进行数据分析需要查询大量的数据,如果直接在业务系统使用的数据库中存储大量历史数据并进行数据分析操作,将占用大量的服务器的磁盘资源和CPU资源,影响业务系统运行的效率。所以要做好数据处理分析工作就必须建立专用的历史数据服务器。

服务器特点①数据量巨大:一个1500张床位、日门诊4000人次的医院,信息系统产生的数据用0racle存储每年增长达5G左右。

②用户少:进行数据分析的用户主要是统计分析人员,一般情况下只有一两个联机用户,在高峰时可达几百个。

③速度要求相对较低:能在5秒内对用户的大部分分析要求做出反应。

④主要业务是查询操作:历史数据服务器中数据极少进行数据删除和修改,只是定期加载在用服务器的数据,平时只满足分析人员查询需要。2

历史数据的加载历史数据的加载不是简单地将在用系统中数据移动到历史数据服务器上,而是在移动过程中要进行数据格式化处理,通过客户端编写应用程序来完成数据移动。这种人机交互式分析处理方式,保证在用系统的数据完整、准确地移动到历史隶属数据服务器。其缺点是客户机和服务器间存在着大量的数据交换,执行过程较慢。2

分析工具BusinessObjects是一个集查询、报表和OLAP技术为一体的智能决策支持系统。它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种平台(所有Windows平台及Unix平台)和多种数据库(Oracle、Sybase、MicrosoftSQLserver、DB2、dBase、Access等),同时还支持Intemet/Intranet,可以通过WWW进行查询、报表和分析决策。2

发展方向目前,我国大部分医院已建立了基本的医院信息系统来辅助事务管理,且随着计算机信息技术特别是联机事务处理(On LineTransactionProcessing,OLTP)、数据库技术等的快速发展,医院信息系统对信息的生成、存储、传输和管理等数据的操作处理已十分成熟有效,成为医院科学管理和提高医疗服务水平的有力手段。但医院业务系统及其数据保存格式主要是面向流程设计的事务处理,而不是面向分析管理,因此很难根据现有数据和信息进行深度挖掘,不能从海量数据中提取潜在知识,辅助医院管理者的决策,加强医院的管理水平。

在此情况下,使用数据仓库技术建立医院数据分析平台来帮助医院科学地管理,综合统一地使用各业务系统中分散的数据,以及分析和利用已积累的每年不断增加的大量数据,成为当前信息化建设的一个新的发展方向。3