您所在的位置:首页 > 方案中心 > 应用指南 > 实用点滴 >  医院信息系统建设实现7×24小时连续安全运行
医院信息系统建设实现7×24小时连续安全运行
  • 2010-01-19 17:20
  • 作者:金宪珊 许晓辉
  • 来源:e医疗

医院信息系统的安全可以分为数据安全和信息系统安全。其中,数据安全是指保证数据本身的安全,信息系统安全则涉及网络安全、服务器组安全、存储设备安全、操作系统安全、备份方案的可靠性、群集技术的可靠性等。医院信息系统必须一年365天、 每天24小时处于运行状态,这给医院信息系统建设提出很高的要求。

信息系统总体设计

信息系统建设要实现7×24小时连续安全运行,性能可靠,易于维护,信息系统要具有高可靠性。为保证信息系统连续稳定运行,杭州市中医院采用了两台高性能、高可靠性的小型机组成集群架构,以双机方式协同工作;杭州市中医院还采用2台HP rx6600服务器作为数据库服务器,利用Oracle 10G+RAC组成负载均衡集群系统,HP rx6600目前配置4个双核处理器;杭州市中医院采用EVA4100 磁盘柜组成集群系统,采用千兆以太网作为高速互连设备,解决数据库服务器与核心交换机之间的速度瓶颈;为了防止人为误操作而造成数据库无法正常启动,杭州市中医院采用了OracleDataGuard高可靠性数据库解决方案,建立一套备用数据库系统,作为生产数据库的备份数据库,系统自动的定期把生产数据库的log文件发送到备份数据库上,然后自动更新备份数据库。

负载均衡集群Oracle RAC

负载均衡集群的英文原文为L o a d Ba l a n c e Cluster,简称LB Cluster或者LB高扩展集群,是指以维持可接受性能的前提下处理不断提高的工作负载为目标的服务器集群技术。负载均衡集群主要使用在服务器以及中间件应用服务器中,用来提高信息系统的高性能、可扩展性与高可用性;在集群中增加服务器可以提升集群系统的处理能力,每个服务器的配置不要求完全一致。

Oracle Real Application Server,真正应用集群,简称Oracle RAC ,是Oracle的并行集群,位于不同服务器系统的Oracle实例同时访问同一个Oracle数据库,节点之间通过私有网络进行通信,所有的控制文件、联机日志和数据文件存放在共享的设备上,能够被集群中的所有节点同时读写。

Oracle RAC自身所具有的优势主要包括以下几点:

1. 高可用性

Oracle Real Application Clusters 提供一个高性能低成本的应用平台,支持所有类型的应用信息系统,无论是事务处理型应用还是分析型应用。所有应用共享同样的服务器和存储资源。故障容错和无缝切换功能,将硬件和软件错误造成的影响最小化,出现任何的服务器或磁盘故障,信息系统会自动重新接管发生故障的功能。这些对前端用户的完全透明的。同样,如果医院信息中心需要增加服务器或改变其他组件的配置也不会影响到应用系统。RAC与传统的双机热备方式切换时间的对比,见表1。

2. 高性能

Oracle Real Application Clusters保持着TPC-C的记录,达到每分钟 118万个事务的处理能力以及只有$5.52 每tpmC的成本。在3000 GB的 TPC-H数据仓库Benchmark 测试中,Oracle RAC同样保持性价比的领先地位,保证我们的用户能够达到更好更快的ROI。这仅仅是Oracle保持的多项Benchmark 记录中的最近的一些指标。

3. 按需扩充

医院现有信息系统可能是基于当前的工作负载构建的,当应用规模需要扩充时(支持更多的数据或应用),可以通过增加一台或多台低成本的服务器来扩充医院应用信息系统的处理能力,满足应用需求。

此外,Oracle RAC的优点还包括多节点负载均衡、通过并执行技术提高事务响应时间以及通过横向扩展提高每秒交易数和连接数。

Oracle RAC的缺点主要包括:相对单机,管理更复杂,要求更高;在信息系统规划设计较差时性能甚至不如单节点;可能会增加软件成本。

数据库备份方案Oracle DataGuard

Oracle DataGuard高可靠性数据库是定位与容灾的一种解决方案,对于容灾功能来说,具有以下的优缺点。

它的优点主要包括:支持广域网,不受距离限制;对复制链路带宽要求低;网络连接故障不影响应用数据再复制;对磁盘子系统透明,对硬件配置无特殊要求;实施逻辑复制降低扩散人为错误风险;无须修改应用程序。

其缺点则主要有:仅在实现单个数据库容灾方面,无多对一的解决方案,扩展性差;源于目标必须是相同小版本;Oracle必须置于归档方式;备份中心的备份数据无法快速恢复回主中心;无法实现非数据库数据的远程复制;至少丢失一个日志文件,至少十几兆(大小由日志文件的大小决定)。

采用Oracle DataGuard的主要目的是OracleDataGuard除了用于容灾目的之外,还可以提供其他类型的功能,比如把DataGuard数据库作为report和查询数据库来使用,以及有效克服生产数据库无法打开的特殊故障。当生产数据库无法打开时,传统的工作备份恢复过程,需要比较长的时间,造成业务停机时间过长。如果有了DataGuard备份数据库,医院可以迅速把DataGuard备份数据库转为生产数据库,立即投入使用,不过至少会丢失一个log文件,但是可以提供快速恢复的优势,如果从业务需求方面考虑,为了保证业务连续性,而允许小部分数据丢失的话,DataGuard备份数据库是一种非常有效的做法。

系统可靠性评估

采用全冗余的解决方案,包括从硬件到软件全方位的冗余,没有任何一个单点故障,并且也有效的克服了人为的误操作所导致的系统停机。以下内容将从各种可能发生的故障,来评估系统的应对措施:

1. 服务器故障

服务器故障可以通过MC/ServiceGuard集群软件,自动把集群系统资源,包括通过MirrorDisk镜像完成的共享文件系统,网络浮动IP地址等,切换到另外一台服务器上,用户只需要重新连接一次,进而连接到另外一台正常的服务器上,而以前已经连接到正常服务器上的客户端,不受任何影响。

2. 集群心跳线故障

配置两个互为冗余,又负载均衡的两个千兆以太网作为集群心跳线,所以,任何一个网卡或链路发生故障,都不会影像应用程序的正常运行。

3. 网络故障

配置两个互为冗余,又负载均衡的千兆以太网作为数据网络,所以,任何一个网卡或链路发生故障,都不会影响应用程序的正常运行。

4. SAN存储网络故障

配置了两个互为冗余的SAN交换机,所以任何一台交换机发生故障之后,都不会影像应用系统的运行。

5. 磁盘柜故障

磁盘柜本身的任何部件也是全冗余的,没有任何单点故障,在可靠性上比单台服务器的可靠性高,但是仍然有可能发生人为故障,或者固化软件BUG所引起的故障。在本方案中,通过ORACLE DUARD来保证磁盘柜的错误,可以减少影响应用系统的正常运行。

6. 数据库无法启动

在某些特殊情况下,比如数据库的bug因素,或者系统掉电(Oracle Cache无法及时刷新到硬盘)等因素所造成的Oracle数据库无法重新引导,在这种情况下DataGuard 备份数据库中会保存一份上一次LOG更新时刻的完整数据,能够用来应急,中间仅仅会丢失一个LOG更新周期的数据,其时间长短可以人为设置。值得一提的是,在业务开展过程中这种故障极少发生。

【责任编辑:钢铁小喷侠 TEL:(010)68476606】

标签:信息系统  
  • 分享到: