某医院HIS系统Oracle数据库升级改造之架构设计

如果自己搞不定可以找诗檀软件专业ORACLE数据库团队成员帮您服务!

诗檀软件专业数据库团队

服务热线 : 13764045638    QQ号:47079569    邮箱:[email protected]

 

项目背景

  • 现状:目前在用的HIS系统由3台P550Q小型机、1台IBM DS4800存储和1台EMC VNX5500存储组成,其中2台P5 550Q运行Oracle 10g RAC环境,另一台P6 550Q(租借)通过Oracle Dataguard实现异地灾备。
  • 问题:HIS系统运行至今已6年多,设备已到生命周期的后期;存储存在单点故障;主机全部部署在门诊楼机房,存在单机房故障风险。

 项目目标

  • 消除硬件风险:完成设备更新,消除设备老化带来的故障高发风险。
  • 完善HIS架构:消除存储单点故障,实现高可用和容灾的终极目标。
  • 锻炼HIS运维团队:我院HIS运维团队相对比较年轻,在工作经验、技术水平、项目管理、沟通协作等方面具有很大上升空间,特别是通过大项目的历练,可以加快提高人员素质,对个人、对单位都具有很大好处。

 HIS架构完善需求

根据业务分级标准,HIS系统归为Ⅰ级(平均非计划停机时间:99.999%(5分钟)计划停机:1次/季度),系统架构上采用双机房双机双活,灾备模式上采用热备/同步,服务器采用P+P+P小机,在线存储采用2台高端存储,灾备存储采用1台中端存储

为实现上述目标,本项目需匹配相应的硬件设备和高可用、容灾技术。

 

数据库需求

2.2.1 数据库容量需求:

  • 支持5年数据库容量
  • 在线数据保留1年半,超出部分做数据转储。

注:目前采用传统的手工转储方式,误操作风险高,费时费力。明年规划引入“自动化数据转储平台”。

2.2.2 数据库版本需求

目前甲骨文公司已经停止对Oracle10g的技术支持。Oracle最新版本为12C,但是市场占有率不高,存在不稳定因素。Oracle11g为市场上较稳定版本,成功案例众多,因此建议升级到Oracle11g

2.3 操作系统需求

现有AIX版本为5.3,但是IBM公司已经停止对该版本的补丁升级。AIX最新版本为7.1,但是同Oracle12C一样,市场占有率不高。经多方咨询,建议升级到AIX6.1

1、         架构设计方案

3.1  HIS总体架构设计

为了实现HIS架构完善需求,经过反复论证,最终形成的HIS总体架构如下图所示。

 

小型机:

  • 两台IBM P740小机分别部署在门诊楼和综合楼机房,通过Oracle RAC计算实现双活及负载均衡。
  • 一台IBM P740小机部署在综合楼机房,利用Oracle Active Dataguard技术实现数据库实时灾备。灾备库部署在医联项目购买的EMC VNX5500存储。
  • IBM P740灾备小机Oracle库开启实时查询功能,供报表类业务使用。
  • 利旧小机做教练库、历史库、恢复测试库使用。

存储:

  • 两台EMC VMAX10K高端存储分别部署在门诊楼和综合楼,通过Oracle ASM技术解决存储单点故障。
  • 为了不占有高端存储资源,Oracle RMAN备份存放在Isilon。

数据保护:

  • 规划部署一台CDP设备(单独立项),实现0-48小时数据库任意时间点回滚。

3.2 架构详细设计

HIS总体架构落实到硬件层面上可分为:小型机、存储、SAN网、心跳网和IP网,如下图所示。

 

.2.1 小型机

3.2.1.1 AIX操作系统
  • AIX系统建议使用较稳定的1版本
  • 不使用POWER VM
  • JDK&JRE版本为IBM JDK 1.6.0.00 (64 BIT)或更高
  • 启用操作系统Large Page特性
  • 暂时打1 TL8 SP4(最新补丁为TL9,由Oracle服务公司和IBM共同商量是否需要打TL9)

详见:AIX操作系统安装文档(由安富利公司提供,ORACLE服务公司终审,待整理)

3.2.1.2 小型机硬件配置
  • P740的4块硬盘规划:2块组建Raid 1,2块配置成hotspare
  • P740网口绑定ether channel,模式为active/standby

详见:IBM P740配置方案(由安富利公司提供,ORACLE服务公司终审,待整理)

3.2.2 存储

3.2.2.1存储容量及生命周期规划原则
  • 一次性规划到5年容量,并预留20%的安全容量(预防爆发性异常数据增长)
  • 如初始购买容量不够,则按照3年规划。3年后,建议再扩2年容量
  • 5年后,存储进入生命周期后期,建议评估更换(如果不能更换,建议再扩2年容量)
  • 7年后,存储已经进入故障高发期,建议必须更换
3.2.2.2 VMAX存储

由于HIS生产库存放在两台VMAX存储上,因此需要评估现有存储容量可以支持几年的数据量。另外,由于配置了SSD固态硬盘,也需要制定其使用场景。

(1)VMAX存储现有容量

  • 可用容量:总共52块600G SAS,4块热备盘,可用48*600G,做ASM+RAID1,可提供约12TB空间(实际容量=理论容量*0.9)。(5块400G SSD,1块热备盘,RAID1,可用800G。)
  • 两份克隆:规划提供两份1:1克隆数据(已确认只能克隆到自身),供教练库和EXPDP逻辑导出库

(2)生产数据库容量需求估算

截至2014年12月,HIS全库大小为227GB。业务增长率以每年门诊人次为参考,平均每年12%,新业务增长率为10%。下表规划到2019年12月,总共五年。

 

生产库容量为表中的数据文件+归档日志文件。由于RMAN备份文件放在NAS,因此不占用VMAX存储容量。

从表中可以估算出3年生产库容量约为。

按照计算公式:存储容量需求=生产库+克隆+预留20%安全容量(12TB*0.2=2.4TB),评估VMAX存储可以支持几年的数据量。

(3)3年存储容量需求评估

3年存储容量需求=生产库+克隆+预留20%安全容量=3TB+6TB+2.4TB=11.4TB < 12TB

得出结论:现有VMAX容量可以满足3年存储容量。

(4)5年存储容量需求评估

5年存储容量需求=生产库+克隆+预留20%安全容量=5TB+10TB+2.4TB=17.4TB > 12TB

得出结论:现有VMAX容量不能满足5年存储容量。

因此,按照3年存储容量,对VMAX进行空间划分。

(5)VMAX扩容规划

  • VMAX扩容能力

VMAX在不加磁盘笼子的情况下,还能扩展42块600G SAS硬盘;再加磁盘笼子的情况下,最多可扩展到2000块600G SAS硬盘。

  • 第一次扩容:

3年后需扩容6TB(17.4TB-11.4TB)到5年容量。每台存储增加12块600G SAS硬盘(4块一组),加上实施费,经询价,约需经费45万元。(3年后视市场价格情况再调整)。

  • 第二次扩容:

5年后,新设备如果不到位,再申请经费进行扩容,具体扩容方案及费用根据当时的市场情况评估。

(6)VMAX配置图

根据容量需求、ORACLE RAC心跳盘配置和ORACLE ASM配置需求,给出VMAX配置图如下。

 

对存储配置图的几点说明:

  • REDO不建议放在SSD层中,规划放在SAS层,容量为2个50G。
  • SSD适合存放的Oracle文件需专业ORACLE服务公司测试后才能定论(不影响架构规划)。
  • VMAX本身不作为备份设备,采用相对廉价的Isilon作为备份设备。
  • 每台存储划3个2G磁盘,两两做LVM镜像,实现RAC心跳的投票盘。

注:日后规划改为第3个机房的SAN存储作为投票盘。

  • 根据Oracle经验,存储的LUN划分单位为200G。
  • 容量划分明细如下表所示:

详见:VMAX存储实施方案(由EMC公司提供,ORACLE服务公司终审,待整理)

(7)ASM头的备份与恢复

  • ASM Disk头部的100MB数据是ASM的元数据,若丢失则可能造成ASM Diskgroup的故障。
  • 通过运行在操作系统上的脚本备份(每半个月备份,加减盘前必须备份!),可以将ASM disk元数据备份到文件系统上(建议备份到isilon)。
  • 若ASM Disk的元数据受损,则可以通过该份备份迅速还原(具体使用Unix dd工具),快速修复ASM diskgroup。
  • 待实施公司确定后,由其出具详细方案。

(8)操作系统、数据库、ASM、存储之间的关系

asm1

ASM视图(举例)如下:

asm2

 

 VNX5500灾备存储

需要对HIS灾备存储VNX5500(医联采购)配置LUN,并映射给P740灾备小机使用。

详见:VNX5500灾备存储实施方案(由EMC公司提供,ORACLE服务公司终审,待整理)

3.2.3 SAN网

利用外围业务系统改造项目采购的4台SAN交换机组建的SAN网,来实现主机与存储之间的冗余连接。

详见:SAN网络实施方案

 

 

 


Posted

in

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *