容灾是企业数据管理中的一个重要环节。近年来,国内频频发生的自然灾害事件给企业CIO提出了一个问题,灾难备份到底要做成什么程度才能满足企业的业务连续性要求?
一 灾备建设参考法规和标准
1.1 信息系统灾难恢复规范(GB/T 20988-2007)
我国至今已发布一系列的文件对灾难备份建设进行指导和监督,其中国务院信息化工作办公室2005年发布的《重要信息系统灾难恢复指南》最为重要。2007年7月,《重要信息系统灾难恢复指南》正式升级成为国家标准《信息系统灾难恢复规范》(GB/T 20988-2007 )。这是中国灾难备份与恢复行业的第一个国家标准,并在2007年11月1日开始正式实施。
我国灾难恢复等级划分:
大致可以分为两类:数据类、应用类。
第1级:数据介质转移;
第2级:备用场地支持;
第3级:电子传送和部分设备支持;
第4级:电子传送和完整设备支持;
第5级:实时数据传送及完整设备支持;
第6级:数据零丢失和远程。
1.2 灾备建设遵循标准
各种灾难时间按照发生频率可排序如下:软灾难、硬件灾难、自然灾难。
因此,软灾难的防范是数据灾备建设过程中重点考虑对象,同时要兼顾到硬件灾难与自然灾难。
从技术上看,衡量灾备系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。
在数据保护和灾备系统建设中主要有三个指标:
PTO(Recovery Time Object,恢复时间目标)
RTO是将信息系统“从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、数据处理系统切换时间、备用网络切换时间等,该指标用以衡量灾备方案的业务恢复能力。
RPO(Recovery Point:Objective,恢复点目标)
RPO是指业务系统所允许的灾难过程中的最大数据丢失量。数据保护的根本目的,就是在一定的预算和技术基础上,要求实现尽量小的RTO、RPO。当发生各种故障时,可以进行快速的系统和数据恢复,使得系统继续发挥作用,提供数据服务和业务服务能力。
RR(Recovery Radius,灾备半径)
RR 即主站点与备份站点间的距离,指灾备系统能够承受多大物理距离内的灾难,应对自然灾害。
二 应用级容灾的功能特性以及传统容灾方式简介
容灾,顾名思义是业务系统在灾难发生时的承受和抵御能力。业务系统通过容灾机制来保证数据的安全可靠,提高系统的可用性,并确保业务的连续性。从对用户整个业务连续性的保障程度来看,容灾可以分为两个级别:数据级别和应用级别。
2.1 数据级别
数据级别容灾的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级的容灾较为基础,数据级别容灾是保障数据可用的最基本要求,当数据丢失时能够保证应用系统可以重新得到所有数据。该级别灾难恢复时间较长,延迟大,仍然存在较大风险,尽管有时候用户原有数据没有丢失,应用也会被中断,用户业务也会被迫停止。但这种方案的特点是成本低、构建简单。
2.2 应用级别
对于业务应用繁多、而且系统需要保持7 X 24小时连续运行的企业来说,显然需要高级别的应用容灾系统来满足他们的需求。应用级容灾是在数据级容灾的基础上,再把执行应用处理能力复制一份。应用级容灾系统能提供不间断的应用服务,让用户应用的服务请求能够透明地继续运行,而感受不到灾难的发生,保证业务系统提供的服务完整、可靠、安全,以及业务的连续。
三 构建在虚拟化环境中的容灾系统为信息系统建设带来的变革
3.1 虚拟化概述
虚拟化就是淡化用户对于物理计算资源,如处理器、内存、I/O设备的直接访问,取而代之的是用户访问逻辑的资源,而后台的物理连接则由虚拟化技术来实现和管理。从而实现了灵活性、可靠性、可扩展性、安全性、降低成本。
3.2 如何定位业务连续性
业务连续性就是将宕机时间缩短到最小。构建业务连续性解决方案的需求有以下四点:
(1)构建在可靠的平台之上:这个平台本身的可用性必须很高,并且不依赖操作系统或特定驱动装置;
(2)独立于物理架构之外:这样物理架构的缺陷将不会导致业务系统的不稳定;
(3)贯穿操作系统和应用程序的保护:虽然我们需要保护的是业务系统,但是与业务系统息息相关的操作系统、配置文件等也必须考虑进来;
(4)广谱宕机因素的保护能力:这个系统必须能对计划内与计划外的宕机提供保护,同时对组件、服务器、数据以及站点灾难同样要提供保护。
在虚拟化平台之上为业务连续性的每一个层面都能提供保护,当这些保护措施不足以满足我们业务连续性的要求时,还有更多的、专注单一层面解决方案,可以和虚拟化平台有机的进行结合。例如:在VMware环境中Vizioncore VVSP的各个组件可以提供对虚拟化平台更加优化的管理,这其中包含容灾管理。
3.3 灾难恢复需考虑的要素
3.3.1 想要达成什么样的灾难恢复目标很重要
灾难恢复分为以下三种:
本地高可用:冷备,有备机是否就已足够?热备,MSCS?VCS?VMware HA?VMware FT?系统级切换还是应用级别的切换?
远程数据保护:仅有数据足够吗?在灾难恢复发生时,怎么让数据能够使用起来?仅有应用足够吗?在灾难恢复发生时,怎么去获得生产数据让应用能够发挥作用?
任何情况下不间断运行:真的需要实时切换吗?实时切换的巨大投入(硬件、软件、线路、人力)是否能购承受?
3.3.2 灾难恢复的实现方式
基于应用程序灾难恢复解决方案:应用程序在本地、远端双写I/O,需要从写应用程序,周期长,不稳定;
基于数据库复制的远程灾难恢复解决方案:数据库本身的远程复制(Oracle DB Guard),只能复制数据库自身的文件;
基于主机的远程数据复制软件灾难恢复解决方案:复制软件在卷管理器层面截获I/O,远程复制,支持异构存储平台,但是低效率、对主机的运行有影响,配置复杂;
基于存储的远程数据复制灾难恢复解决方案:智能存储远程数据复制,相对安全、成熟、简单、高效、节省资源,但是对存储的要求比较高,一般要求同构平台;
基于虚拟化平台的远程数据复制软件灾难恢复解决方案:复制软件在虚拟化存储层面截获I/0,远程复制,支持异构/同构存储平台。
在虚拟架构下系统和数据采用同样的方式来保护,系统也是数据,保护系统的同时就保护了数据,反之亦然。虚拟机既存储系统也存储数据,整个系统封装在文件中:硬件配置,操作系统,应用及数据。这样我依靠虚拟化的硬件独立性,可以可靠地将虚拟机恢复到其他的硬件服务器上,并可将整个系统迅速转移到灾难恢复中心;由于关于系统的所有信息都以数据的方式存储在磁盘上,我们可以依靠虚拟化的封装性,用保护数据的方式保护整个系统;我们可以依靠虚拟化的分区和整合特性,保障生产中心与灾备中心服务器的比例不在是1:1;同时我们可以依靠虚拟化的资源池化特性,确保生产中心与灾备中心基础架构的一致性。
这样使得在虚拟化环境中用任何你喜欢的方法(自动或者手动)将数据(包含系统、应用及数据)复制过去,然后启动虚拟机即可,从而获得最好的RTO。
四 总结
通过在虚拟化环境中部署应用级容灾软件,实现司信息系统高效安全的“两带三中心”容灾系统,提高了信息系统的稳定性,数据的安全性,促进信息化安全平稳运行。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文网址:http://www.toberp.com/html/consultation/1083974914.html