1 引言
从美国9.11世贸大楼的恐怖袭击,到我国的5.12汶川特大地震,“灾难”这个词对我们来说已并不陌生。前一段时间的日本岛9.0级巨大地震,更是令人感到无比的震撼。随着企业信息化建设的迅猛发展,企业信息系统已成为现代企业运营的基础平台,企业数据更是关系到企业自身利益的核心资源。具Gartner Group统计:在经历大型灾难而导致系统停运的公司中有2/5再也没有恢复运营,剩下的公司中也有1/3在两年内破产。美国明尼苏达大学的研究表明:在遭遇灾难的同时又没有灾难恢复计划的企业中,将有超过60%在两到三年后退出市场。未雨绸缪,如何应对灾难性事件的发生,保障企业数据的安全性和信息系统的业务连续性,已成为企业信息化建设中需要重点思考的课题。本文将对企业容灾系统建设的基本概念、建设等级、建设方案及恢复演练等方面的内容进行探讨,旨在帮助企业加快容灾系统的建设步伐,有的放矢,合理构建企业信息系统的避风港。
2 认识容灾技术
灾难恢复防范的灾难包括地震、水灾等自然灾害以及火灾、战争、恐怖袭击、网络攻击、设备系统故障、人为破坏等无法预料的突发事件。容灾的主要目标是提高抵御灾难和重大事故的能力、减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业持续性。在容灾领域有一些关键的术语,了解和掌握这些概念将有助于容灾系统建设的方案设计和实施,分别介绍如下:
(1)灾难恢复(或称容灾备份)(disaster recovery,DR):是指利用技术、管理手段以及相关资源,将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态的活动和流程。(《重要信息系统灾难恢复指南》)。
(2)恢复时间目标(Recovery Time Objective,以下简称RTO):RTO表示了从灾难发生直到业务流程再次运行(即被恢复)的时间。RTO有两个组成部分,明确灾难发生后指示恢复流程开始的决策时间(Decision Time)和进行灾难恢复流程的实施时间(Deployment Time)。一般来说,恢复时间(RTO)越短,那么灾难恢复方案的成本就越高,但是由于灾难造成的业务损失就越小;反之,恢复时间(RTO)越长,灾难恢复方案的成本较低,但是由于灾难造成的业务损失就较大。
(3)恢复点目标(Recovery Point Objective,以下简称RPO): RPO是灾难发生后业务能够容忍的数据丢失量,或者说灾难发生造成的数据丢失量。一般来说, RPO越高(即,丢失的数据越少),容灾的成本越高,但是由于灾难造成的业务损失就越小;反之,RPO越低(即,丢失的数据较多),容灾的成本越低,但灾难造成的业务损失也越大。
3 容灾系统的建设等级
建设容灾系统前企业必须对自身IT现状做详细调研分析,围绕RTO、RPO两个主要业务指标,参照国家标准《重要信息系统灾难恢复指南》,通过科学的手段分析并制定建设等级、建设目标。国标中包含七个关键要素:数据备份系统、备用基础设施、备用数据处理系统、备用网络系统、技术支持能力、运行维护管理能力、灾难恢复预案,按照这七个要素将灾难恢复划分为六个等级,等级越高,容灾系统越完善、企业受到的经济损失就越小,但同时企业投入的人力、物力、财力就越高。一般企业根据业务系统重要程度的不同,经常采用等级为第2级、第3级和第5级的容灾策略。
第6级为最高等级,相对于第5级的实时数据复制而言,要求实现远程数据实时备份,实现零丢失;备用数据处理系统具备与生产数据处理系统一直的处理能力并完全兼容,应用软件是集群的,可以实现实时无缝切换,并具备远程集群系统的实时监控和自动切换能力;对于备用网络系统的要求也加强,要求最终企业可通过网络同时接入主、备中心;备用场地还要7×24专职操作系统、数据库和应用软件的技术支持人员,具备完善、严格的运行管理制度。
4 容灾系统的建设步骤
企业容灾系统的建设需要遵循国家、行业的相关文件规定,依据科学的步骤来逐步执行。典型的容灾系统建设步骤大致如下:
4.1业务分析
这是容灾系统建设方法论的第一步,企业需要根据自身现状收集业务需求、灾难类型、技术基础架构(如企业内部IT架构、IT部门组织、使用技术、软硬件、网络架构等),确定需要防范的风险,在风险分析中确定不同的业务级别的业务恢复时间RTO和可承受的数据损失程度RPO。
4.2策略制定
根据第一个阶段得出的结果,确定容灾系统的投入预算,选择切合实际、投资合理、可靠的容灾方案。这个阶段需要着重考虑容灾中心的选址、两地间的距离、运营方式、容灾中心的规模、合适的技术、合适的产品。
4.3方案实施
根据制定的容灾方案,制定详细的方案和项目计划,分阶段进行实施。实施内容包括技术实施、场地实施、、初步的DRP(容灾恢复计划)开发、首次演练、文档及培训等。
4.4测试演习维护
此阶段主要是测试和验证容灾系统、维护容灾系统的正常运行、制定容灾管理制度和流程、人员&技术培训、演习。
5 典型容灾方案的对比分析
IT系统构成的不同使容灾技术类型也有很大的差异,各类技术与现有IT系统的吻合程度主要取决于系统本身的组成和建设要求。比如,IT系统由多操作系统组成,并且容灾系统不能更改生产系统原有的格局,则可行的技术手段就极为严格,需要相当慎重的选择。以往,由于容灾技术实现手段有限,主要有主机型和存储型两大类容灾方式,而今天,出现了具有更强能力的存储网络型的虚拟化容灾方式,使得容灾的技术手段开始丰富起来。
5.1主机型远程容灾
基于主机的容灾技术,简单地说,就是通过安装在服务器的数据复制软件,或是应用程序提供的数据复制、灾难恢复工具(如数据库的相关工具),利用TCP/IP网络连接远端的容灾站点的服务器,实现异地数据复制。其中最为成熟的和应用最广泛的就是Veritas Volume Replicator(VVR)软件。
5.2存储系统型异地容灾
顾名思义是基于存储系统(光纤磁盘阵列、NAS)的模式。通过存储系统内建的固件(firmware)或操作系统,通过IP网络或DWDM、光纤通道等传输界面连结,将数据以同步或异步的方式复制到远端。知名的存储系统型远程容灾方案有SRDF、TrueCopy、PPRC等。
5.3虚拟化容灾
一种网络存储型远程容灾架构,是在前端应用服务器与后端存储系统之间的存储区域网络(SAN),加入一层存储网关,这个网关和我们所了解的网络网关不同,它结合了网络存储专用管理器,前端连接服务器主机,后端连接存储设备。它的角色就好像是存储网络中的交通警察,所有的I/O都交由它来控制管理。当然,现在也出现了旁路(side-band)的控制方式,对于I/O流量进行旁路监控和分流,实现异地数据复制。
由于数据复制是通过存储网关来执行,应用服务器只需数据库执行代理程序,相对于主机型远程容灾来说,它的性能影响十分低。另外,通过存储网关的虚拟化技术,可以整合前端异构平台的服务器和后端不同品牌的存储设备,本地端和灾备端的设备无需成对配置,企业可以根据RTO和RPO,在远端建立完整的热备份中心。当本地端发生灾难时立即接管业务运行,或是采取仅在灾备端安装存储设备的温站配置,先保护数据的完整性和安全性,在本地端修复完成后再进行恢复。
除此之外,虚拟化容灾技术还具有以下优势:
(1)构造时不需更换原有的IT基础架构,只需在原本的存储区域网络中加入存储网关,本地端的主机和存储设备可以是任何品牌,灾备端的主机和存储设备也不需和本地端相同,企业甚至可以在灾备端采用等级较低的存储系统(如SATA磁盘阵列),根据统计,投资成本可节省多达30%左右,对于那些有构造远程容灾的热切需要而IT预算又十分有限的企业来说,虚拟化远程容灾无疑是最佳的选择。
(2)针对数据库专用代理确保数据库具有完整的容灾和启动能力,无需担忧无法启动的现象发生。更为重要的是,在存储数据上进行的多点快照等增值功能,能使得各种数据的人为破坏得到瞬间恢复的能力(也就是历史数据的恢复能力,这在前两种容灾方式中是一种恢复的盲点)。
(3)对于异地传输的带宽占用,虚拟化容灾方式具有各类调优方式,使得这种方式能够最大限度适应企业现有的网络环境。
6 容灾系统的恢复演练
建设容灾系统的目的就是在灾难发生后能够尽快恢复业务系统,减少IT系统故障给企业带来的经济损失。因此,完成系统建设后,还必须定期组织严格规范的灾备演练、测试活动,规范和完善企业IT系统的应急体制,加强应急团队建设,提高维护人员的业务水平,从而在灾难发生后能够快速、高效的完成业务恢复。
容灾的演练计划有以下几种方式:
6.1计划性测试/演练
灾难恢复计划要求建立业务连续性管理团队,不仅涉及IT部门,而且关联众多业务部门,为减少演练对于生产的影响,可以将恢复计划细化到很小的单位或者模块,逐个应用进行接管验证。当模块都成功通过测试后,测试的范围可以扩充到更多的模块。
6.2突发演练
在容灾系统全面完成并且制定了全面的恢复计划后,可以在进行了一定备份的情况下安排突发性的测试。当然,业务连续性管理小组需要确保业务不会因为突发性测试造成不可接受的损失和业务中断。
演练对于提高团队的恢复经验和协作能力以及确保灾难恢复计划的可行性是至关重要的。所有的演练结果都要进行评估、记录,并且生成到容灾流程里。
7 总结
灾难的发生是“小概率、高风险”事件,随着企业信息化水平的不断提高,为规避风险,容灾系统对于企业重要信息系统已成为必不可少的信息安全基础设施。容灾系统的建设是一个系统工程,只有科学合理地进行容灾系统的设计与部署,才能对企业信息系统的安全运行起到根本的保障作用。因此,企业在容灾系统的建设过程中,必须充分考虑重要信息系统的抗毁性与灾难恢复,合理选择容灾技术,制定和不断完善信息安全应急处置预案,提高应急处置和灾难恢复能力,才能保证在遭遇重大灾难和重大事故时发挥有效的容灾功能,真正构建企业信息系统的避风港。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:构建企业信息系统的避风港
本文网址:http://www.toberp.com/html/consultation/1083953295.html