1、引言
随着计算机网络的发展,原来的集中式信息系统逐渐转变成了分布式的网络信息应用系统。同时人类社会对分布式网络系统的依赖程度、可靠性要求也越来越高。特别是称之为关键信息系统的,如金融、电信这样的行业,其企业信息系统往往承载了企业的整个运作过程,因此就对业务系统的可靠性、数据的完整性以及业务的连续性要求很高。据有关报告显示:只有6%的公司在数据丢失后生存下来,43%的公司再也无法重新开业,超过50%的公司会在两到三年后消失。为了保证企业关键数据的完全性和完整性,建立一套完备的容灾系统是企业关键数据的最可靠保证。本文针对数据容灾理论及相关的技术进行分析和研究。
2、容灾的理论
2.1容灾的概念
容灾(disaster tolerance)是一个范畴广泛的概念,从广义上,任何提高系统可靠性与可用性的努力都可称为容灾。从狭义上,容灾是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。当灾难发生时,如何能够在最短的时间内使系统恢复正常,保证数据最少丢失,都是容灾技术研究的内容。
2.2容灾的分类
因为灾难所包含的内容较广,容灾所涉及的内容也较多,所以可以从多个角度对容灾进行分类。从距离角度分为木地容灾,近距离容灾,远距离容灾。这三种类型所能容忍的灾难也是不相同的,这与备用系统和生产系统的距离是密切相关的。
从应用角度,容灾系统的实现可分为两个层次:数据容灾和应用容灾。数据容灾指建立一个异地的备份数据系统,备份本地关键应用数据,即数据的异地备份。应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以互为备份,可以共同工作)。在灾难出现后,远程备份系统迅速接管业务运行。数据容灾是应用容灾的基础,应用容灾是更高层次的容灾系统。
2.3容灾系统的评价指标
容灾系统需要考虑多方面的因素,如备份和恢复数据量大小、灾难发生时数据的丢失量、应用数据中心和备援数据中心之间的地理距离和数据传输方式、灾难发生时所要求的恢复速度和恢复层次、备援中心的管理及投人资金等。根据这些因素和不同的应用场合,容灾备份中心自动异地远程恢复被定义有7层,其中包含了2个技术指标。
一般是以数据丢失量和数据恢复时间作为标准进行评价的,所公认的评价标准是RTO和RPO。
①RPO(Recovery Point Objective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量;
② RTO(Re-coverty Time Objective):即恢复时间目标,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。
RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。
3、关键技术的分析
用于容灾系统的关键技术主要包含:数据存储管理、数据复制、灾难检测、系统迁移和系统恢复五个方面。在这里只介绍最重要的两个方面。
3.1数据存储管理
数据存储管理,是指对与计算机系统数据存储相关的一系列操作(如备份,归档,恢复等)进行的统一管理,是建立一个容灾系统的重要组成部分。数据存储管理工作包括数据备份、数据恢复、备份索引、备份设备及媒体和灾难恢复等与数据备份相关的所有管理。
(1)数据备份,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全系统或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程,数据备份是容灾的基石。
(2)数据归档,是将硬盘数据复制到可移动媒体上。与数据备份不同的是,数据归档在完成复制工作后将原始数据从硬盘上删除,释放硬盘空间。
数据备份,是数据存储管理中的一个重要部分。数据备份的评价标准包括备份速度、恢复速度以及数据恢复点。提高数据备份管理的透明性和自动化,管理好各种存储设备,也是需要解决的一个重要问题,而存储虚拟化技术通过将各种异构的存储系统整合成为能够作为单一资源易于管理的单一存储池解决这个问题。
3.2数据复制
数据复制是容灾系统的核心技术,是将一个地点的数据拷贝到另外一个不同的物理点上的过程。数据复制一般分为同步数据复制和异步数据复制。同步数据复制是通过将本地生产数据以完全同步的方式复制到异地,每一本地IO交易均需等待远程复制的完成方予以释放,其特点是基本可以做到零数据丢失;异步数据复制指将本地生产数据以后台同步的方式复制到异地,每一本地IO交易均正常释放,无需等待远程复制的完成。其特点是在灾难发生时,会有少量数据丢失,与网络带宽、网络延迟、I/O吞吐量相关。
实现数据的异地复制,有软件方式和硬件方式两种途径。软件方式,是通过主机端软件来实现。即在主系统和容灾系统的主机上,安装专用的数据复制软件。其优点是与硬件无关,成本较低。缺点是效率较低和可管理性较差。硬件方式,是数据直接在存储设备之间传输,并不依赖主机的管理。这种方式要求在主系统和容灾系统配置上支持这种功能的专用存储设备,所以成本较高。根据复制数据的层次可以分为四种类型:
①硬件级的数据复制;
②操作系统级的复制;
③数据库级的复制;
④业务数据流级复制。
容灾数据复制的性能和网络带宽、复制距离、数据传输方式、数据块打包方式、系统处理能力有关。可以看出,其中通讯问题是影响远程复制效率的最关键因素。
4、容灾系统的实现方式
4.1基于主机的容灾
通过在主机上安装软件实现数据在服务器之间的复制。这种方式对存储系统没有限制,支持异构存储系统,不需要增加硬件,同时可以在服务器层增加应用远程切换功能软件,从而构成完整的应用级灾备方案。但这种方式对软件要求高,生产中心和灾备中心的每一台应用服务器上都需要安装专门的软件,随着服务器数目的增加,成本也线性增加。同时存储目标数据的逻辑卷不能被业务系统直接使用。由于需要在服务器上运行软件,对服务器兼容性和性能也会有所影响。
4.2基于存储设备的容灾
通过存储控制器实现的设备级数据远程镜像或复制,是传统灾备中最高效最可靠的方式。基于存储设备的容灾与服务器平台无关,远程复制由生产中心和灾备中心的存储系统完成,对应用服务器完全透明。设备往往采用的是一些专用的设备和通信方式,安装维护都比较复杂。由于两个中心之间必须有专用的网络连接作为数据通道,使得该系统对通信线路的要求较高,初期成本非常昂贵。
4.3基于网络级的容灾
主要是指基于虚拟化存储技术的灾备。这种方式无需在应用服务器上安装任何软件,远程复制过程不会对应用服务器产生影响。存储设备可以完全异构,不同厂商不同接口的阵列可以混合使用,而且完全不用考虑现有的存储设备是否支持远程数据灾备,大大降低了方案复杂程度和实施难度。但是数据的写入必须由虚拟化数据管理产品进行转发。
5、小结
通过建立容灾系统,提供了高可靠的数据保护环境,降低灾难发生造成的损失,提高系统的安全性和可恢复性。容灾系统并不是在设计完成后就不必再管理的项目,它不仅仅是技术,更是一项工程。另外,如何将基于磁盘设备或者操作系统的数据复制转移到从网络业务数据流层次进行数据复制,怎样提供一个通用的应用接口将多样化的存储设备灵活且透明的组织起来,将是以后的研究方向。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:浅析中小企业数据容灾理论和技术
本文网址:http://www.toberp.com/html/consultation/1083952229.html