业务连续性是企业信息管理不可回避的问题,IT在企业提高企业竞争力的同时,也带来了新的挑战。例如企业需要缩小数据备份窗口,以解决存储容量逐年增长的问题。关键数据和应用不加以保护,当发生意外时,无论是软件小故障,还是受病毒入侵或天灾造成的,都会影响客户关系和产能,使经济受到严重影响。为此,每一企业都需要制定完善的,业务连续性计划。企业运作越依赖于IT架构,就对信息系统运作的稳定性和可靠性的要求越高。所以IT系统的完善程度,提供全天候业务运作,是竞争力的一个最重要的前提,即业务连续性的重要性。企业的业务持续计划的设计不是一蹴而就的简单步骤,应该是一个持续并循环往复的过程,每一阶段都能持续不断的改进,并且在实际工作中体现有效性与高效性。应急系统的建设解决了这一难题。
1 CRM应急系统功能
企业要保持业务连续性,最大的威胁并不是来自于火灾、地震等小概率、大影响的灾难,相反,企业的业务更多地受到诸如人员错误、流程缺陷等事件的威胁。虽然它们对经济的影响力远不如那些重大灾难,但是它们却时刻潜伏在企业的周围,随时一触即发,同样会对企业造成致命的打击。
灾难范围的扩大,对企业的IT建设提出了新的挑战,为了保证企业7×24 h连续运营,仅仅是依靠传统的灾难备份、恢复已经满足不了业务的需求,以IT为业务服务的思想,业界提出了业务连续性的概念。业务连续性涵盖面超出了IT灾备方案的范畴,它更是一个包含了保证业务连续运行的各组成环节的管理流程。业务连续性是指企业有应对风险自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下3个方面。
(1)高可用性(High Availability) :是指提供在本地故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施、IT软/硬件的故障。
(2)连续操作(Continuous Operations) :是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。
(3) 灾难恢复(Disaster Recovery) :是指当灾难破坏生产中心时在不同的地点恢复数据的能力。灾难恢复的特点是在不同的地点不同的硬件设备上流程。同时3个部分又不是相互孤立的,是相互关联,而且有交叉的。
2 CRM应急系统建设方案
2.1 CRM应急系统架构(如图1所示)
图1 CRM应急系统建设架构图
传统的容灾中心解决的主要矛盾为数据安全性,并不能解决业务连续性。因为容灾中心的服务器处于非活动状态,不提供服务。启用流程复杂,切换、回切时间超过1 h。通过对生产系统的数据,做一份准实时镜像,构建成应急系统实现业务连续性。由于应用服务器采用的集群架构,可实现自动重连、负载均衡,不需要单独部署。
2.2 CRM应急系统数据复制原理
业界一些准实时备份数据库软件,即逻辑复制软件,其原理大同小异。都是针对oracle数据库的日志变化,然后解析日志为SQL语句,然后在目标库上进行回放,完成数据的逻辑变化的同步。
复制之前要求初始化的同步,即利用存储复制软件实现系统底层同步,同步操作步骤简单,周期短。然后,再利用复制软件进行增量的逻辑同步,达到准实时的要求。延迟时间从秒到分,及小时都有可能,与生产系统的业务量大小有关。
2.2.1 初始化数据同步
使用存储公司的底层数据复制软件。存储复制是基于同一盘阵磁盘间进行镜像原理,实现准实时的数据同步、备份,保证数据的完整性和一致性。TB级容量的系统初始化同步在分钟级别。如图2所示。
图2 存储底层复制原理图
2.2.2 增量数据同步
应急系统的应用同步是使用逻辑复制软件,采用实时解析生产数据库的Redo-Log原理达到源端、目标端数据准实时的目的。逻辑复制原理图如图3所示。
图3 逻辑复制原理图
2.3 方案优势
2.3.1 复制方案先进
采用底层复制加逻辑复制技术,实现快速部署。单采用底层复制,目标系统平时处于非活动状态,资源利用率低,浪费成本。单采用逻辑复制,目标系统部署耗时长,TB级数据需要几天时间,如果应急系统复制过程中遇错误或业务量突增时,不能达准实时需要初始化时,无法实现,周期太长。采用两种技术的结合,解决以上问题。
2.3.2 全业务连续性得到保障
切换接管时间可达到秒级,切换步骤、回切步骤简洁,可实时双向的数据复制,数据无丢失,数据一致性强,达到业界最到的RTO,RPO。
2.3.3 报表业务更新
报表服务对电信企业的成本开销较大,对生产系统的稳定性影响较大,内部客户满意度较低。传统的报表在生产系统执行,利用新建的CRM应急系统,将报表业务迁移到应急系统上,提高资源利用率,减少对生产系统的压力,降低了生产系统的故障,提升了业务连续性。
2.4 切换流程(如图4所示)
图4 应急系统使用流程
应急切换启动原则:
(1)生产中心无法承载业务。(2)30 min之内决策是否切换。(3)确定a. 可忍受中断时长b. 切换时长c. 预留时长。修复时长>a–b–c则切换。(4)如果30 min内无法判断修复时长,则切换。
3 总结
应急体系建成以后,CRM系统退服时间指标逐月下降,客户投诉率指标下降明显,CRM系统客服满意度指标上升明显,话费信息获取速度、缴费成功率、开机速度都大大提高,营业厅很少遇到故障,应急系统的贡献明显。根据业务部门内部评价、集团考核和外部客户满意度调查的结果,CRM系统的满意度将会处于全国前几名的位置。系统每天的计划外退服时长缩短了几十倍,应急系统建设之前,每年的退服时长在几百分钟,现在,每年的退服时间达到30 min以内,用户端几乎感受不到系统停顿。每万用户的支撑类投诉比从0.4下降到0.05左右。缴费开机的速度也大大加快,由原来的几分钟达到目前的平均几秒数量级。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文网址:http://www.toberp.com/html/consultation/10819913679.html