随着信息化的飞速发展,信息系统已成为支撑企业运作不可缺少的一部分,在企业内部建立了各种信息系统,如ERP系统、生产执行系统、办公自动化等系统。信息系统在给企业带来便利的同时,也隐含着风险,一旦信息系统出现问题,可能将导致企业无法进行日常的业务运营,因此保障信息系统的正常稳定运行显得越来愈重要,但传统以人工为主的运维管理已不能满足企业全面管理信息系统的要求,缺乏有效的运维管理已成为影响信息系统应用效果的主要瓶颈。
对于如何进行有效的IT运维管理,很多企业和政府部门进行了长期的探索和实践,逐渐形成了一套IT运维管理方法论—IT服务管理(IT Service Management)。IT服务管理是以流程为导向,通过整合IT服务和业务需求,提高IT服务水平,让信息化资源发挥更大的效能。在IT服务管理领域中,ITIL (IT Infrastructure Library, IT基础架构库)已成为事实上的行业标准,它是从大量企业的IT服务管理经验中总结出来的最佳实践,将ITIL引入运维管理中,可以使企业在建立IT运维管理制度和流程的过程中充分吸取前人的成功经验,对改善企业运维质量具有很好的借鉴意义。
1、IT运维管理现状
目前,信息技术在企业中的应用得到了前所未有的重视,但是长期持续建设的惯性使企业普遍存在“重建设、轻运维”,“重技术、轻流程”等问题,导致对IT运维工作投入不足,缺乏规范化的运维管理流程。其实从信息系统的整个生命周期来看,实施建设只占其生命周期的20%,而其余80%的时间都是对其进行运行维护,所以运维阶段是IT生命周期中的关键阶段,如果IT的运维管理做的不好,那么这些花费大笔投资建立起来的系统将无法带来预期的效益。
由于缺乏规范的运维管理体系,导致企业普通存在以下问题:
(1)运维人员就像救火队员一样,处于被动的服务状态,只有当问题已经发生后,才进行紧急处理,不能预防问题的发生。
(2)缺乏统一的服务台,用户请求随意性大,直接找有经验的信息人员,导致能干的人员成天处理无价值的琐碎事情,价值无法有效体现。
(3)缺乏规范的运维制度和流程。在处理问题时,没有对问题进行记录和分类,导致无法跟踪和监控问题的处理情况。
(4) IT运维的相关经验没有积累和共享。由于缺乏对运维过程的记录,使得问题的处理方法只有当时的维护人员掌握,相关经验难以积累和共享。
(5)运维人员绩效无法量化。在运维工作中没有建立量化的考核指标,IT运维质量和运维人员的绩效无法量化,使得运维人员的工作积极性得不到提高。
因此实现运维管理从传统被动式服务转变为主动预防服务,以流程贯穿整个运维管理过程,实现运维管理的标准化、规范化和流程化是目前企业信息化建设急需解决的问题。
2、ITIL体系框架概述
在20世纪80年代中期,英国政府为了提高政府部门IT服务的质量,启动了一个项目来开发一套规范化的、可进行财务计量的IT资源使用方法,该项目的最终成果就是ITIL V1.0版本。ITIL确定了以流程为中心的IT服务管理方法,并定义了各个流程之间的相互关系,使人们对IT服务管理统一了思想、认清了方向。在2007年,ITIL V3正式发布,它融入了IT服务管理领域当前的最佳实践,并首次引入了生命周期的概念,通过PDCA模型( Plan-Do-Check-Act ),可以持续不断地循环改进IT服务,从而保证IT比持续的生命活力。
ITIL V3框架如图1所示,它主要包括五个核心模块:
(1)服务战略。该模块为制定IT服务管理的政策和指南提供指导,保证IT服务战略与业务相一致。主要包括服务战略制定、服务投资组合管理、服务财务管理和需求管理等流程。
(2)服务设计。该模块为制定IT服务管理制度和流程等方面提供指导,帮助用户设计出合适的IT服务解决方案及流程。主要包括服务目录管理、服务级别管理、可用性管理、持续性管理和安全管理等流程。
(3)服务转换。该模块为新增的或修改的IT服务转换到实际应用中提供指导。主要包括配置与资产管理、发布与部署管理、变更管理、知识管理和服务检验与测试等流程。
(4)服务运营。该模块为如何达到IT服务支持和交付的效果和效率,保持服务运营稳定性提供指导。主要包括事件管理、服务台、问题管理、技术管理、应用管理和访问管理等流程。
(5)持续服务改进。根据业务需求持续改进和提高IT服务生命周期中的每个阶段,使得IT服务能不断与业务需求的变化相适应。
ITIL V3通过服务设计、服务转换和服务运营的实施,并借助持续服务改进不断完善整个过程,使I下服务管理过程整合为一个良性循环的整体。
3、运维管理流程体系设计
根据目前IT运维工作情况及存在的问题,本文在ITIL理论的指导之下,设计了IT运维管理的主要流程,流程如图2所示。
下面针对以上流程进行详细介绍。
(1)事件管理流程。事件是指可能引起或已经引起IT服务中断或服务质量下降的活动,事件管理的目的就是尽可能在最短时间内解决故障,减少事件对业务运作的影响。该流程首先是新建事件,在运维平台中,新建事件有两个来源:
一是当用户发现信息系统故障,通过电话或者邮件通知服务台,由服务台人员在系统中手动创建事件;
二是当监控平台通过监视工具发现性能指标超过闭值时,系统会自动创建事件。在创建事件时,服务台人员根据事件信息进行事件的分类以及设定优先级,同时系统会自动从运维知识库里搜寻该事件的解决方案,为服务台人员处理事件提供参考。如果服务台可以处理该事件,就直接答复用户,否则将该事件指派给相关运维人员。当运维人员接收到该事件,对事件进行分析和处理,并将解决方案反馈给服务台。服务台向用户确定事件的处理效果,并填写用户反馈意见,当故障已解决,则关闭该事件。整个事件的处理过程都记录在事件问题库中,方便用户进行查询和统计分析,并根据情况,将解决方案记录到运维知识库中,实现知识的积累和共享,为以后处理同类事件提供参考。
(2)问题管理流程。问题管理的目的是找出并消除引起事件的根本原因,从而避免事件再次发生。该流程首先是对事件进行分析,将之前重复发生过的或者非常严重的事件升级为问题,根据问题信息进行分类以及设定优先级。然后将问题指派给相应的专家组,由专家组对问题进行分析并找出问题的根源,从而提出相应的解决方案,然后由技术总监对解决方案进行审批,审批通过后,进行解决方案的实施,必要时触发变更管理流程。当实施结束后,对实施效果进行评审,评审通过后,关闭问题并将问题的处理过程记录到问题事件库中,同时根据情况,将解决方案记录到运维知识库中,为以后处理同类问题提供参考。
(3)变更管理流程。该流程首先是新建变更请求,新建变更请求有两个来源:一是为了解决系统问题;二是为了适应业务的变化。在创建变更时,根据变更情况进行分类以及设定优先级。然后将变更指派给相应的专家组,由专家组对变更进行综合分析,明确变更的风险及其影响,并制定详细的变更方案及计划。变更经理对变更方案进行审批,审批通过后,按照变更计划实施变更,同时触发发布管理流程。当完成变更实施后,由变更管理小组对实施情况进行评审,如果成功,则关闭变更请求,并出具变更总结报告,反之,修改变更方案重新实施变更。
(4)发布管理流程。由变更管理触发生成发布请求,根据发布请求制定发布方案以及计划,明确发布的内容、角色职资分配、发布日期等。根据变更实施情况组织用户进行培训和测试,确保变更和发布的成功。当测试通过后,确定软硬件版本并进行安装,同时触发配置管理流程,更新配置信息。
(5)配置管理流程。配置管理是将IT环境中所有配置项(硬件、软件等)的信息以及配置项之间的关系记录到配置管理数据库中,从而为其他流程的处理提供软硬件的详细配置信息。发布管理会触发生成配置请求根据配置请求确定配置的范围并制订配置计划,识别本次更新的配置项,并将配置项的详细信息以及配置项之间的关系记录到配置管理库中,并定期对配置管理库进行审验,保证其配置信息能真实反映实际的情况。
4、实施策略
IT运维管理流程体系涉及到多个相互独立又彼此关联的管理流程,它的实施是一个长期而艰巨的任务,不但要面对各种各样的技术难题,更重要的是将ITIL的思想与企业文化相融合,因此ITIL的应用实际是一个管理变革活动,在变革过程中,会涉及到人员的职能、思维模式、工作方式等的转换,容易产生的误解和消极的态度。其次,ITIL作为信息部门内部管理的流程,存在许多与现有的应用管理系统以及外部系统及流程的接口整合衔接的问题,需要在流程设计和自动化等环节逐步解决。
基于以上原因,运维管理流程体系的建设不是一次性就能够全部实现的,需要逐步实施和优化,本文通过对这一课题的研究,提出分阶段实施的策略,具体如下:
第一阶段:咨询评估阶段。该阶段主要工作是通过对企业的IT建设和运维管理现状进行调查研究,评估企业当前的IT服务成熟度,找出运维管理存在的问题和不足,制定运维管理建设的总体目标、功能需求和实施计划等。
第二阶段:建设实施阶段。在前期咨询评估的成果上,建设基于ITIL理念的IT运维管理系统,通过系统的建设,固化运维管理流程,本阶段主要实施ITIL中最核心的运维流程,包括服务台、服务目录、事件管理、问题管理、配置管理和知识管理等。
第三阶段:推广提高阶段。在第二阶段的基础上,对运维流程体系进一步的深化和改进,主要实现变更管理、发布管理、服务级别管理、能力管理、可用性管理、监控系统的集成,运维KPI指标的制定。
第四阶段:持续改进阶段。因为IT运维管理是一个不断持续满足用户需求和期望的过程,所以IT运维管理体系的建设应该是一个不断持续改进的过程,整个过程包括计划(Plan )、执行(Do)、检查(Check)和行动(Action) 4个阶段(PDCA),并按此顺序不断循环改进,通过PDCA的管理思想,定期地对运维流程进行分析,提出优化和改进建议,使运维流程随着组织内外部环境的不断变化而改进,保障运维流程动杰满足企业的中冬目标。
5、总结
本文首先对目前企业的IT运维工作状况进行了分析,归纳出目前存在的主要问题,然后基于对IT比最佳实践的研究基础上,设计了一套基于ITIL的运维管理流程,并提出了IT运维管理分阶段实施的策略,使运维管理从传统的单一、被动和低效的管理方式逐步转变为统一、主动和高效的管理模式,提升IT运维管理水平。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:IT运维管理流程体系设计与实践