1 引言
随着全球信息网络的逐步建立及IT技术的迅猛发展,IT行业得到快速发展,IT系统的数量和规模也成几何倍数增长,各种IT系统的实现复杂度不断提升,涉及的软件、硬件种类也不断增多。面对庞大和海量的IT系统,IT系统运维和管理的业务需求逐渐形成,专业的IT系统运维管理业务逐步发展起来。国内
IT运维服务行业也在近几年得到了快速发展,并形成了一定的市场规模。本文采用行业集中度分析法对IT运维服务市场进行了必要的分析。行业集中度也称为行业集中率,指规模最大的排名前几位企业的有关数值占整个行业的份额。进行行业集中度的分类,国际上比较通用的方法是“贝恩分类法”,一般用行业中排名前4位的企业占全行业总市场份额,表示为CR4。国内IT运维市场份额如图1所示
:
图1 国内IT运维市场份额
国务院发展研究中心的报告中指出:行业集中度CR4一般小于30%.属于竞争性行业。IT运维行业CR4为22.6%,CR8为34.4%,属于竞争行业范畴。近几年,IT运维行业前4名企业的市场份额变化不明显。是什么原因导致出现了目前的市场形势?根据研究和分析得出,是因为这些IT运维服务企业还未形成规范化的IT运维服务框架体系,无论大小企业,都各行其职,按照自己对IT运维服务的理解来提供IT运维服务。因此,需要研究并形成规范化的IT运维框架体系,企业才能尽快形成标准化和规范化的服务体系,提供高效、全面的IT运维服务。
2 lT运维框架
本文根据目前国内外的IT技术管理体系及IT运维体系。提出了提升IT运维服务的IT运维框架体系,IT运维框架主要包括企业进行IT运维服务的服务能力、人员、资源、技术、过程、支撑平台共6个方面的内容,如图2所示。
图2 IT运维框架构成
2.1服务能力
2.1.1服务能力模型
IT运维服务是服务方依据用户方提出的服务级别要求,采用相关的方法、手段、技术、制度、过程和文档等,针对IT运维服务对象提供的综合服务。为确保提供的IT运维服务符合与用户方约定的质量要求.服务方应具备实施IT运维服务的基本条件和能力。运营管理体系模型主要包括人员管理、资源管理、过程管理、技术管理4个要素,在服务方4要素中。人员利用资源、使用技术,通过过程控制为用户提供IT运维服务,如图3所示。
图3 运营管理体系模型
在IT运维服务提供过程中.服务方需要通过策划、实施、检查和改进实现IT运维服务能力的持续提升。服务方需要对服务能力进行整体策划.提供必要的资源支持,实施服务能力管理和服务内容管理,保证交付的服务质量满足SLA的要求,并对服务结果、服务交付过程及服务管理体系进行监督、分析和评估,并进行有效的改进。
2.1.2服务能力管理
服务能力管理具体内容见表1。
2.2人员
2.2.1人员管理
人员管理的要求及关键指标见表2。
2.2.2岗位结构
岗位结构的要求及关键指标见表3。
2.2.3知识
对知识的要求及关键指标见表4。
2.2.4技能
技能要求及关键指标见表5。
2.2.5经验
经验要求及关键指标见表6。
2.3资源
2.3.1服务台
服务台要求及关键指标见表7。
2.3.2备件库
备件库要求及关键指标见表8。
2.3.3知识库
知识库要求及关键指标见表9。
2.4技术
确保服务方具备与IT运维服务策划相适应的技术和手段。在IT运维服务实施过程中,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,服务方应根据用户方要求或技术发展趋势,具备发现和解决问题、风险控制、技术储备以及应用新技术和前沿技术的能力。
2.4.1发现问题技能
对发现问题技能的要求及关键指标见表10。
2.4.2解决问题技能
对解决问题技能的要求及关键指标见表11。
2.5过程
过程描述了IT运维服务管理的过程要求。为了确保服务方具备相应的服务管理能力并发挥其效能,IT运维服务管理过程主要包括服务级别管理、服务报告、事件管理、问题管理、配置管理、变更管理、发布管理和安全管理等内容。
2.5.1服务级别管理
服务级别管理的要求及关键指标见表12。
2.5.2服务报告
服务报告的要求及关键指标见表13。
2.5.3事件管理
事件管理的要求及关键指标见表14。
2.5.4问题管理
问题管理的要求及关键指标见表15。
2.5.5配置管理
配置管理的要求及关键指标见表16。
2.5.6变更管理
变更管理的要求及关键指标见表17。
2.5.7发布管理
发布管理的要求及关键指标见表18。
2.5.8安全管理
安全管理的要求及关键指标见表19。
2.6 lT运维支撑平台
IT运维支撑平台是企业IT环境中实现正常运维工作的基础和管理平台。随着企业信息化程度的提高、IT环境规模的扩大、IT环境复杂度的增加和IT运维行业内服务竞争的加剧,如何保证IT系统安全稳定运行,为业务提供可持续性的支撑,最优化IT环境的性能,有效地控制IT成本和计划IT投资,这些都对IT运维行业提供的IT系统运行维护支持以及IT服务水平提出了新的要求和挑战,成为衡量一个IT运维行业企业的产品成熟度的重要标尺。
2.6.1平台建设的目标
支撑平台建设的总体目标是建立一个全面、稳定、高效、灵活的IT运行和维护管理体系,涵盖IT运维工作中的监、管、控3个方面。依靠对复杂异构的IT资源环的一体化监(面向业务服务的监视)、管(面向运维流程的管理)、控(面向日常运维的控制),最终达到保障IT基础架构稳定、可靠运行、降低系统和业务应用宕机风险、提高运维支持和服务管理效率、优化运维流程、建立绩效体系、控制运维成本、改进决策过程的目标.如图4所示。
图4 IT运行和维护管理体系
2.6.2用户申告管理
(1)工单管理
通过电子工单系统,实现电子工单的受理、派送、处理、答复和回访等整个流转过程的电子化,并实现对工单的查询、统计和分析。同时,还对每一个处理环节及处理过程进行监控,包括时限设定(如处理时限、回访时限等)、到达通知等。
(2)呼叫中心
实现以用户服务为主的呼叫中心.兼具呼入与呼出功能,在处理顾客的信息查询、咨询、投诉等业务的同时,可以进行顾客回访、满意度调查等呼出业务。
(3)投诉管理
用于对用户投诉进行网上协同处理.实现对从投诉的接收、登记、处理、归档、查询以及统计分析等一系列流程的管理。
(4)在线帮助
通过提供综合性、及时性、全面性的在线用户帮助系统,将用户常见问题的20%进行汇总,以Q&A的方式提供给用户,方便用户便捷地使用系统,快速提高用户自助能力,减少用户申告和申告处理时间,可以降低一线服务人员的工作量。
2.6.3运维流程管理
结合ITIL理念、梳理工作流程管理是指对用户申告、故障处理、操作变更等工作过程的管理,其目的是使工作过程标准化、流程化、制度化。工作流程管理在实践中主要是通过运维工单系统来实现的。
(1)服务报告
该系统的主要作用是规范服务报告管理过程并形成文件,存储并管理服务报告管理相关制度,让运维人员可以按照文件要求进行服务报告管理并留下记录,同时,定期对服务报告管理情况进行总结与评估,对发现的问题进行整改,以保证服务报告管理过程持续改进。
(2)事件管理
事件管理系统的主要作用是规范事件管理过程并形成记录文件,主要对事件的时间、地点、涉及人员、现象、解决方案、处理结果等内容进行记录,同时,存储并建立事件管理相关制度,作为运维管理依据,按照文件要求进行事件管理并留下记录,通过定期对事件管理情况进行总结与评估,对发现的问题进行整改,以保证事件管理过程持续改进。
(3)问题管理
问题管理的目标是将由IT基础设施内的错误引起的事故和问题对业务产生的负面影响减到最小。并防止与这些错误相关的事故再度发生。主要对问题的现象、原因、解决方案、解决结果、相关处理人员等信息进行记录,同时,存储并建立事件管理相关制度作为运维管理依据。按照文件要求进行事件管理并留下记录,通过定期对问题管理情况进行总结与评估,对发现的问题进行整改,以保证问题管理过程持续改进。
(4)变更管理
变更管理是为确保利用标准化的方法和规程有效、及时地处理所有变更.将由变更引起的事故对服务质量产生的影响减到最小或将事件数量减少。规范变更管理过程,建立变更管理相关制度,按照变更管理文件要求进行变更管理并留下记录。同时,定期对变更管理情况进行总结与评估,对发现的问题进行整改。
(5)配置管理
配置管理是为全面管理系统关键配置,防止配置的不合理变更引起的系统风险,主要包括主机、网络、软件平台、应用管理的主要配置项,存储配置管理规范和制度,按照配置管理文件要求进行配置管理并留下记录,同时,定期对配置管理情况进行总结与评估。
(6)变更管理
变更管理主要的管理范围是软硬件平台和应用配置方面的内容变化,通过规范化流程来规范变更的合理性、规范性、安全性、授权性等内容,变更管理也存储了变更规范和制度。按照变更管理文件要求进行操作并留下记录,同时,定期对变更管理情况进行总结与评估。
(7)发布管理
发布管理是指对经过测试后导入实际应用的、新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发。它由变更管理流程控制,该系统也存储了发布管理规范和制度,按照发布管理文件要求进行操作。
(8)安全管理
安全管理是对IT运维日常的安全风险、安全事件、安全规范、安全制度等内容进行流程审批控制,以防止安全事件发生。该系统也存储了安全管理规范和制度,按照安全管理文件要求进行操作并留下记录,对发现的问题进行整改.以保证安全管理过程持续改进。
2.6.4运维资源管理
(1)知识库
知识库包括在线即时帮助系统和可进行全方面复杂查询的维护知识查询系统,并能为维护人员在处理用户申告时提供查询资料。知识库的信息主要来源于处理用户申告等各方面的工作经验总结和其他途径获取的相关信息的积累。
(2)版本管理
版本管理平台主要用于管理并保存所有系统文档,包括基础交接文档、应用程序升级更新的各个版本文档,同时还用于存储应用基础程序、各种更新包和系统最新应用程序备份。
(3)配置管理
配置管理平台主要记录并保存维护系统中硬件、软件型号、内存、所属机房、维修保养日期等最终信息。除了记录并保存信息外,配置管理平台还应该能够提供信息查询功能、配置项变更提醒功能等服务。
2.6.5运维监控管理
(1)终端监控
数量众多的个人终端是IT维护的管理难点。终端管理平台通过在每个终端安装终端管理的软件.收集终端信息并发送到平台。在管理平台数据库进行自动登记.通过平台查看终端信息,对终端进行监控和管理。通过平台可发现终端的异常网络访问、异常流量等问题。如果终端上的软件或系统出现问题,可以通过终端管理平台进行快速恢复。
(2)系统监控
运维监控就是通过自动或人工等手段对IT系统的主机、操作系统、中间件、系统应用等运行情况进行实时检查.同时实现监控数据的统计、汇总分析等。自动监控可以利用网管工具、自写程序等手段定时、自动地查看主机、操作系统、中间件、系统应用、数据库等运行情况。
(3)网络监控
通过对网络资源进行监视、测试、配置、分析、评价和控制,达到实时监控运行性能、服务质量等目的。
(4)业务监控
以业务维护为导向要求加强对业务管理的监控。抽取系统与业务相关性.实现对业务重点功能模块以及数据异常的监控。
2.6.6运维安全管理
4A平台为维护人员与IT系统搭建起一个统一的操作台。对于系统,包括主机、操作系统、数据库、中间件等所有方面,不可直接联网接入进行操作,必须通过4A平台进行操作。维护人员在平台中操作并留下操作记录。
2.6.7运维考核管理
工作绩效管理的主要作用在于规范和明确运维人员的岗位职责和工作安排,并为绩效考核提供量化依据。工作绩效管理在实践中是通过统计分析系统来实现的。
(1)考核管理
结合用户的运维考核制度和考核办法,根据系统对日常运维工作的自动记录,考核模块能够实现对作业计划、工单调度、值班、代维等工作的考核管理功能。
(2)代维管理
针对行业特点和企业实际情况。增加代维管理。很多企业为了更加关注自己的核心业务并提高IT运维水平,将自己的全部IT运维工作或者部分IT运维工作外包给更专业的第三方。因此,有必要规范外包方与承包方之间的关系。
3 结束语
随着IT运维行业的不断发展,关注和从事IT运维行业的企业会越来越多,企业内部如何进行组织和实施。保障IT运维服务质量以及不断扩大的业务实现,是IT运维领域的一个焦点。通过本文的研究,IT运维企业可以从服务能力、人员、资料、技术、过程、支撑平台6个方面进行立体的分析和准备,为企业的IT运维服务业务组建提供指导和参考,对企业IT运维服务业务的发展具有重要意义。本文的研究方向符合我国提高全国信息化水平的“十二五”战略规划方向,有利于促进国内信息化产业结构调整和优化升级,提升信息化整体发展水平。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:IT运维框架研究
本文网址:http://www.toberp.com/html/consultation/1083939999.html