在“十一五”期间的后半期,广东电网公司加大力度推进信息化建设,广东电网公司信息中心完成大平台架构建设,即建设基于虚拟化和容灾备份、按业务系统服务级别供给资源的基础架构,各地市供电局皆实施个人计算机(personal computer,PC)服务器虚拟池建设,部分地市供电局实现小型计算机虚拟池、存储虚拟池建设以及信息系统高可用性改造。在“十二五”阶段,广东电网公司将在“6+1”(即营销、资产、财务、综合、人力、协同办公6大系统以及企业分析决策系统)网级大集中系统的建设规划下,实现电网企业信息化建设的集团化运作、集约化发展、精益化管理和标准化建设的目标。由此带来以下急需解决的问题:如何在保障业务系统性能和稳定性的基础上,有效地利用广东电网的信息技术(information technology,IT)资源;如何在人力资源适度增长的情况下,持续提升运维管理质量和效率。
本文通过分析广东电网公司信息化基础架构的现状,总结广东电网信息化基础架构云管理平台的建设需求,结合云计算的相关技术,详细阐述跨数据中心一体化协同分布式云管理平台的建设内容。
1 云管理平台的基本概念
对于云计算,目前还没有统一的定义。引用美国国家标准与技术研究院的定义:云计算是一种模式,以按需方式通过网络方便地访问云系统可配置的资源共享池,它以最少的管理开销以及与资源提供者最少的交互,迅速提供或释放资源。云计算具有广泛网络接入、资源池化、快速弹性、服务可测量、多租户和按需自助式服务等特征,因此引入云计算技术可以提升整体信息化水平。
分布式数据中心一体化协同管理是中国南方电网有限责任公司一体化管理战略中信息一体化管理的重要体现,旨在实现信息资源的统一整合、管理和灵活调配,推动集团化管理模式的真正实现。
云管理平台的自动化操作、标准化供给,旨在以自动化工具替代手工操作,将IT人员从繁重的日常运维工作中解放出来,提高劳动效益,减少因疲劳等造成的人为错误。
2 广东电网云计算应用需求
2.1 广东电网信息支撑平台现状
从架构层面看,目前广东电网信息支撑平台为省、地两级架构,除少部分省级集中系统外,其他系统的主要业务逻辑在各直属单位,各地市供电局仍有数百台设备。从建设模式层面看,广东电网信息支撑平台为传统架构与虚拟化架构的综合体,各地市供电局皆已实施PC服务器虚拟化,部分地市供电局实施了小型计算机虚拟化、存储虚拟化和信息系统高可用性的改造。
各直属单位虚拟化实施程度不一,有些仅对边缘系统实施了PC服务器虚拟化,有些(如广东电网公司信息中心)则实施程度较深。广东电网公司信息中心使用了14台高端物理PC服务器,搭建4个虚拟化集群,共承载原本需要200多台PC服务器运行的多个应用;采用了12台一档小型计算机,实施近50个分区;采用了1套统一存储管理设备,共4个管理节点,管理数十台存储器;实现了各地市供电局核心数据省级集中备份;对“三大核心”(即省级集中的资产系统、财务集中核算系统和财务管理信息系统)的应用实施应用级同城容灾。
2.2广东电网信息支撑平台建设需求
面对“6+1”网级大集中系统的建设和实现集团化运作、集约化发展、精益化管理、标准化建设目标的需求,广东电网新一代信息支撑平台需具备以下能力:
a)基础设施层面。可实现平台资源的整合和快速提供,在不中断业务条件下平滑调整资源,实现基础设施的高可用性和高可靠性。
b)集中管理层面。统一管理广东电网全省资源,灵活调配,减小广东电网公司信息中心设备的增量;计算任务分布式分发至多个数据中心,进一步实现集约化管理。
c)自动化、标准化部署层面。实现主机、存储设备、网络、中间件、数据库和应用软件等多种计算资源的一体化管理、标准化供给和自动化操作,完成从底层硬件至上层业务应用的一体化智能管控。
广东电网信息支撑平台的演进路线如图1所示,其目标是建立基于企业广域网的云数据中心,实现资源统一弹性调配和智能管理。
图1 广东电网信息支撑平台的演进路线
3 跨数据中心一体化协同分布式云管理平台
3.1总体规划设计
2011年,广东电网公司信息中心采用云计算、物联网和数据保护等先进技术并配套运维管理组织流程的变革,设计了全新的基于云计算技术的一体化绿色智能信息支撑体系,大大提高了IT基础设施建设和管理水平。该体系包括三大组成部分:基于虚拟化和高可用技术的绿色智能电网信息化基础架构,基于绿色智能电网信息化基础架构的云服务能力提供,包含监控、安全、运维、自动化和服务交付的管理即服务。
管理即服务是基于ISO 20000和IT基础架构库(information technology infrastructure library,ITIL)的服务管理理念,按照绿色智能电网信息化基础架构和云服务能力创新设计的一套整体运维管理体系,包括运维管理组织流程和管理平台。该体系从下至上实现端到端监控,对可靠数据中心进行智能化监控管理,适应多数据中心云平台的信息服务管理,实现从物理设备到上层应用自动化管理标准化供给的云平台一体化资源自动化管理、跨地域资源统一管理和协同调配,具体如图2所示。
图2 广东电网公司基于云技术的一体化绿色智能信息支撑体系
在一体化绿色智能信息支撑体系中,跨数据中心一体化协同分布式云管理平台包含跨数据中心分布式云管理和云平台一体化资源自动化管理。其中跨数据中心分布式云管理对广东电网的全省虚拟化资源池进行管理,实现资源的按需供给、计量考核、跨数据中心的灵活调配以及计算任务的分布式分发;云平台一体化资源自动化管理实现主机、存储设备、网络、中间件、数据库和应用软件等计算资源的自动化操作和标准化部署。
3.2云管理平台建设内容
3.2.1平台技术架构
跨数据中心一体化协同分布式云管理平台基于虚拟化技术,结合标准化和自动化技术实现对绿色智能动态基础架构的管理。在自动化方面,实现动态优化管理,包括资源动态迁移和操作自动执行;在标准化方面,实现标准映像库管理,包括集中映像管理和标准映像的创建、捕获、导人、部署;在虚拟化方面,对虚拟机进行管理,包括创建、变更、删除虚拟机和管理多个管理程序。
3.2.2平台部署架构
跨数据中心一体化协同分布式云管理平台以资源池为管理单元,通过管理虚拟化的X86系列服务器和小型计算机集群的管理节点,实现对资源池的管理;通过对用户设置不同的权限,控制用户所能使用的资源池,可以允许被赋予权限的用户使用跨地市供电局的资源。平台采用分布式部署模式,在广东电网公司信息中心部署平台的同时,在地市供电局部署镜像库和监控模块,有效避免跨数据中心资源创建(或分发)镜像库文件以及监控数据采集受网络带宽制约等问题。平台部署架构如图3所示。
图3 跨数据中心一体化协同分布式云管理平台部署架构
3.2.3平台主要功能
资源池管理:以各直属单位为最高管理单元,逐级往下展开各单位拥有的资源池、资源池拥有的集群、集群下属的虚拟机,并展示虚拟机当前状态和使用情况。
系统资源管理:以业务系统为管理单元,动态展现业务系统中各虚拟机的状态和使用情况,增、删系统内的虚拟机,并对业务系统有效期进行修改。
自动化管理:自定义配置脚本和操作流程。服务器管理:修改、启动、停止和重启虚拟机,自动安装软件,创建、恢复和删除映像。存储管理:存储设备、存储池、存储分级、卷容量、数据复制、数据快照和数据迁移的管理。网络管理:网络设备的管理和配置。
权限管理:有云平台管理员、单位管理员和普通用户3种权限,实现单位管理、项目组管理和用户管理3大功能。
其他:监控、计量、拓扑、资产和告警管理。
3.3云管理平台应用案例
跨数据中心一体化协同分布式云管理平台自2011年底投运以来,在跨地域资源调配、资源在线弹性扩展、自动化部署安装和分布式任务调度方面展现其平台价值。
3.3.1跨地域资源调配
跨数据中心一体化协同分布式云管理平台统一管理广东电网各地市供电局资源池,当某地市供电局资源不足时,分配其他地市供电局的资源供其使用。具体步骤如下:
a)供电局1发出10台具有2个中央处理器(central processingunit,CPU)、8 GB内存、300GB磁盘的虚拟机申请。
b)在申请过程中本地资源池报错、资源不足(或通过计量管理功能发现本地资源不足)。
c)供电局1管理员向信息中心云管理平台提交资源申请,信息中心云管理平台的管理员通过计量管理功能判断某供电局凡的资源可以满足需求。
d)信息中心云管理平台的管理员修改供电局1管理员资源池使用权限,使得供电局1管理员具有供电局n资源池使用权限。
e)供电局1管理员在供电局凡资源池内创建并使用10台虚拟机。
实现跨地域资源调配的主要效益是资源的统一管理、使用和灵活调度。
3.3.2资源弹性可扩展
设网络教育培训系统在线考试模块1年仅使用2次,平时无资源消耗,使用时资源消耗高且具体使用量难以估计。因此网络教育培训系统的最优部署架构是:平时运行除在线考试功能之外的其他功能,有考试需求时可以及时启动在线考试模块,在线考试模块提供的能力随考试人数的增多而增加。具体步骤如下:
a)在网络教育培训系统界面触发在线考试功能。
b)云管理平台根据预设的模板自动生成包含在线考试应用程序的虚拟机,并自动进行数据库连接和应用集群的添加。
c)监控模块在后台进行监控,当虚拟机资源使用率达到预设的阈值时,自动生成新的虚拟机,并自动进行数据库连接和应用集群的添加。
d)考试结束,在网络教育培训系统界面触发考试结束功能,云管理平台自动回收虚拟机。实现资源弹性可扩展的主要效益是资源的在线弹性伸缩和提高资源的总体使用率。
3.3.3自动化快速部署
设领导班子与人员考评系统每年只需使用1次,但每次使用前的软、硬件环境准备耗费时间长,完成广东电网公司及下属80个单位的软、硬件安装部署共需120人/日。通过云管理平台仅需1天就能完成系统的部署。
实现自动化快速部署的主要效益是实现重复性实施和运维工作的标准化、自动化,大大提高工作效率和质量。
3.3.
4分布式任务调度电力营销系统每月1次的电费计算采用全省集中算费方式,至少需要1台满配置最高端小型计算机,且系统运行风险较高。通过对基于跨数据中心一体化协同分布式云管理平台进行应用改造,营销系统将算费任务分发到多个计算节点进行并行计算,计算节点将计算结果返回营销系统。当计算任务完成后,营销系统向云计算管理平台发送资源回收请求,云计算管理平台自动回收虚拟机。
实现分布式任务调度的主要效益是降低对单一资源的要求和总体成本。
4 结束语
跨数据中心一体化协同分布式云管理平台基于虚拟化,实现资源的统一管理和灵活调配、计算任务的分布式分发、资源的标准化供给和自动化操作,为广东电网信息基础平台建设实现集团化运作、精益化管理和标准化建设提供有力支撑。目前该平台已完成广东电网公司信息中心和广东电网公司东莞供电局等单位的实施部署并投入生产运营,效果良好。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:跨数据中心一体化协同分布式云管理平台建设