引言
信息集成是消除企业内信息孤岛、实现信息共享、提供决策支持的核心技术,而数据中心是信息集成系统的基础,具有重要的学术和应用价值,一直是近年来的研究热点,也是电力企业在坚强智能电网关键设备(系统)研制规划中力争解决的重点问题之一。
为了实现信息共享和应用集成,电力企业正在研究建立智能变电站数据中心、电力调度中心统一数据平台、配电网信息集成平台以及企业信息平台等。国家电网公司在公司总部和各个网省公司构筑了由数据中心、数据交换、应用集成、企业门户等部分组成的一体化企业级信息集成平台,并于2011年5月在北京、上海、西安建设了集中式信息系统灾备中心,以保障数据安全。电力数据中心和灾备中心作为电力企业信息资源的存储、处理和备份中心,对于实现信息的纵向贯通和横向共享起到至关重要的作用,但是,目前的电力数据中心还远未达到智能电网与新一代数据中心所要求的海量数据存储与计算、自动化管理、节能环保与高可用性的水平。
电力数据中心目前日均新增数据记录5000万余条,还尚未完全接入企业资源计划、调度自动化、状态监测、空间地理、气象等系统的数据,特别是随着可再生能源以及分布式电源的不断接入,电力数据中心的数据量将剧增,对海量智能电网信息的存储与处理将提出更高的要求。数据量的剧增,将造成电力数据中心规模的增大,带来的问题是碳排放和耗电量的不断激增,全球权威机构Gartner调查显示,信息技术行业每年的二氧化碳排放量约为3500万t,占全球总排放量的2%,数据中心成为碳排放大户,而数据中心服务器的资源利用率普遍很低,平均在10%~30%之间,因此绿色高效与高可用性已经成为电力数据中心应重点解决的问题之一。另外,目前电力数据中心采用总部与网省公司的两级分布式结构,面对数据中心数据大集中的发展趋势,应进一步聚合数据资源,解决数据交换瓶颈问题,提供统一的数据中心监控管理平台,降低管理成本。
自从Google首次提出云计算概念后,亚马逊、微软和雅虎等公司相继提出了各自的云计算解决方案,美国、韩国、中国等政府相继宣布了国家云计算发展战略,将云计算提升到前所未有的高度,云计算技术已经成为近年来国内外的热点研究问题。由于云计算可以满足新一代数据中心对网络、存储与计算的业务需求,并能提供丰富的应用服务,数据中心已成为云计算发展最快的领域,部分大型企业相继开展各自云计算数据中心的研发,例如中国移动的“大云”、中国电信的“e云”与中国联通的“互联云”等。
本文在分析现有电力数据中心的逻辑结构与功能的基础上,研究了服务器虚拟化与虚拟机的实时迁移,并对现有电力数据中心的服务器等资源进行虚拟化,提高资源利用率。设计了基于Hadoop的电力数据中心云计算平台,为智能电网的业务系统、数据挖掘与辅助支持等高级应用提供海量数据存储、管理与高性能计算环境。为保障现有电力数据中心向云计算平稳过渡,提出分阶段的过渡策略。
1 现有的电力数据中心
现有电力企业数据中心的核心功能主要包括数据获取、数据存储与管理、数据访问,其逻辑结构如图1所示。
图1 现有电力企业数据中心的逻辑结构
数据获取层通过提取、转换和加载(ETL)提取来自安全生产、营销管理、物资管理、财务资金、人力资源、协同办公、项目管理以及综合管理等业务系统的数据,转换为规范的、无冗余的基础数据,加载到主题数据库。数据存储与管理层对主题数据库进一步进行ETL,生成多维度的分析性数据存储在数据仓库中,并实现数据编码和元数据的管理。数据访问层提供统一的数据展现界面,实现查询统计、联机分析处理(OLAP)、数据挖掘与辅助决策等功能。
各个网省公司和直属单位的数据中心根据国家电网公司的典型设计,在满足基本功能和关键指标的基础之上,根据自身的安全生产与设备管理等业务特点与需要来进行建设。由于各个省的业务系统存在较大的差异性,数据中心在建设过程中,服务器、网络、存储、电力、监控和环境调节等设备以及数据库与数据仓库等软件系统难以避免地存在较大差别,同时,软件、硬件、数据、资源与安全的管理和维护上采用不同的技术和管理工具,众多的管理工具及设计缺陷导致管理复杂甚至管理功能的缺失,使得数据中心管理与维护成本高。
现有电力数据中心满足不了未来智能电网对海量全景信息存储、共享与处理的需要。随着智能电网的建设,电力数据中心必须涵盖智能电网中各个新系统所需要的全部海量数据,很难存储在标准关系型数据库甚至数据仓库中。智能电网需要数据中心提供更丰富的信息服务,并为数据挖掘与辅助决策提供高性能的分布式计算环境。
2 基于云计算的新一代电力数据中心
2.1 电力企业云计算数据中心的基础架构
采用云计算技术对现有的电力数据中心进行改进,建立面向智能电网的新一代电力数据中心,其基础架构如图2所示。
图2 电力企业云计算数据中心的基础架构
在基础设施层,利用虚拟机监视器或虚拟化平台对服务器、存储设备与网络设备等硬件资源进行虚拟化,屏蔽各个网省公司和直属单位千差万别的硬件资源,以虚拟机为单位进行统一的自动化管理,包括资源抽象、资源监控、资源部署、负载管理与安全管理等,一方面可以提高资源利用率,另一方面使管理维护人员摆脱对服务器等硬件资源、操作系统与中间件的繁重管理工作,专注于虚拟机与业务系统的维护,从而简化数据中心的管理与维护工作。
在云计算平台层,以虚拟机为单位构建Web服务器集群、应用服务器集群与数据库服务器集群,作为数据中心的运行环境。采用云计算的分布式文件系统、分布式数据库管理系统、分布式数据处理系统、数据仓库与数据分析工具实现智能电网海量数据的大规模存储,为数据挖掘与辅助决策等高级应用提供高性能的分布式计算环境。利用现有的企业服务总线实现安全生产、营销管理、空间地理、状态监测以及新能源等智能电网业务系统的数据共享与应用集成。
云计算作为一门新兴技术,将其应用于电力数据中心需要解决以下关键问题。
2.2 服务器虚拟化与虚拟机的实时迁移
服务器是电力数据中心最主要的硬件资源,其资源利用率直接影响电力数据中心性能。Gartner的调查报告指出,当前企业数据中心的绝大多数x86服务器只运行一个应用,服务器的中央处理器(CPU)利用率平均为5%~20%。出于可靠性和性能的考虑,目前电力数据中心的业务系统多是分别运行在不同的物理服务器之上,例如项目管理与综合管理系统分别运行在各自独立的物理服务器上,很多情况下服务器资源利用率低。在新型电力数据中心,对服务器进行虚拟化,将一个服务器虚拟成若干个虚拟机,以提高服务器的资源利用率,图3给出了一个电力数据中心服务器虚拟化的示例。
图3 电力数据中心服务器虚拟化示例
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:基于云计算的电力数据中心基础架构及其关键技术(上)
本文网址:http://www.toberp.com/html/consultation/1083976750.html