1 引言
传统电信企业的系统建设过程中,由于需求变化快速、系统数量巨大,系统建设往往按照各自应用需求来评估、采购、建设、维护各个应用独立的主机、存储、网络、数据库、应用服务器等资源,从而导致了竖井式或烟囱式的多套独立的系统,这种建设方式带来了大量的问题。
·项目建设周期漫长,难以快速满足市场需求。
·购买了大量不需要的处理能力。系统前期很难准确估算业务量和需要采用怎样的数据库资源支撑,导致某些系统的数据库长期处于非常空闲的状态,浪费了投资。
·缺乏集中管理和安全性保护。由于每个系统独立建设,每个系统的可用性、安全性都依赖于SI单独实现,规划复杂,实施难度大,导致较大的系统管理和安全性漏洞。
·难以随着业务需求的变化调整数据库资源。存在平时大量资源利用率普遍偏低和业务高峰值时资源不足的矛盾。例如,在中国移动通信集团公司某分公司负责建设和运维的增值业务中,有数十个独立的数据库平台,“139说客”的核心数据库服务器的平均CPU负荷长期在60%以上,而峰值可以长达24h超过90%,带来了很大的系统运行质量的隐患。也可能由于负荷高影响了业务响应时间,导致客户感受的受损。反之,也有不少数据库主机长期平均负荷在5%PA下,甚至持续看不到任何负载,造成了投资上的浪费。
因此,亟需打破原来这种烟囱式的建设方式,随着云计算技术的逐渐成熟和完善,通过云计算技术实现系统资源的共享、动态调整和按需分配,成为电信企业未来主要的探索方向。计算基础设施的发展如图1所示。
从电信企业系统运行情况来看,其核心的服务器和存储资源的50%1:A上是作为数据库平台部署的,所以如何实现电信级对数据库云平台的灵活部署,既可以实现“大分小”式,又可以实现“小合大”式的应用部署,对电信企业运营商而言极为重要。
图1 计算基础设施的发展
2 云计算背景知识
2.1云计算概念
NIST对云计算的定义:云计算模型能以按需方式,通过网络方便地访问云系统的可配置计算资源共享池(如网络、服务器、存储、应用程序和服务),同时以最少的管理开销及与供应商的交互,迅速配置提供或释放资源。
云计算是网格计算(grid computing)、分布式计算(distributed computing)、并行计算(paraUel computing)、效用计算(utility computing)、网络存储技术(network storagetechnology)、虚拟化(virtualization)、负载均衡(10adbalance)等传统计算机和网络技术发展融合的产物。
2.2云计算的服务模式
云计算是以服务的形式提供IT化能力。云计算所提供的服务形式可以分为IaaS(infrastructure as a service)、PaaS(platform 8.8 a service)、SaaS(softwal'e as a service),如图2所示。
IaaS主要关注基础设施(即硬件)虚拟化、资源共享、资源调配等硬件服务能力的提供,如果面向系统建设考虑,仍然需要进一步部署相应的平台软件(数据库、中间件等)和应用软件,所以IaaS层提供的云服务管理粒度只在硬件层面,对平台软件和应用软件的部署和管理几乎没有涉及。
图2云计算的3种服务模式
在提供云服务的过程中,硬件作为基础设施层,仍然需要承载平台和应用软件能力,所以大部分企业更多地关注业务层面的平台软件方面的服务化,即PaaS层服务能力。IOUG对企业客户云计算服务的关注调查如图3所示。
PaaS层主要关注提供平台软件的服务能力(如数据库、中间件等),所以实现PaaS层服务模式,可以有两种技术选择:一种是基于laaS层提供的硬件基础设施,再通过PaaS管理平台来部署和管理平台软件服务:另一种是直接通过一体化的解决方案来实现软、硬件的统一管理、部署、资源分配和回收。前一种方式存在管理的复杂性、兼容性问题,甚至还可能存在严重的性能瓶颈和整体运行风险的问题。如中国移动通信集团公司广东分公司(以下简称广东移动)在基于x86服务器上通过虚拟化技术来实现Iaas层资源池,再部署Oracle数据库和业务应用,通过实际测试发现,性能损耗超过40%,而且还存在OracleRAC数据库没有在VMWare平台得到厂商官方支持的问题,一旦遇到系统问题,诊断、解决时都存在很大的潜在运行风险。
图3 IOUG对企业客户云计算服务的关注调查
通过软硬件一体化PaaS层云服务。形成共享资源池,同时提供平台级软件能力,然后按照各个应用需求在PaaS资源池中申请硬件资源、获得软件服务的方式,不断部署不同的业务应用,实现系统的集中化整合。这样可以有效节省计算和存储资源、机房空间、耗电和配套设施、人力维护成本,提高系统的可靠性、扩展能力、计算能力,避免出现业务要求和系统支撑能力不匹配的问题。
3 电信级数据库云平台理想架构和最佳实践
3.1 电信级PaaS数据库云平台的理想架构
根据以上分析,从效率、管理、集成、兼容性角度来看,实现数据库云平台的最佳方式是软、硬件一体化PaaS平台解决方案。而PaaS云一体化解决方案需要从4个主要方面考虑。
·构建可不断堆叠、可线性扩展、分布式的服务器资源池:
·构建可不断堆叠、可线性扩展、分布式的存储资源池:
·构建服务器与服务器之间、服务器与存储之间的高速互联网络:
·构建软硬一体化、统一的云管理和云治理平台。
由于在电信系统中,数据库呈现多元化和混合型特点。既有大量的小规模数据库,如增值业务系统、政企客户系统等,也有很多超大规模数据库,如计费、CRM、话务网管等;既有OLTP为主的系统,如CRM、呼叫中心等,也有很多以OLAP型为主的系统,如数据仓库、数据集市等,还有很多OLTP和OLAP混合型系统,如结算、账务、网管等,既有以本地区为主导的系统,又有全国型集中化的系统。所以对数据库云平台的要求也呈现出一定的电信级要求。
·灵活的资源分配和管理能力,可以同时支持“大分小”和“小合大”两类要求。
·混合型数据库架构,既可以支持“数据库集群”型的OLTP交易,又可以支持“数据库集群”型的OLAP处理。
·极高的处理性能,保证数据库云平台可以支撑大量数据库应用。
·极高的扩展能力,保证数据库云平台可以不断地线性扩展。
·极高的可靠性,保证业务的连续性。
·高性价比、低能耗。
·完善、统一、可视化的管理能力。
满足电信级数据库PaaS云平台要求的理想架构,需要软件和硬件的有机结合来构成,每个组成部分既需要硬件能力,也需要软件特性配合来实现整体目标。
3.1.1计算资源池
从硬件来看,这一部分是运行数据库的主要部分,需要实现低成本化堆叠、分布式网格计算能力,所以需要多服务器、多CPU协同、网格集群化的运行环境。为了实现这个目标,利用低成本的x86架构的多服务器堆叠,配合共享磁盘架构数据库集群是最理想的架构,因为多台x86架构可以提供低成本、快速的扩展能力,但与小型机相比。x86架构的可靠性不够,可以通过共享磁盘架构的数据库集群来提高整体运行的可靠性,同时能够发挥多服务器的分布式并行处理能力。
从软件来看。计算资源池要求能够对资源进行灵活的分配和管理,既可以将一个服务器的部分资源分配给一个特定应用,即“大分小”,也可以将多个服务器资源整合成为一个应用。即“小合大”。同时还能够在资源池内部和外部按照需要动态调整原有分配的资源关系,EtCH随需增加或减少一个应用服务所占的CPU、内存等。
3.1.2存储资源池
从硬件来看,作为数据库的存储部分,具备低成本、分布式并行特点,可以通过多个小的存储单元堆叠方式不断地进行线性扩展,构成大规模存储资源池:同时作为数据库存储,需要具备大容量的多级缓存机制,使得数据库中的热点数据可以通过缓存来提高处理性能;另外随着数据量的不断增加,存储单元需要具备足够的CPU和计算能力,参与到数据的预处理过程中来,以减轻数据库服务器所需处理的数据量。
从软件来看,由于电信企业数据规模的不断增加,特别是网络运维应用包含大量的网元数据,需要存储具备较高的数据压缩比,以节省存储空间,另外存储侧可以通过并行化的方式对数据进行预分拣和预过滤,提高数据的处理效率。
3.1.3网络互联
在数据库云平台方面,需要采用大量的主机集群及存储集群,为了让这些集群能够发挥最佳的效果,必须使用效率最高的内部网络把它们连接起来,目前比较成熟的网络技术主要有万兆以太网以及Infiniteband,如图4所示。这两种技术都可以提供高速的内部连接,用来实现主机之间的集群连接、存储单元之间的互联以及主机到存储单元之间的数据连接。
图4 网络互联技术
3.2符合电信级PaaS数据库云平台要求的最佳实践
从目前实践来看,要符合电信级数据库PaaS云平台的要求,Oracle的Exadata数据库云服务器是一个理想选择。
3.2.1分布式服务器资源池
Exadata数据库云服务器可以通过整合多服务器的计算资源,形成一个巨大的资源池,许多不同的数据库可运行于同一Exadata数据库机器上。
DB服务器通过共享配置方式使不同数据库应用运行在指定的资源范围内,可以通过Service的方式实现数据库服务的虚拟化,应用以Service的方式连接并运行于一个或多个动态的数据库节点上,可以动态地增长、回收和移动。通过Service虚捌化可以实现“大分小”和“小合大”的虚拟化应用。
·大型数据库可通过RAC技术跨越多个物理节点;
·多个小型数据库可以通过共享运行于同一个物理节点。
对于多个数据库运行于同一节点的情况,实例绑定(instance caging)技术提供可预知的CPU核心资源,可限制数据库运行于特定的处理器的子集上,如图5所示。
通过数据库虚拟化和整合多应用数据库于Exadata数据库云平台,可以使得各个应用数据库的资源利用率得到有效的整合和提升,以节省更多的主机、存储、机房、软件License等资源。
如企业有3个主要应用在数据库云平台运行,3类应用分别以Sales App、ERP App和HR App表示,如图6所示。数据库云平台可以分别给3类应用构建服务器资源池(server poo1)和空闲资源池(free pod),3类应用分别通过相应的数据库服务接口连接Exadata数据库云平台。根据实际业务需求,销售部门应用需要持续地使用较多的数据库云资源,数据请求需要优先得到满足。ERP类应用对数据库云资源的需求弹性较大,随商务周期可能会有所变动,同时数据请求的优先级较销售部门低。HR类应用对数据库云资源需求相对固定,且所需的资源最少,数据请求的优先级最低。Exadata数据库云平台可以按照每类应用对资源的需求进行管理和动态供应。
在ExadaIa数据库云服务器中,不同应用数据库部署在多个数据库服务器集群中,当应用负载和请求增长时,原有计算资源不足以满足要求,服务质量会下降(预定义策略),数据库服务可以在数据库云平台中动态扩展到资源空闲的服务器中运行,提高该服务的服务质量。
3.2.2分布式存储资源池
Exadata数据库云服务器本身就集成了ASM(自动存储管理)的存储管理功能,用来实现存储的虚拟化、高扩展、高可靠的特点。
通过Oracle ASM进行存储虚拟化后,不但可以实现存储的性能水平扩展,而且可以实现存储的高可用、自管理能力。加入ASM管理的存储可以划分为不同的磁盘组,当数据存储在磁盘组中时,数据会均匀分布到磁盘组的各个存储单元,实现数据均匀分布,当磁盘组中增加或减少存储单元数量时,数据会被动态地重新分布,避免出现任何的热点磁盘。
图5 实例绑定技术
图6 数据库云平台的3类应用
图7 智能存储技术的处理
Exadma将数据库计算分成计算密集型处理和存储密集型处理,分别在DB服务器和存储服务器完成。采用智能存储技术(Smart Scan),实现了存储层完全并发式、智能化的预处理,提高了数据的处理效率,并降低了DB服务器的处理负担,如图7所示。
3.2.3高性能互联网络
Omcle Exadata Stora鼯在服务器和存储之间使用了Intlniband互连。Exadala单元具有高可用性的双端口4倍数据速率(QDR)Intlniband连接。每个Intlniband连接提供了40 GB的带宽,高于传统存储或服务器网络许多倍。而且Oracle的互连协议使用直接内存访问(DMA),直接将数据从线缆转移到数据库缓存,没有额外的数据拷贝,以确保极低的CPU开销。Infiniband网络具有LAN网络的灵活性和SAN的高效性,使用InfimBand网络后,Oracle可确保网络不会成为性能瓶颈,其也为0racle数据库真正应用集群节点提供了高性能集群互连。
3.2.4集中化、统一的云平台管理
0mck Exadafa与Oracle企业管理器fEMl网格控制进行了集成,可轻松监视Exadata环境。在现有的EM系统中安装Exadata插件后,可以监视Exadam Slorage Server上的统计信息和活动,并将事件和警报发送给管理员。EM系统与Exadata集成的优势介绍如下。
·监视Oracle Exadata存储;
·收集存储配置和性能信息;
·根据阈值设置发出报警和警告;
·在历史数据的基础上提供丰富的现成量度和报表。
所有的功能用户均期望可以配合使用Oracle企业管理器和Exadata。用户可以使用EM界面轻松地管理Exadam环境和其他以往结合企业管理器使用的Oracle数据库环境。DBA可以使用熟悉的EM界面来查看报表以确定Exadata系统的状况并管理Exadata存储的配置。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:企业级数据库云平台的建设与运维方案(上)