4 数据库PaaS云平台带来的运维和管理的转变
4.1 数据库PaaS云平台的运维管理模式
从本质上来说,云计算并不是一种技术的革命,而是一种管理模式的革命。云计算的技术基础,不论是服务器虚拟化、存储虚拟化,还是平台软件级别的集群和资源控制,都是已经存在了若干年的技术。从技术手段上来说,这些技术手段短则出现了10年,长的在30年前就已经存在了(如服务器虚拟化)。但是云计算之所以能对IT的建设和运维带来新的创新,关键在于对整个IT架构的日常管理和运维带来的革命性变更。将所有的资源虚拟化后,伴随着动态可调的能力,大大加快了新应用建设在平台层的建设速度,而且能按照实际的运行情况进行动态调整。
但是这种管理模式革命性的变更,也带来了对应用/系统管理维护的新需求。传统方式中,在大多数的实际情况下,应用软件的开发商SI不仅仅是对自己的应用提供运维,而且也对其应用之下的平台软件/硬件进行主要的运维操作,并根。据实际运行的情况,对用户提出基础架构扩容和调整的需求。在采用PaaS提供数据库云的方式下。之前的SI全部负责的方式必然不可行。因为SI不再负责包括基础硬件和数据库软件的数据库平台的运维,而只是一个数据库作为服务的消费者,必须要有第三方负责相应云平台的运维。同时,由于实际的情况,SI往往会提出自己的数据库服务需要的资源变更请求,对于这些资源变更请求的评估和批准。当然也应该由SI之外的人员/组织予以完成。简单总结一下,在采用数据库云平台后,原来的SI和最终用户的关系会演变成如下4方面的关系,如图8所示。
首先引入的是SI的数据库云平台维护者,负责对数据库云平台的日常监控、安全管理等工作。而且需要由数据库云平台管理者负责对开发商提出的资源变更需求进行决策,判断是否应当进行资源调整。数据库云平台的管理者也需要根据实际业务的情况和云平台维护者给出的系统报告。主动地进行资源调整,以确保系统的资源利用率和各个应用的服务质量。
这样的管理模式变革,对数据库云平台也提出了相应的技术要求。例如,必须有完整的监控手段,监控各个应用资源的使用情况,而且不仅仅是监控。还需要提供更高层次的诊断和优化工具,避免由于SI开发应用的低效率而导致的资源浪费,避免谁的应用越烂,谁就能分配更多资源的不良情况。
对于数据库云平台的维护者来说,也需要更高的技能提升,能在多租户的情况下,从数据库的运维上升到数据库云的运维。对平台维护者来说,也是一个全新的课题。
4.2 目前在数据库PaaS云平台上的运维管理实践
基于广东移动网络运维部门数据库系统多而杂的特点,在数据库云平台部署过程中,对云平台的管理和运维也相应总结了一套实用的管理流程。其主要涵盖了从部署云资源池、应用申请云平台资源需求、评估和审批资源,到部署应用服务和所对应的计算和存储资源、服务资源SLA管理和按需资源调度。再到最终应用退出和资源回收的一套完整过程。下面简单举例说明部分管理流程要点,如图9所示。
图8 原来的SI和最终用户的关系
图9 部分管理流程要点
4.2.1创建资源服务池
首先基于Exadata构建广东移动网络运维的多个数据库资源池,分为OLTP型应用资源池、OLAP型应用资源池、空闲资源池等,如图10所示。将部分服务器划分在各个对应的资源池内。
图10 数据库资源池分类
4.2.2评估原有生产系统业务特点
对原有各个生产系统进行调研和评估,评估原有系统的硬件配置和系统容量,如图11所示。对应用特点进行评估,评估业务特点和处理峰值。评估业务系统迁移到Exadata数据库云平台后,对所需的存储和计算能力需求以及对应用的重要程度进行评估分类,以便在数据库云平台中进行资源控制和服务级别管理。
4.2.3创建业务服务并配置对应分配的资源
将各个业务应用创建成数据库应用服务,在所对应的资源池内进行部署,并按照各个数据库应用服务的评估所需的资源进行初始资源划分,如图12所示。并按照各个应用服务服务的生产规律性周期频度,进行规律性资源计划定义。
5 现网应用效果对比
5.1性能对比
经过实际测试,基于现网真实数据和应用,测试Exadata数据库云平台的多/直ffi(0LTP+0LAP),性能提升从44倍到6 750倍。原来数小时的大作业类似于OLAP,目前只需要几秒钟完成,基本都提高了上千倍。原来大量循环+游标类似于OLTP的存储过程也有“倍和127倍的提高,见表1。
表1 实际测试结果
5.2系统扩展能力
对于Exadata的数据库云平台扩展能力测试,告警SQL5(CPU高负载SQL,SQL达34 KB)从1/4配(执行时间0:01:08)扩展到1/2配(执行时间0:00:31)时,可以明显发现执行时间线性减少(从68 8到31s),如图13所示。
图11 原有生产系统评估实例
图12 初始资源划分
图13 数据库云平台扩展能力测试
5.3压缩比
经过测试,用现网生产数据在Exadata数据库云平台中压缩存储,Exadata对两个大表的压缩率分别可达到7倍和10倍,见表2。
表2 压缩比测试结果
5.4数据库云服务资源池和服务定义
配置两个数据库服务Servicel、Service2,可以在数据库云服务虚拟池内实现服务的动态扩展、回收和迁移。建立ora.gmsp服务池,管理dm01db01、dm01db02两个服务器的资源。Srvctl add srvpool—g ora.gmsp—10一u—1—i0一n dm01dbol。din01db02也可以在Oracle企业管理器界面中添加服务器池。
添加dbfsdg_mount资源具体操作方法如下。
·在Oracle企业管理器界面中服务器集群dm01一cluster上的资源管理处添加资源。
·资源名:dbfsdg_mount。
·资源类型:local—resource。
·操作程序:代理文件和操作脚本。
5.5服务资源分配
在数据库云平台内,可以按照业务优先级配置系统资源供给。能够配置的资源包括业务的CPU、内存、并发会话数以及I/0优先级和吞吐量。
通过在Oracle企业管理器界面中定义资源计划,可以基于多种条件将不同的会话划分到多个资源组中,对不同的资源组分配不同的CPU资源,分配CPU资源可以基于CPU百分比,定义多个优先级进行分配。
5.5.1对CPU的分配
在系统中定义了0LTP-GROUP、OLAP__GROUP和OTHER GROUP 3个资源组,根据需求,为不同的资源组分配不同的CPU比例。
·OLAP GROUP:60%。
·0U11P_GROUP:20%。
·OTHER_GROUP:20%。
通过分配,可以保证资源组中的会话获得所需的CPU资源,高优先级的会话获得更多的资源。
5.5.2对最大活动会话数的分配
通过定义O皿GROUP、OLAP_GROUP和OTHERGROUP3个资源组,对资源组中的用户限制最大活动会话数。
·OLAP_GROUP:300。
·OLTP_GROUP:50。
·OTHER_GROUP:100。
资源组中的用户的并发会话不能超过设定的上限,超过上限的会话创建请求会被放置在队列中。
5.5.3对I/O资源的分配
通过定义OLTP_GROUP、OLAP_GROUP和OTHER_GROUP 3个资源组,对可使用的I/0带宽和每秒钟的I/0次数进行限制,保证高优先级的用户获得更快的I/O响应。
·OLAP_GROUP:每秒最高I/O带宽使用10 000 MB,I/0次数上限为100 000次。
·0LTP—GROUP:每秒最高ⅣO带宽使用100 MB,I/0次数不受限制。
·OTHER—GROUP:每秒最高I/0带宽使用1 000MB,I/O次数不受限制。
5.6集中化管理和监控
通过云管理平台监控系统运行情况,可查看主机、存储、网络、数据库等基本信息,查看日志和告警信息等。
登录Oracle企业管理器的管理界面,在目标主机中找到Exadata的主机,打开主机后在性能选项卡中可以看到CPU、内存、磁盘I/O的使用率曲线,如图14所示。
图14 集中化管理和监控数据界面
6 结束语
云计算给电信企业带来了技术的创新。也带来了管理的变革、支撑形式的挑战和业务运营的机遇。随着数据库云平台的逐渐成熟和落地,会看到更加灵活、快捷的应用的部署;更加低能耗、低成本的运营;更加简单的维护和管理;更加容易实现的大规模系统建设甚至全国性集中化系统的建设,由此而带来的是企业规模式效益、全网化的营销和服务、统一和集中化的管理等价值,对电信企业的转型起到关键的作用。所以进一步深人探索和实现低成本、大规模数据库云计算技术,特别是与之配合的管理和运维问题,是下一步深化数据库云计算技术的关键任务。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:企业级数据库云平台的建设与运维方案(下)