PLM系统架构规划、优化方法及案例分析(上篇)
PLM系统架构规划、优化方法及案例分析(中篇)
6 部署实施及性能调优
当系统架构设计完成,硬件资源采购就位后,即可进行PLM系统部署实施。
6.1 系统部署实施
6.1.1 系统部署前准备
系统部署前准备准要是指为系统部署工作的准备过程,主要包括以下部分内容:
●准备系统部署操作文档(手册)、系统部署计划表,范例见表3;
●检查硬件环境是否安装就位,网络环境,磁盘空间是否充足;
●检查操作系统是否安装到位,补丁是否更新;
●检查操作系统用户、组织是否设置正确;
●检查服务器端第三方软件是否安装就位;
●检查PLM系统许可证是否正确可用;
●如果是升级系统,需要同业务部门沟通好停机时间,并下发生产系统停机通知;
表3 PLM系统部署检查表
6.1.2 系统部署前验证
在生产环境PLM系统部署前,必须经历系统部署实施验证。一般至少要进行2轮系统部署验证,并严格按照系统部署文档操作。如果在系统验证阶段出现任何意外的错误信息,必须记录在部署文档当中,以备排查系统部署错误,将有可能存在的问题都一一解决。这样,在生产环境正式部署的时候,过程就会比较顺利。
6.1.3 系统部署
PLM系统部署一般遵循从下至上的原则,即先对底层的支持型组件如数据库、卷服务进行部署安装,再对扩展型、易用性组件如应用层服务、中间件服务进行安装部署。对于TC系统而言,一般按照7步走的方式进行:
●安装数据库软件,建立空白数据库;
●安装基础版本的TC系统软件,卷服务器,业务模型;
●安装TC系统补丁;
●安装企业服务器及中间件服务器;
●安装分发服务器及其他扩展应用服务(全文检索、可视化协调、分布式处理等服务);
●部署二次开发程序;
●系统综合测试
6.1.4 系统部署后处理
在生产环境部署成功后,需要根据使用环境,设立不同的计划任务和警报器。正确合理的设定维护计划任务,是维持PLM系统稳定运行的关键所在。本文列出了几条关键节点,供读者参考:
●系统定期自动备份脚本;
●定期重启应用层服务的计划任务;
●定期重启中间件服务的计划任务;
●意外当机后,自动恢复服务的脚本;
●故障迁移集群(如存在)的错误报警与自动恢复脚本;
●PLM系统与上下游数据接口错误检查器;
6.1.5 错误处理预案
部署PLM系统,特别是在原系统基础上升级部署操作时,可能会遇到不可预料的问题。为了使得PLM系统顺利部署成功,需要系统各个层面(各个服务组件)的人员进行紧急磋商,建议至少4人以上参加。对安装部署错误进行分级,讨论是否可以在有限的停机时间内解决错误并完成部署。如能完成,则需做好两手准备,即分两组人分别进行错误问题处理及系统回退准备。如错误无法在停机时间内解决,则需要对系统进行回退操作,排查并处理错误后,再次寻找停机时间进行系统部署。
6.2 系统稳定性测试
在PLM系统正式上线服务前,需要进行稳定性测试。PLM实施工程师应当根据不同企业的使用场景,撰写UAT测试文档。对于仅支持C/S架构的系统,需要组织关键用户,对系统进行全方面的测试。对于具备B/S架构的PLM系统而言,除了组织关键用户进行UAT测试外,还需要对其中间件服务进行压力测试。推荐使用LoadRunner等第三方测试软件模拟上下班时期用户登录、保存操作高峰场景,突发性大数据量读取,大数据量检索等场景。测试结果需要记录备案,作为系统性能调优的设计输入。
6.3 系统性能调优
PLM性能调优主要包括服务器性能调优和客户端性能调优两方面,本文主要针对TC四层环境系统进行说明。
6.3.1 服务器端性能调优
以TC系统四层架构为例,服务器端性能调优应当按顺序注重以下几点:
1)数据库参数优化:SGA大小、Process数、Open_course大小、Session数等;
2)数据库索引优化:包括定期执行数据库动态性能分析(ADDM)服务,定期检查并更新数据表索引等;
3)优化FMS服务器:最大化利用内存来做FSC组件的高速缓冲,合理配置FMS启动参数,让客户端连接网络路径最短的FSC服务器;
4)应用服务器系统IO参数优化,JAVA启动参数优化(如基于JAVA环境),关闭调试信息日志及调整池服务管理器的暖进程数量和缩短进程最短响应时间;
5)调优中间件服务:使用64位Jrockit JAVA虚拟机,合理分配JAVA虚拟机的Heap大小,设置并行GC策略并设置GC为吞吐量优化;
6)调整TC系统参数:关闭TC_SLOW_SQL分析,设置XML消息回传消息为最大值,提高tcserver进程自动内存回收闸值;
6.3.2 客户端性能调优
TC四层客户端包括B/S架构的客户端和C/S架构的客户端。
●B/S架构性能主要取决于浏览器解析能力,推荐使用Chrome或FireFox来代替IE浏览器,已获得更高的性能;
●C/S架构客户端性能优化要点:
1)提高JAVA虚拟机的Heap大小,并将Xmx和Xms设置为相同值;
2)调整GC策略,将Java GC时间间隔延迟至3600s;
3)经常整理磁盘碎片,保持系统可用内存在2G以上;
4)安装经官方认证的显卡驱动程序;案例分析
7 项目情况
7.1 项目简介
某知名客车企业为了满足更大的业务需求,从2013年开始,深化扩展PLM系统应用,并对PLM系统进行大版本升级。由原TC8.1+Oracle11g+Weblogic11g升级为TC8.3+Oracle11gR2+Weblogic12c的平台。在现有PLM系统架构上,又增加了负载均衡集群、故障迁移集群的功能。系统功能上,增加了全配置BOM,平台化设计等功能模块。系统接口上,增加了与RCC、ERP、SRM系统的接口。
7.2 需求整理
PLM实施人员按照本文提出的需求分析方法对未来业务场景做了系统需求分析整理。发现原PLM系统经过2年的运行,数据库及卷文件已包含大量垃圾数据,并且基础架构有诸多不合理之处。同时,考虑到人服务器与主要用户群在异地,网络通过专线光纤,因此需要对系统资源进行重新调配。需求调研的主要参数详见表4:
表4 某公司主要需要参数
7.3 原系统架构解析
为应对TC版本升级及大量新业务引入对系统性能的冲击,实施人员对原PLM系统基础架构进行分析。原系统架构图请参见图8。
图8 某公司原PLM系统架构
从架构图中可以看出,原系统虽采用TC四层架构,但是中间层和应用层和分发服务放在同一台硬件服务器上,缺少负载均衡和故障迁移集群。实际使用过程中,中间件经常因IO错误中断,导致控制台无法登陆,客户端响应缓慢等问题。经过SPEC查询,TCapp1和TCDBsvr两台IBM X3850 X5的SiR均为334。但是根据每用户的SDR来看,tcapp1硬件服务器的处理能力远远超过所需的SDR值,但是因架构不合理,资源使用情况不足,网络和磁盘IO负载巨大,造成应用服务的瓶颈。并且,由于缺少高可用性集群,一旦任何应用层的服务组件出现问题,即会造成生产环境停机。
7.4 系统架构优化设计
配合某企业虚拟化的进程,同时,考虑到未来人员、数据增长对系统性能可能带来的冲击。新系统架构设计初期,就以具备高可用性及故障迁移的四层结构为基础,测试将其中一台X3850服务器增加内存,并划分为3台虚拟服务器(分别为tcapp1、tcapp2、tcweb)。优化后的系统架构详见图9。
图9 优化设计后的系统架构
经测试,基于虚拟化的服务器平台,系统IO速度较硬件服务器环境快40%左右。因此将虚拟化的tcapp1与tcapp2作为应用服务器,并在其上分别对等的布置有weblogic集群服务和应用层服务器,利用weblogic提供的集群和TC EntERPrise服务器提供的TreeCache技术,实现高可用性集群和故障迁移能力。未来还可以根据资源负载情况,不断增加tcapp3、tcapp4...等虚拟服务器加入集群,在不停机的情况下就能满足业务增长的需要。
tcweb则作为weblogic集群的统一入口点,并架设有tc分发服务器及weblogic、应用服务器的管理控制台程序。tcdbsvr及tcvolsvr服务器因资源充裕负载较小,保留不变。
另外,主要设计人员和服务器分别架设在异地厂区。虽然中间网络使用千兆专线光纤链接,但是卷文件传输还是会受到光纤转发器性能瓶颈的影响,造成文件传送延迟,打开大文件反应慢的问题。未解决此问题,实施人员在设计人员所在厂区的局域网内,加设一台FSC Cache服务器,提供卷高速文件缓存服务。对于中间层数据而言,均为轻量化的数据流且对数据实时性准确率要求较高,不加设缓存服务。
7.5 系统部署实施
通过部署测试结果分析,系统升级停机时间需要30小时。经与业务部门沟通,PLM项目组将系统停机时间安排在周六下班后进行。由PLM实施顾问,实施工程师,IT技术人员,硬件维护人员连夜奋斗,共同在周日20点完成系统部署。经过一个月的运行,系统状态良好(见图10、图11)。
图10 应用层服务器负载均衡运行状态良好
图11 中间件服务负载均衡、高可用性运行状态良好
8 结论
本文介绍的PLM系统架构设计方法,包括需求分析,架构设计,服务器资源分配,硬件采购,部署实施及性能优化等一系列办法。为企业顺利实施PLM项目提供了详细的可操作说明,值得在其他PLM项目中推广应用
名词解析:
[1]PLM:(product lifecycle management)产品生命周期管理。根据业界权威的CIMDATA的定义,PLM是一种应用于在单一地点的企业内部、分散在多个地点的企业内部,以及在产品研发领域具有协作关系的企业之间的,支持产品全生命周期的信息的创建、管理、分发和应用的一系列应用解决方案,它能够集成与产品相关的人力资源、流程、应用系统和信息。
[2]TeamCenter系统:Teamcenter软件提供了一整套全方位的数字化生命周期管理解决方案,使您能最大限度地发挥您的产品知识,并利用它在产品生命周期中的每一个阶段提高盈利能力和生产效率。Teamcenter 将人员、流程与知识有机地联系起来,从而激发创造力并提高生产效率。Teamcenter 在开放式PLM基础架构之上,为数字化生命周期管理提供了一整套完善的解决方案。
[3]SOA:SOA(Service-Oriented Architecture),面向服务架构,它可以根据需求通过网络对松散耦合的粗粒度应用组件进行分布式部署、组合和使用。服务层是SOA的基础,可以直接被应用调用,从而有效控制系统中与软件代理交互的人为依赖性。
[4]SDR:Server Demand Rate,服务器性能需求参数;
参考文献:
[1]Teamcenter Deployment Guide 8.3,Manual Revision J,2010.
[2]Siemens TeamCenter Help 8.3
[3]龙永义,大型复杂PLM系统性能及稳定性优化策略与案例分析,西门子2013年会内部资料
转载请注明出处:拓步ERP资讯网http://www.toberp.com/