挑战
伴随中国“智”造战略的持续进行,研发计算软件已经成为企业研发体系中不可或缺的重要组成部分。与此同时,管理层迫切希望核心研发计算资源整合形成统一、安全、高效的企业研发云平台。
企业级计算中心成为这一建设重任的直接负责部门,承担着规划、选型、实施、运维、改进、扩容等一系列任务。然而,在企业研发云的实践过程中,局限于网络规划、硬件购置、系统集成等传统建设办法的计算中心发展思路已捉襟见肘,主要体现在以下方面:
无法适应计算资源的动态变化
新软件、新版本的安装、升级、配置以及上线周期越来越短,计算中心必须高度重视软件资源,配合应用软件以及研发需求而“随需应变”;
·无法满足应用部门的自服务需求
由于研发任务繁杂、缺乏培训时间,应用部门迫切希望自助获取计算服务,计算中心必须在统一化管理资源的前提下大幅提升服务便利性;
·无法保障信息部门的管理安全
研发计算资源的大规模集中化进程,针对计算中心在硬件运维、软件监管、用户监控乃至数据安全等领域的管理手段提出了更高要求;
·无法支持领导层的决策数据分析
领导层迫切需要研发计算资源利用情况的实时状态、历史数据以及变化动态,计算中心必须实时监控资源利用信息数据,进而可持续优化资源配置。
作为战略性研发资源运维管理方,企业级计算中心该如何应对这些新问题、新挑战?如何切实利用研发计算资源为企业创新工作提供全面、便捷、高效的服务?企业级计算中心如何以计算资源服务的角色融入研发流程体系,从而实现战略转型?
定位
在探讨企业级计算中心战略转型方案的过程中,我们非常有必要对计算中心在现代企业中的职能、角色、功能范围等进行更为明确的定位。
通过走访大量的具备自主研发业务的制造业企业以及科研院所的信息化管理部门、科研管理部门,我们发现信息技术已经成为研发业务中不可缺少的支柱型资源,通过进一步梳理,我们可将信息技术资源分为两大类:
·数据业务资源
这类业务以数据处理为核心,以数据库为载体,主要覆盖企业中的办公协同、流程管理等业务。目前该业务发展较为成熟,大多已然形成稳定可靠的企业级数据中心。在新的建设时期,数据中心的升级改造手段多为服务器虚拟化技术。
·计算业务资源
这类业务以计算能力为核心,载体(应用软件)多样化且数据格式难以统一,主要覆盖研发过程中非常重要的三维建模、数值仿真等业务。该类业务专业要求高且前期投入巨大,目前迫切需要集中化管理软件针对计算业务资源进行全面管控。
由以上的粗略分析不难看出,计算中心与数据中心相比存在较大业务差异性,管理手段成熟度也存在巨大差距。计算中心若能有效承担管理计算业务资源的职责,并与数据中心紧密协作,即可成功构建企业信息化体系的双核引擎,共同驱动企业研发创新。
技术
由于承载的研发计算类应用的特殊性,计算中心的技术特点也与数据中心存在着巨大差异。经过对制造业常用设计、研发软件的分析、归纳与推演,我们总结出未来计算中心必须具备三大核心能力:
·计算
即高性能计算能力。
高性能计算能力是计算中心建设的重点课题,大多数企业级计算中心建设的首期任务就是建立包括服务器集群、高速网络、作业调度软件、应用软件族在内的一系列基础型计算资源,但是却往往忽视了高性能计算能力的管理架构、服务门户设计,从而导致高性能计算平台在易用性、可扩展性、易维护性等方面存在严重问题,直接影响了计算中心的服务表现并制约其良性化发展。
·图形
即高清图形处理能力。
高清图形处理能力是计算中心建设的新课题,图形处理设备长期处于分散状态,并直接导致了研发数据“碎片化生存”状态,难以保障研发数据的安全监管以及版本控制问题。新一代计算中心应该集中监管高清图形处理设备,同时允许用户通过安全认证机制远程访问交互类应用软件,用户可获得高清、流畅的本地化体验。高清图形处理能力的集中化管理技术体现了信息化管理部门对研发业务安全规则的积极响应,也是计算中心基础架构发展的必然趋势。
·存储
即海量数据存储能力。
海量数据存储能力是计算中心建设过程中不可避免的课题,计算资源集中化的进程必然导致数据集中化存储,而存储系统的性能、容量、架构将直接影响计算中心的服务表现。研发数据的生命周期直接受制于研发项目周期,因此传统的时间戳、配额制等存储管理机制必然无法适应新型计算中心的数据管理需求。发展高性能、多层次、智能化的海量数据存储能力以及相关接口技术,可将计算中心资源作为数据生产服务组件整合融入整体研发流程管理体系。
实践
SimCloud仿真云计算平台是上海泛云信息科技有限公司(“泛云科技”)自主研发的软件产品,经过多年的探索与发展,SimCloud仿真云平台在多家大中型企业及科研机构直属计算中心进行了成功实践,成为面向研发计算业务的企业级私有云解决方案。
日前,在用户与合作伙伴的高效协作之下,SimCloud成功研发推出V3版本,为计算中心的三大核心能力管理工作引入了一系列创新特性:
·支持Windows+Linux混合架构HPC集群
应用软件的多样性决定了高性能计算集群无法长期保持单一操作系统的生态环境,泛云科技快速响应用户需求,在SimCloud V2的基础之上重点攻关了Windows与Linux混合架构集群统一调度管理技术,巧妙克服了Windows与Linux系统的用户认证机制难以兼容的问题。
SimCloud V3通过内置中科院软件所研制的Speedup Cluster Suites,成功实现了Windows+Linux混合架构条件下的统一用户认证、数据管理、软件配置、作业管理、权限配置、调度策略、集群管理、资源监控以及系统资源分析报表等功能。
·改进混合云弹性计算服务模式
企业级计算中心建设目标是满足常规性研发计算需求,但是在运营过程中不可避免的遭遇计算服务高峰请求,安全接入以国家级超级计算中心为代表的公有云或者上级集团的集团云,将是解决这一问题的有效途径。
SimCloud V3在微软云计算部门、上海超级计算中心的帮助下,改进发展了互信友群协作模块,支持提交至私有云的用户作业自动迁移至公有云(集团云)进行计算,结果数据将在计算成功后自动回迁。SimCloud V3在保障用户体验与私有云模式基本一致的前提下,为管理员增加了作业转发策略配置、转发任务统计等混合云管理手段。
·扩展软件许可证管理机制
软件许可证管理技术呈现多样化趋势,SimCloud继全面支持FlexLM技术之后,扩展支持LMX许可证管理,同时在计算资源部署实践中成功实施了多许可证服务器、冗余许可证服务器等管理模式。经过改进后的SimCloud V3软件架构,针对许可证服务已然具备更为强大的解析、监控与统计能力。
·兼容支持动漫渲染应用
应设计院用户的效果图、动画短片制作需求,SimCloud V3在支持传统MPI并行计算应用的基础上,扩展支持了MAYA、3DSMAX等三维场景设计/渲染软件,在同一个计算资源平台内实现工程数值仿真、动画短片制作等服务场景。
·发展管理员角色配置机制
计算中心管理员角色的单一性已经严重影响了资源服务表现,SimCloud V3创新发展用户自定义管理员角色配置工具,有效区分硬件运维、软件部署、报表统计、作业监控、研发指导等角色功能。通过合理的管理员角色配置,计算中心可大幅缩短了平台服务响应时间,提升计算用户满意度。
针对中国国防工业信息安全相关规定,SimCloud V3继续改进发展了安全/审计模块,通过内置的管理员、安全员、审计员角色功能配置及相应审查监管流程,达到全面监控研发计算资源的管理目标。
·优化虚拟应用预约管理
高清图形处理能力是计算中心的有限资源,并且长期处于供不应求的状态。针对这一现状及发展态势,SimCloud V3优化设计了虚拟应用的预约、排队及管理机制,通过用户优先级、软件使用权限、预约时间等参数进行资源调控,在保障用户高清交互体验的前提下,大幅提升了计算资源利用率。
致谢
由于部门设置、管理机制等多种因素,中国企业无法照搬照抄外国企业计算中心的建设模式,甚至难以模仿国家级超级计算中心的管理方式,企业级计算中心战略转型过程注定是一段坎坷的道路。泛云科技正努力而坚定的践行“创新、整合”的自主研发理念,勇于开拓并克服这段漫长征途中的种种艰难险阻,携手中国企业一举拿下这一场研发计算资源整合的攻坚战役。
最后,我们需要特别感谢上海汽车集团股份有限公司技术中心、国家核电上海核工程研究设计院、中船重工第七〇一研究所、中国电子第十二研究所、浙江水利河口研究院、中石化上海石油化工研究院等战略级用户及合作伙伴,正是由于这些企业及科研院所管理团队为我们持续注入创新理念与管理思路,方才促使SimCloud仿真云计算平台不断焕发出新生的力量。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:企业级计算中心战略转型之路