1.计算机系统运维工作
近几年,笔者从事计算机系统运维工作。钢铁企业的产销管理系统已经运行了10年,笔者负责其中一个模块,接手该模块时,对于这个大型系统的整体架构不甚了解,甚至不知如何登陆系统,于是尽快学习该系统,学习如何找到程序、如何编译、如何进入数据库。随后面临的是业务人员日常工作中提出的新需求或者是需要修改的数据。对于用户提出的新需求,首先要理解业务,将理解的业务定位到系统中,是需要修改系统中已存在的程序还是新写程序,需要维护人员判断。对这些基本的内容有了了解以后,基本能处理日常运维中的简单问题。
1.1 计算机系统维护工作的主要内容
业务方随着业务的拓展,需要新增功能,那么需要和用户进行新业务的沟通,了解用户的需求,将用户的需求应用到系统中。系统中新增功能对系统中现行的业务影响应降到最低,不能让新增功能影响了原有正常运行的业务。
计算机系统维护工作的主要内容有:
①系统定期停机进行数据备份、垃圾清理等工作;
②每日定时查看系统的运行效率和系统负荷;
③关于UPS设备的定时检查;
④关于服务器和个人终端计算机硬件的监控及维护;
⑤业务方经常在对数据进行分析时会对系统提出问题,在业务方对数据质疑时,解释数据的前后逻辑;
⑥业务方偶尔会出现录入数据出错的现象,需要维护人员修改数据,修改数据时必须将所有涉及的表都做相应的修改;
⑦业务方咨询计算机系统的处理逻辑时,需要耐心解释逻辑;
⑧对于一些后台批处理的程序,每日定时监控其运行的结果是否正确,在不正确时处理故障;
⑨做到被呼叫时第一时间响应。
1.2 运维工作特点
运维工作是琐碎而繁杂的,一旦出现问题要及时解决,否则会对其它模块有影响,导致处理起来时间延长,影响面变大。及时处理故障是对运维工作的一个基本要求,要做到能够及时处理故障则靠平时积累经验和准确定位问题。
运维人员是在一线和用户打交道的人,在处理日常运维工作时,应该多了解用户需求,一些潜在的项目就是这时候被挖掘的,这样在为用户解决问题的同时也为公司增加了项目机会。运维人员代表的是公司的形象,计算机系统运维是一项服务,运维人员应有服务意识,做到让用户信任,同时运维人员应将用户提出的一些建议带回,在以后的项目中考虑进去,使公司的软件不断完善,提高市场竞争力。
对于运维工作,每一个岗位都设有A、B角,所谓的A、B角是对同一岗位不同角色的称呼,A角是指担任这个岗位的主要运维人员,是该维护岗位的负责人,在A角休假或者生病期间,运维工作由B角来完成,这样不至于耽误用户的工作。当然,作为A角的人同时要作为其它模块的B角,也即运维人员不但要对自已负责的模块熟悉,同时对其它模块也要熟悉。
1.3 运维和项目的关系
运维和项目的关系是指项目实施团队和运维团队在一般情况下其人员会有变化,项目实施的时候,不但要从项目的角度出发考虑问题,同时还要为将来运维考虑。比如要处理一批数据,需要将A表中的数据取出按照一定的逻辑写入B表,如果系统服务器效率高,那么就用循环的方式将A表的数据全部取出,一条一条地循环,每条数据处理好逻辑后,新增到B表中直至A表的所有数据处理完毕;如果系统服务器的效率不是很高,那么就用INSERT…SELECT…查找同时新增的方式,这样效率较高,但SELECT语句中的逻辑比较复杂。在做项目时两种写法都可行,如果能考虑到后期的运维工作,则第一种方式相对要好,对运维接手的人来说读程序比修改程序容易上手,且程序上线运行后不容易有错误。第二种写法,在运维阶段如果用户提出增加逻辑或者修改逻辑,那么要读懂原来写的SELECT的逻辑就不是很容易,即使读懂了在其基础上增加逻辑或者修改逻辑也容易出错,程序上线后容易出现数据出错等问题。
运维时还应注意:对于批量数据一起处理的程序,数据量很大,在做新增数据时,做了commit的处理,那么当这样的程序出现异常报错时,一定要查看是不是已经有数据新增进去了,要在数据中用时间或者其它字段做标记,以便迅速查找出已经commit的数据,将查找出的数据删除,重新执行程序。
1.4 运维过程管理
运维过程中每次处理的事件、问题及用户提出的新需求,都要进行记录,提出问题的人需要记录问题,运维人员处理完问题后,针对问题描述其原因及处理的过程然后关闭问题。用户新提出的需求,同样需要用户先记录需求,将需求描述清楚,运维人员拿到需求后和用户沟通好,进行系统设计、程序编写、测试,最后上线应用。运维人员按照记录的需求单记录处理过程,再关闭需求单。该过程是运维管理的一个流程,将运维过程全部记录下来,一方面是系统的审计要求,另一方面是和用户的交互过程有记录可查。
运维工作也需要大量的沟通,由于系统之间都有接口关联,当系统出现故障时,需要进行系统抢修,相关联的系统都要做相应的调整,需要和其它系统的运维人员进行沟通。沟通时应注意说话语气,多从他人角度出发描述问题,运维人员需要和用户有效沟通,需要和周边系统的运维人员有效沟通,做好沟通对运维工作起到事半功倍的效果。
1.5 实际案例
业务人员需要运维人员处理事件的过程如下:运维人员的手机上收到系统运维平台要求处理事件的短信后,登陆运维平台,对事件进行判断,电话联系提出事件的业务人员,通过沟通,了解具体事件,寻找解决办法,有时候沟通发现是业务人员的理解偏差,对业务人员进行解释,然后在运维平台上对事件描述解决办法,再关闭事件。
有时要处理的事件需要对数据进行分析,比如一个程序要处理大量数据,在系统正在执行程序和系统对数据库正常备份时发生了冲突,数据库备份时先把表锁定,正好这个处理批量数据的程序要对此表进行新增就容易出错。接到这样的事件,先对出错的程序进行查看,看程序中是否对数据进行了分布提交,一般在处理大量数据时,都需要分布提交,对数据库来说,一次性提交上百万条数据,会出现爆满的情况发生,所以要求程序开发人员在编码时,1 000条数据commit一次,这样对数据库的负荷明显下降。但是对于刚才描述的出错,首先要看程序中是否写了commit,如果存在,那么要在被写的表中查看是否已经有了新增成功的数据,至于数据怎么查找出来,则涉及到做项目时编码中要考虑到用时间或者其它字段做标记,以便在数据出错时进行查询。写程序时用时间字段进行标记,这样在处理故障时,对时间字段进行DISTINCT操作,看是否在出故障时的时间点有数据,如果有数据存在,对这些数据进行删除操作,待数据库备份完毕后,重新提交程序对数据进行处理,这样就不会出现数据重复的现象。事件处理完毕后,在运维平台将该事件的处理过程进行描述后关闭事件,标志着事件处理结束。
2.结语
计算机系统的维护工作和实施工作同样重要,无论是实施项目还是维护系统,笔者认为,用心学习最重要,无论事情有多繁琐,若能静心理清思路,都会迎刃而解。笔者结合自身工作经验,通过实例对计算机系统维护工作进行了研究,以期为同行工作人员从事相关工作提供一些参考。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:企业计算机管理系统维护的策略研究