当一家数据中心的运行达到其极限时,其所属的企业组织必然要作出一些重大的决定。花时间来为接下来可能会发生的任何状况进行规划,并考虑采取一些温和的、且成本便宜的升级和调整方案措施。
无需彻底大修的前提下改善数据中心
很少有企业组织会热衷于花费大量资金和时间来为他们的数据中心实施重大升级。一家企业组织需要认真考虑如何,甚至是否需要建立一处主要的数据中心的举措。但是,在此期间,企业内部的IT团队应该做些什么呢?重大决策的制定将需要时间,但基础设施仍然需要保持运行。毕竟,企业业务的运行依赖于此。
这将IT决策者们放在了一个需要延长旧的数据中心的使用年限,并同时需要对数据中心的其他更大的问题进行梳理的位置。
为此,数据中心专家罗伯特。麦克法兰专门撰写了本文,以便为我们广大读者朋友们介绍数据中心企业组织所能够采取的、同时又不会产生重大成本费用的相关措施。麦克法兰尤其建议企业组织的数据中心将他们的目标瞄准那些尚未被充分利用的资源:数据中心的那些服务器是否被用来充分发挥了作用了呢?而借助电力供应,IT人员应该查看电池的平衡状态。此外,在某些情况下,行内冷却机组所使用的战略可以缓解设施的冷却问题。
另外,在本文中,来自TechTarget网站的斯蒂芬。毕格罗也同样为我们分析了企业的IT团队可以用来提高数据中心的性能,而无需投入大量的时间和资金的一系列的方式。例如,为一台服务器的本地存储添加固态硬盘,可以清除瓶颈并中止错误。而与此同时,可以以很小的成本安装传感器,而无需耗费太多的精力。
这些举措并不会解决当一家数据中心在接近其效用的最后终点时,应该如何处理的更大的问题,但这些举措确实能够为企业组织规划其未来的IT基础设施赢得更多的时间。
对一处老旧的数据中心实施简单的修复和升级
当您企业的数据中心耗尽了其空间,电力或冷却资源时,您将需要做出一些困难的决定。而如果您企业的业务在未来几年内可能会被迁移;或者关于您企业的某些计算最终将会转移到云服务或托管站点的讨论的话,那么,关于这些决定的商议就变得更具挑战性了。这些决定是至关重要的,其绝不属于那种您想要靠拍脑袋就匆忙做出的决定。毕竟,一家企业组织所做出的选择,可能涉及到极其昂贵的资本支出和运营效率。
但是,尽管这些长期性的决定正在被思索和衡量,但企业内部的IT团队仍然承担着短期的负担:他们需要保证数据中心的正常运行,而且还必须可靠地支持用户。
那么,哪些措施才是现实可行的呢?哪些措施才能让企业组织的数据中心以最小的投资实现获益的最大化呢?而同样重要的是,哪些措施会是最不具破坏性的呢?总之,您企业组织的数据中心如何才能找到最经济、最有效的短期内的方法呢?
在本文中,我们将为广大读者朋友们介绍一套较为合理的策略,来帮助您首先对您数据中心进行梳理,然后逐步修复,最后再分阶段实行的相关步骤。
1、移除不应该存在的设备
如果一家数据中心的运行已经达到其容量能力的极限了,那么,其IT工作人员可能会关闭并删除那些无用的服务器。
下一步是质疑任何显示了低利用率的设备的重要性。例如,也许其利用率仅为10%.那么,便可以看看这些设备是否可以被虚拟化。或者也许这些设备也可以被尽数销毁。如果其支持一款单一的应用程序,而有一位用户仍然认为其运作“良好”的话,那么,可能需要花时间来与之进行一次严肃的谈话了。毕竟,当一处数据中心的运行容量已经达到其极限时,其已经完全没有必要再容纳不必要的设备了。另外,这些措施也能为数据中心进一步降低功耗带来一定的效益。
当您在查看数据中心的硬件设备时,务必要清理硬件设备的空气过滤器,并确保电缆没有阻塞排气通道。这些简单的步骤几乎没有任何成本,但却可以帮助您数据中心大大提高冷却效率,延长设备的使用寿命。如果您的数据中心存放有废旧纸箱或其他不必要的东西,请务必要尽快处理他们,因为这些东西会造成更多的污垢灰尘堆积,进而重新堵塞过滤器,并降低冷却效率。
如果您企业组织的数据中心是通过通路活动地板来输送空气的话,请移除那些未使用的电缆。这项工作是不容易的,但您并不需要一个资本预算授权来执行这项工作。而您可能会惊讶于这项工作的执行所带来的冷却性能的前后差异。
而聘请专业的数据中心清洁服务可能是值得的。一款清洁的设施所能够为设备运行和功耗带来的效益将会是相当惊人的。
2、修复了剩下的设备
当您企业的数据中心运行接近其极限时,那么没有什么比良好的预防性维护更为重要的了。即使这可能意味着超出了服务合同条款的特别服务,也务必要充分考虑这一点。确保一切设施都在其最高性能状态下运行可能带来额外的费用。
更换空调过滤器。检查所有的皮带和轴承,确认所有相关的一切都是干净的。您的供应商应该有一套彻底的维修检查清单,就像一名汽车机械师对汽车的维修检查一样。确保供应商完全遵循该清单进行历次的维修检查。而如果您企业的数据中心的运行确实已经接近其极限边缘,而同时又负担不起关闭空调服务以进行维修,那么您企业不妨选择租用便携式的冷却设施,以助您渡过难关。
不间断电源(UPS)的电池可能是数据中心最容易出现故障运行失败的项目,而究其原因则是因为他们最被需要。阀控式铅酸蓄电池(VRLA)只能维持几年的时间,因此,如果这些电池的使用时间已经超过三到五年了,那么,替换掉这些电池无疑是一个好主意。
在对您企业数据中心的UPS实施预防性维护之前,请务必先更换UPS或添加容量,检查相位平衡(phasebalance)。您有可能获得比您想象的更多的可用功率。
大型的UPS系统(一般在20千瓦及以上)是三相的。这意味着有三条“热”的线缆,但几乎所有的机柜和设备都只连接到这些相线中的一条或两条。在美国,208伏的电路从三相电线中的任两条获得电源。在美国的一款120伏电路以及在欧洲的230伏线路,从任一一条相线外加一条零线获得供电。其结果是,可以很容易地加载一个或两个相位来接近容量,留下很少的负载连接到剩余的相位。
前面板的显示屏可以告诉您每一相的负载,但一般的显示将仅根据最坏情况的相位显示负载百分比。因此,如果相位是失去了平衡,您的显示器将显示98%的利用率,即使20%到30%的容量能力仍然可用,且未使用。尽可能再平衡相位(目标是在5%以内)可以从现有的UPS解开额外显著的电源消耗,从而几乎不花成本就解决了在潜力的过载问题。
在任何未使用过的机架和机柜空间安装冲裁板,以停止昂贵的冷却空气的浪费。卡入式面板可以带来冷却效率的巨大差异。同样地,可扩展面板可以关闭机柜之间的缝隙,而现在的产品甚至可以密封机柜底部和地板之间的空间。
3、制定补充战略
只有在上述的所有这一切工作都已经完成后,才应该考虑增加主要设备的问题。
如果您企业的数据中心需要更多的UPS容量,不妨可以考虑使用更小的、机架内UPS单元。这些将是有益的,但只有当需要的额外UPS容量是最小量的时候。即使这意味着只是一个短期的解决方案,也请使用商业级的UPS单元。每隔几个月检查一下这些小单元的电池,并注意他们的警报。
如果您企业的数据中心需要更多的冷却散热能力,那么,行级冷却器(in-rowcooler,IRC)可能是比大型机房空调(CRAC)或空气处理器(CRAH)更好的选择,特别是如果现有的冷却空气是通过在地板下送风的话。增加CRAC可能会使得更多的空气进入地板下,从而超出了地板充气空间所能够容纳的空气量,并可能由于地板的阻碍作用而增大了压力。此外,空气流会相互干扰,实际上降低了某些区域的冷却效果,而并没有改善它。
行级冷却器被安置在机柜之间,并在机柜前的最高热负载处直接提供冷空气。进一步的改善可以通过将那些具有较高的热输出的设备重新定位安置到高密度的机柜配置,从而降低数据中心的其他部分的负荷。另一种选择是通过采用后门热交换器(RDHxs),其能够在热空气离开机柜前中和热量。这两种方案都需要冷却水或地板外的制冷剂管道,这当然会给数据中心带来一些显著的、以及潜在破坏性的安装工程。但这些方法的优点是,它们可以通过规划其大小和安装位置,以解决特定的需要。能够将主要工作限制到一个小部分的区域,并最大限度地减少了需要购买的新设备的数量。
如果冷却仍然是一个问题,那么则可以考虑补充加入密封遏制(Containment)。冷通道密封遏制(Cold-aislecontainment)对现有设施的改造通常是更好的选择,但对于空气的均衡也是难以控制的。热通道遏制则避免了空气均衡的问题,但它需要一个回风路径以返回到空调机。这是IRC的一个固有的设计,但如果您企业数据中心不是已经在天花板有一个回风压力通风系统返回到CRAC的话,其将是较为困难的。
较之实心的空气阻挡门和面板,塑料窗帘在现有的空间更容易部署实现。他们允许漏风,这可以解决冷通道密封所带来的空气均衡的挑战。但是,采用塑料可能不符合防火和烟雾排放的要求。
固体密封遏制,使用列末门和上述机柜板,可能更难以在现有的空间来部署实现,但其要比塑料窗帘能够提供更完整的密封遏制。在冷通道密封遏制的空气平衡将是具有挑战性的,通常意味着设计需要允许一些缝隙泄漏的存在,以避免问题。
此外,关于密封遏制,有重要的消防保护方面的考虑。如果洒水喷头或排气压头不在每个通道中,密封遏制可能会将一个通道与灭火剂隔离,而这是非法的。美国防火标准要求保护壁垒下降后自动实施烟雾检测(不让熔线因实际火灾而遇热融化),而下降的保护壁垒会落入通道,而不会阻碍紧急疏散。为了解决这些问题,最好的办法是重新配置火灾保护方案,但这样可能是成本昂贵且具有破坏性的,可能不适合一个现实可行的短期设施规划方案。
当面对要将一处现有的数据中心的使用寿命延长几年的需求时,第一步的措施可能会是那些您企业原本应该一直都在采取,但到此刻为止才被迫开始采取的措施。
企业为修理一处即将报废的设施而批准庞大的预算将是很难的,而且应该很少是必要的。当确实是必要的时候,解决方案在本质上需要是模块化的,只提供必要的,并且是以最低的成本和尽可能不发生中断。
除非绝对必要,否则千万不要添加主要的设备。这种工作的成本将是相当昂贵的,而且对于现有的系统是危险的,并可能会产生新的问题,而不是解决现有的问题。
将电缆、传感器、硬盘的升级列入您企业的待办事项清单
并不是每一个IT基础设施项目都是耗时的,资本密集型的,会给企业带来颠覆性影响的。让我们来看看一些可以帮助您企业支撑一处数据中心的简单的且成本低的工作任务吧。
1、升级现有的硬件
对于数据中心内存和本地硬盘的战略型升级有助于提高服务器的性能容量。内存是虚拟化的一个限制资源,而服务器很少配备了全套板载。盘点您企业数据中心未使用的插槽,并为现有的虚拟机添加内存,以帮助或适应未来的服务器整合。
固态硬盘(SSD)是对战略性服务器的一种本地磁盘存储升级。固态硬盘改善了I/O和更低的延迟性,是敏感的工作负载存储带宽的理想选择。如果一台服务器上的工作负载依靠磁盘缓存,固态硬盘可以加速其性能。无需撕裂和更换所有磁盘驱动器,仅仅只需将一款固态硬盘添加到一台服务器的本地存储,以清除瓶颈和停止错误。
升级服务器固件是快速且免费的,但也具有破坏性。执行这类升级只能解决诸如硬件或操作系统支持等具体的问题。清查盘点您企业数据中心的资产,并列出一份当前的服务器型号和固件版本的清单列表;然后检查服务器供应厂商的更新网站以下载最新的更新。通过细节或发布的更新说明确定这些更新是否能够真正解决问题。外设接口和适配器设备也有可能需要更新固件。
内存和磁盘升级意味着出现停机时间(除非采用热插拔)和重新配置机架。“内存升级是成本便宜且有效的,但…这不完全是就地升级(in-placeupgrade)。”网络自动化技术开发商6connect公司的首席运营官兼联合创始人PeteSclafani表示说。因此企业不妨在计划的服务器停机时间内执行内存和SSD升级。
磁盘容量是昂贵的,您企业可以通过删除不必要的内容或通过将数据迁移到较低的存储层来防止大容量的增加。例如,不必要的数据所带来的大量临时目录,可以在服务器和存储子系统的/tmp和c:/temp目录下清除。
尝试为薄存储部署使用一个零字节回收。“零写入到所有已分配但未使用的空间。”位于加州阿纳海姆山的一家云平台提供商ReachIPS公司的IT运营总监TimNoble表示说。服务器分配的一个零字节回收,永不需要存储,从而释放了阵列的空间。
2、重新布线
随着网络带宽达到10千兆以太网(GigE),25千兆以太网,甚至更快,这意味着1千兆以太网的老化类别的5和5e铜布线基础设施已经无法应付新的数据中心的要求了。
即使为更高的带宽网络选择了合适的硬件,也可能缺乏线缆。“人们往往忘记,当物理网络设备升级后,您企业网络的布线可能无法充分利用,”Sclafani表示说。不要一下子撤掉所有老化的线缆;以太网线缆完全向后兼容。当时间和预算允许时,在更快的线缆方面做出相对较小的,增量投资。
服务器将仍然保持在10千兆位以太网,所以企业数据中心应着眼于重点骨干网络,特别是基于以太网的iSCSI和以太网光纤通道存储阵列。例如,6类线缆可以支持10千兆位至55米,而6A类线缆和7类线缆则可以处理10千兆至100米,无需新的网络适配器、交换机或其它组件。
3、添加传感器
如果您无法衡量它,您就无法对其实施管理。数据中心基础设施管理(DCIM)工具则能够监控复杂设施的电气和环境行为。
DCIM需要在数据中心范围内有策略地放置传感器。这些工具可以针对情境事件自动触发响应,如当某台服务器变得太热时迁移工作负载;或在冷却循环中出现水分泄漏时发出探测警报。传感器的缺失或不足或将导致输入缺口。
哪些传感器是不可或缺的?
.温度传感器定位在机架和行内的热点位置。
.湿度传感器真对过于干燥的空气或冷凝水平损坏发出警告。
.当冷却水在热交换器或机架上循环流通时,水分(液体)传感器是必不可少的。
.能源使用状况的实时监控。
.空气流传感器确保风扇和过滤器的畅通运转。
.运动探测器检测入侵者,并触发安全警报和相机拍照。
.烟雾/火警传感器保护数据中心宝贵的资产和生命。
新的传感器很容易安装。此外,它们可以逐渐增加,从而分散了成本。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:延长数据中心使用年限的低成本方法
本文网址:http://www.toberp.com/html/consultation/10839619682.html