1.引言
网络虚拟化允许多个服务提供商动态地组织多个异构的虚拟网络,并在其上部署并管理客户化的端到端业务。网络虚拟化提供了在共享底层设施上运行多个网络的有效方式。并且,作为一种长期解决方案,网络虚拟化在支持未来网络中多种体系结构同时共存方面发挥着重要的作用。
在网络虚拟化环境中,传统的网络服务提供商(ISP)分离成基础设施提供商(InP)和服务提供商(SP)。基础设施提供商负责搭建底层物理网络,提供物理资源。服务提供商租赁底层物理资源,组建虚拟网络并在虚拟网络上部署客户化的协议和应用。有些文献将SP进一步分离为虚拟网络提供商和应用提供商。网络虚拟化屏蔽了物理层的细节,在技术上为网络上运行多样化的协议和应用提供了可能:在经济上通过共享底层基础设施避免了对基础设施的重复购买和运维成本。可以预见.在未来网络环境中。虚拟网络之上将运行日益丰富的网络协议和应用,而网络的健壮性和生存性势必成为网络虚拟化研究和发展过程中一个不容忽视的问题。
故障管理是网络管理中重要的研究领域。网络故障管理的目标是及时准确地定位网络故障,并迅速对网络故障进行响应,尽快隔离故障和恢复故障,从而尽可能减少或避免网络故障对其上运行的业务的影响。然而在网络虚拟化环境中,虚拟网络和设施扩大了网络的规模,为网络状态感知带来更大的难度和复杂度:虚拟化技术在提供了按需创建、迁移、调整和撤销虚拟网络等灵活性的同时,也导致虚拟网络和物理网络间映射关系的不确定,给建立故障传播模型和诊断故障带来一定的复杂性;此外.虚拟网络和物理网络对资源能力、服务质量、管理成本等方面的需求也为网络虚拟化环境下的故障恢复机制带来很大的挑战。而传统IP网的故障探测、定位和恢复机制面向的是确定的、单一层次的网络,无法处理上述不确定性和映射约束,并且需要针对扩大的网络规模做出进一步优化。因此.需要提出相应的故障管理机制,以便有效地对虚拟网络故障状态进行探测.及时准确地对虚拟网络故障进行定位.快速高效地将网络和业务从故障影响中恢复,从而提升虚拟网络的顽健性、生存性和可管理性。
2.网络虚拟化环境下的故障管理流程
网络虚拟化环境下故障管理的基本过程为:通过在探测站点上发送一系列的探针,并收集探针返回的结果.获得被管网络中故障状态信息;运用症状信息并结合网络中的故障传播模型诊断引发症状的根源故障:最后基于故障的位置.将虚拟网络及相应的业务切换到预留的备份资源或临时选择的空闲资源上,最大限度减少或避免故障带来的影响。
网络虚拟化环境下故障管理的过程如图1所示,各阶段简单描述如下。
图1故障管理流程
故障探测阶段:定期向网络中发送探针,探测物理链路和节点以及虚拟链路和节点的运行状态.并收集探测信息。为减少探测对网络性能的影响并提高诊断的处理速度。该阶段需要运用优化策略选取探测站点及探针集合。
故障定位阶段:基于探测到的网络症状信息和网络的故障传播模型,运行故障诊断算法,根据诊断结果判定网络环境中是否发生故障,如果存在故障则进入故障恢复阶段,如果未发生故障,则继续定期探测网络的运行状态。
故障恢复阶段:如果采用预留资源的恢复方案,则调用预先设计好的备份恢复方案:如果不采用预留资源的恢复方案,则管理系统需根据故障发生位置,临时为故障网络和业务选取可用资源。无论是预留资源的恢复方案还是无预留资源的恢复方案均须遵循相应的故障恢复策略,这些策略将综合权衡质量、容量、成本等各种因素。最后基于恢复方案对网络设施进行调整配置,实现故障恢复。
3.网络虚拟化环境下故障管理的研究方向
基于网络虚拟化环境的特性并围绕故障管理流程的3个关键环节。要实现网络虚拟化环境的故障管理.需要解决以下3个关键问题。
设计优化的故障探测机制,感知网络的故障状态。
设计及时准确的故障诊断机制,定位网络故障。
研究基于资源容量、位置:成本等各种因素的故障恢复机制,满足服务质量要求。本文从故障探测、故障定位和故障恢复这3个方面简要介绍网络虚拟化环境下故障管理的研究方向并分析其研究趋势。
3.1 故障探测机制
网络虚拟化环境需要使用一种灵活、准确、基于探针的主动探测方法来获取网络故障状态。这种方法通过向被管网络发送探针,并搜集探针的返回结果,获取网络的故障信息,从而最终定位故障。网络虚拟化环境在传统的物理网络设施的基础上又增加了众多并存的虚拟网络,因此要想全面获取网络的故障状态信息所需要的探测规模急剧增加。然而大量的探测会为网络和故障诊断带来极大的开销。对故障探测和诊断的及时性和实用性都带来严重的影响。为保证探测的全面性同时降低探测成本、减少不必要探测为网络和故障诊断带来的开销,需要对故障探测进行优化。具体来说涉及两个方面:探针集合的优化和探测站点的选择优化。
参考文献采用不同的方法优化主动探测向系统发送的探针集合,以尽可能少的探针获取更多的系统信息,同时尽可能降低计算复杂度。然而,网络虚拟化环境中的网络规模庞大.上述研究由于其计算复杂度过高对于大规模的网络来说仍然无法适用,为此。需要研究更加高效的故障探针集合选择方法,保证所选择的探针集合在能够探明系统故障情况的前提下,尽可能减小探针集合的规模。参考文献研究了探测站点的选择问题,以尽可能少的探测站点保证被管网络所有节点的故障情况可被探测所确定。网络虚拟化环境下,探测站点由于虚拟化的引入存在着更多的不确定性,节点可能失效和迁移,还需要在传统的探测站点选择方法的基础上针对网络虚拟化环境做进一步的研究。
3.2故障定位机制
网络虚拟化环境下的故障诊断是在某些故障发生之后,定位故障发生的具体位置,是故障恢复的基础。故障传播模型描述了被管网络中故障与症状(探针返回的结果)之间的依赖关系。故障传播模型是故障诊断的前提和基础。由于虚拟化网络中存在故障的多层次和关联性、负载的随机性、节点和链路的动态迁移特性,适合于虚拟化网络的故障传播模型成为故障诊断的一个重要研究内容。
在获得故障传播模型的基础上。还需要针对不同系统的特性设计并优化相应的故障诊断方法。降低方法的复杂度,参考文献研究不同系统下的故障诊断方法。在网络虚拟化环境下,底层信息对于上层虚拟网络的透明性是网络虚拟化的一个显著特点。底层信息的透明性是指底层网络设备的运行情况、底层设备的先验故障概率、虚拟网设备与底层网络设备的映射关系等信息,对于虚拟网络提供商都是不可知的。而且对于虚拟网络提供商来说,除了底层物理故障可能导致虚拟网络提供商的故障,虚拟化技术本身也可能引入新的故障。如何在底层信息透明的。情况下进行物理故障和虚拟化故障这两个层次的故障诊断是网络虚拟化环境下需要解决的问题。
3.3 故障恢复机制
网络虚拟化环境下的故障恢复机制为网络的可靠性提供重要保障。故障恢复机制由故障触发,通过将虚拟网络和相应的业务切换到预留的备份资源或临时选择的空闲资源上,最大限度地减少或避免故障带来的影响。因此故障恢复机制本质上是故障发生条件下的资源分配问题。参考文献研究了虚拟网络映射问题,然而这些研究均假设网络始终正常运行,没有考虑网络故障的情况。网络故障恢复机制从是否有备份资源预留的角度可以划分为有资源预留的故障恢复机制和无资源预留的故障恢复机制。
有资源预留的故障恢复机制阮弱]应用比例不为零的方案保证虚拟网络的故障恢复.这类问题通常也被称为可生存的虚拟网络映射问题(sunrivable virtualnetwork embedding,SVNE)。参考文献提出了一种基于物理链路故障情况下的备份预留资源的分配方法。该方法可以保证多物理链路故障的恢复。参考文献通过将虚拟网请求的拓扑扩展从而映射扩充后的请求的两阶段方法来实现单一网络设施节点的故障恢复。方法的第一阶段通过添加冗余节点和链路将原始的VN请求扩展为一个可靠网络;第二阶段,将扩展后的网络映射到物理网络中。因此在第一阶段如何扩展网络以及在第二阶段如何通过尽可能共享资源减少物理资源的使用是这类方法需要解决的问题。参考文献研究了带有地理位置约束的单一网络设施节点故障的恢复。参考文献研究了单一区域故障条件下的故障恢复。
无资源预留的故障恢复机制只在故障确实发生并被探测到之后才会触发执行。通常。对于持续时间较短的故障,采取数据重传的方法,而对于持续时间较长的故障,通过为受到故障影响的虚拟资源搜索新的物理资源并将该虚拟资源重新映射到新的物理资源上实现故障恢复。这类问题的研究当前相对较少。一种最简单的虚拟资源重映射方法闻可以不考虑问题空问的底层结构和故障模式,只是简单地为每一个受到故障影响的虚拟网络重新计算资源映射方案。由于需要重新计算所有受到影响的虚拟网络的整体映射,该方法会有很大的配置开销,也会带来较长时间的服务中断。无资源预留的故障恢复机制本质上是一种故障触发的资源重映射,对这类问题的研究可以从缩小重映射可供选择的底层物理资源的范围人手.在映射之初计算出可供关键虚拟资源进行重新映射的候选物理资源集合,但并不做任何资源预留,承载关键虚拟资源的物理资源出现故障时,从事先确定的候选物理资源集合中选取可供重映射的物理资源。参考文献采用这种思路研究单一物理链路故障的恢复问题。此外,由于物理资源的有,限性,有可能出现仅允许恢复部分业务的情况。因此对此类问题研究的重点在于候选资源集合的选取以及在资源有限的前提下如何根据虚拟业务的类型和级别确定故障恢复的优先级。
4.结束语
网络虚拟化环境下的故障管理对于网络虚拟化环境下网络的顽健性、生存性和可管理性具有重要的意义,其目标是及时准确定位网络故障并迅速隔离和恢复故障。目前这方面的研究主要围绕故障探测、故障定位和故障恢复这3个方面。在故障探测的研究方面,针对网络虚拟化环境下网络规模扩大的特点,需要研究优化的探测机制.包括探测站点和探针集合的优化选择机制。在故障定位的研究方面,针对多层网络以及虚拟网络和物理网络间映射关系的不确定性等特点.需要研究网络虚拟化环境下的故障传播模型以及相应的故障诊断方法。在故障恢复的研究方面,针对网络虚拟化环境下对服务质量的要求,需要研究合理的故障恢复策略,在有限的物理网络资源之上生成资源提供成本低且违约损失少的故障恢复方案。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:网络虚拟化环境下的故障管理