1.引言
網絡虛擬化允許多個服務提供商動態地組織多個異構的虛擬網絡,并在其上部署并管理客戶化的端到端業務。網絡虛擬化提供了在共享底層設施上運行多個網絡的有效方式。并且,作為一種長期解決方案,網絡虛擬化在支持未來網絡中多種體系結構同時共存方面發揮著重要的作用。
在網絡虛擬化環境中,傳統的網絡服務提供商(ISP)分離成基礎設施提供商(InP)和服務提供商(SP)。基礎設施提供商負責搭建底層物理網絡,提供物理資源。服務提供商租賃底層物理資源,組建虛擬網絡并在虛擬網絡上部署客戶化的協議和應用。有些文獻將SP進一步分離為虛擬網絡提供商和應用提供商。網絡虛擬化屏蔽了物理層的細節,在技術上為網絡上運行多樣化的協議和應用提供了可能:在經濟上通過共享底層基礎設施避免了對基礎設施的重復購買和運維成本。可以預見.在未來網絡環境中。虛擬網絡之上將運行日益豐富的網絡協議和應用,而網絡的健壯性和生存性勢必成為網絡虛擬化研究和發展過程中一個不容忽視的問題。
故障管理是網絡管理中重要的研究領域。網絡故障管理的目標是及時準確地定位網絡故障,并迅速對網絡故障進行響應,盡快隔離故障和恢復故障,從而盡可能減少或避免網絡故障對其上運行的業務的影響。然而在網絡虛擬化環境中,虛擬網絡和設施擴大了網絡的規模,為網絡狀態感知帶來更大的難度和復雜度:虛擬化技術在提供了按需創建、遷移、調整和撤銷虛擬網絡等靈活性的同時,也導致虛擬網絡和物理網絡間映射關系的不確定,給建立故障傳播模型和診斷故障帶來一定的復雜性;此外.虛擬網絡和物理網絡對資源能力、服務質量、管理成本等方面的需求也為網絡虛擬化環境下的故障恢復機制帶來很大的挑戰。而傳統IP網的故障探測、定位和恢復機制面向的是確定的、單一層次的網絡,無法處理上述不確定性和映射約束,并且需要針對擴大的網絡規模做出進一步優化。因此.需要提出相應的故障管理機制,以便有效地對虛擬網絡故障狀態進行探測.及時準確地對虛擬網絡故障進行定位.快速高效地將網絡和業務從故障影響中恢復,從而提升虛擬網絡的頑健性、生存性和可管理性。
2.網絡虛擬化環境下的故障管理流程
網絡虛擬化環境下故障管理的基本過程為:通過在探測站點上發送一系列的探針,并收集探針返回的結果.獲得被管網絡中故障狀態信息;運用癥狀信息并結合網絡中的故障傳播模型診斷引發癥狀的根源故障:最后基于故障的位置.將虛擬網絡及相應的業務切換到預留的備份資源或臨時選擇的空閑資源上,最大限度減少或避免故障帶來的影響。
網絡虛擬化環境下故障管理的過程如圖1所示,各階段簡單描述如下。
圖1故障管理流程
故障探測階段:定期向網絡中發送探針,探測物理鏈路和節點以及虛擬鏈路和節點的運行狀態.并收集探測信息。為減少探測對網絡性能的影響并提高診斷的處理速度。該階段需要運用優化策略選取探測站點及探針集合。
故障定位階段:基于探測到的網絡癥狀信息和網絡的故障傳播模型,運行故障診斷算法,根據診斷結果判定網絡環境中是否發生故障,如果存在故障則進入故障恢復階段,如果未發生故障,則繼續定期探測網絡的運行狀態。
故障恢復階段:如果采用預留資源的恢復方案,則調用預先設計好的備份恢復方案:如果不采用預留資源的恢復方案,則管理系統需根據故障發生位置,臨時為故障網絡和業務選取可用資源。無論是預留資源的恢復方案還是無預留資源的恢復方案均須遵循相應的故障恢復策略,這些策略將綜合權衡質量、容量、成本等各種因素。最后基于恢復方案對網絡設施進行調整配置,實現故障恢復。
3.網絡虛擬化環境下故障管理的研究方向
基于網絡虛擬化環境的特性并圍繞故障管理流程的3個關鍵環節。要實現網絡虛擬化環境的故障管理.需要解決以下3個關鍵問題。
設計優化的故障探測機制,感知網絡的故障狀態。
設計及時準確的故障診斷機制,定位網絡故障。
研究基于資源容量、位置:成本等各種因素的故障恢復機制,滿足服務質量要求。本文從故障探測、故障定位和故障恢復這3個方面簡要介紹網絡虛擬化環境下故障管理的研究方向并分析其研究趨勢。
3.1 故障探測機制
網絡虛擬化環境需要使用一種靈活、準確、基于探針的主動探測方法來獲取網絡故障狀態。這種方法通過向被管網絡發送探針,并搜集探針的返回結果,獲取網絡的故障信息,從而最終定位故障。網絡虛擬化環境在傳統的物理網絡設施的基礎上又增加了眾多并存的虛擬網絡,因此要想全面獲取網絡的故障狀態信息所需要的探測規模急劇增加。然而大量的探測會為網絡和故障診斷帶來極大的開銷。對故障探測和診斷的及時性和實用性都帶來嚴重的影響。為保證探測的全面性同時降低探測成本、減少不必要探測為網絡和故障診斷帶來的開銷,需要對故障探測進行優化。具體來說涉及兩個方面:探針集合的優化和探測站點的選擇優化。
參考文獻采用不同的方法優化主動探測向系統發送的探針集合,以盡可能少的探針獲取更多的系統信息,同時盡可能降低計算復雜度。然而,網絡虛擬化環境中的網絡規模龐大.上述研究由于其計算復雜度過高對于大規模的網絡來說仍然無法適用,為此。需要研究更加高效的故障探針集合選擇方法,保證所選擇的探針集合在能夠探明系統故障情況的前提下,盡可能減小探針集合的規模。參考文獻研究了探測站點的選擇問題,以盡可能少的探測站點保證被管網絡所有節點的故障情況可被探測所確定。網絡虛擬化環境下,探測站點由于虛擬化的引入存在著更多的不確定性,節點可能失效和遷移,還需要在傳統的探測站點選擇方法的基礎上針對網絡虛擬化環境做進一步的研究。
3.2故障定位機制
網絡虛擬化環境下的故障診斷是在某些故障發生之后,定位故障發生的具體位置,是故障恢復的基礎。故障傳播模型描述了被管網絡中故障與癥狀(探針返回的結果)之間的依賴關系。故障傳播模型是故障診斷的前提和基礎。由于虛擬化網絡中存在故障的多層次和關聯性、負載的隨機性、節點和鏈路的動態遷移特性,適合于虛擬化網絡的故障傳播模型成為故障診斷的一個重要研究內容。
在獲得故障傳播模型的基礎上。還需要針對不同系統的特性設計并優化相應的故障診斷方法。降低方法的復雜度,參考文獻研究不同系統下的故障診斷方法。在網絡虛擬化環境下,底層信息對于上層虛擬網絡的透明性是網絡虛擬化的一個顯著特點。底層信息的透明性是指底層網絡設備的運行情況、底層設備的先驗故障概率、虛擬網設備與底層網絡設備的映射關系等信息,對于虛擬網絡提供商都是不可知的。而且對于虛擬網絡提供商來說,除了底層物理故障可能導致虛擬網絡提供商的故障,虛擬化技術本身也可能引入新的故障。如何在底層信息透明的。情況下進行物理故障和虛擬化故障這兩個層次的故障診斷是網絡虛擬化環境下需要解決的問題。
3.3 故障恢復機制
網絡虛擬化環境下的故障恢復機制為網絡的可靠性提供重要保障。故障恢復機制由故障觸發,通過將虛擬網絡和相應的業務切換到預留的備份資源或臨時選擇的空閑資源上,最大限度地減少或避免故障帶來的影響。因此故障恢復機制本質上是故障發生條件下的資源分配問題。參考文獻研究了虛擬網絡映射問題,然而這些研究均假設網絡始終正常運行,沒有考慮網絡故障的情況。網絡故障恢復機制從是否有備份資源預留的角度可以劃分為有資源預留的故障恢復機制和無資源預留的故障恢復機制。
有資源預留的故障恢復機制阮弱]應用比例不為零的方案保證虛擬網絡的故障恢復.這類問題通常也被稱為可生存的虛擬網絡映射問題(sunrivable virtualnetwork embedding,SVNE)。參考文獻提出了一種基于物理鏈路故障情況下的備份預留資源的分配方法。該方法可以保證多物理鏈路故障的恢復。參考文獻通過將虛擬網請求的拓撲擴展從而映射擴充后的請求的兩階段方法來實現單一網絡設施節點的故障恢復。方法的第一階段通過添加冗余節點和鏈路將原始的VN請求擴展為一個可靠網絡;第二階段,將擴展后的網絡映射到物理網絡中。因此在第一階段如何擴展網絡以及在第二階段如何通過盡可能共享資源減少物理資源的使用是這類方法需要解決的問題。參考文獻研究了帶有地理位置約束的單一網絡設施節點故障的恢復。參考文獻研究了單一區域故障條件下的故障恢復。
無資源預留的故障恢復機制只在故障確實發生并被探測到之后才會觸發執行。通常。對于持續時間較短的故障,采取數據重傳的方法,而對于持續時間較長的故障,通過為受到故障影響的虛擬資源搜索新的物理資源并將該虛擬資源重新映射到新的物理資源上實現故障恢復。這類問題的研究當前相對較少。一種最簡單的虛擬資源重映射方法聞可以不考慮問題空問的底層結構和故障模式,只是簡單地為每一個受到故障影響的虛擬網絡重新計算資源映射方案。由于需要重新計算所有受到影響的虛擬網絡的整體映射,該方法會有很大的配置開銷,也會帶來較長時間的服務中斷。無資源預留的故障恢復機制本質上是一種故障觸發的資源重映射,對這類問題的研究可以從縮小重映射可供選擇的底層物理資源的范圍人手.在映射之初計算出可供關鍵虛擬資源進行重新映射的候選物理資源集合,但并不做任何資源預留,承載關鍵虛擬資源的物理資源出現故障時,從事先確定的候選物理資源集合中選取可供重映射的物理資源。參考文獻采用這種思路研究單一物理鏈路故障的恢復問題。此外,由于物理資源的有,限性,有可能出現僅允許恢復部分業務的情況。因此對此類問題研究的重點在于候選資源集合的選取以及在資源有限的前提下如何根據虛擬業務的類型和級別確定故障恢復的優先級。
4.結束語
網絡虛擬化環境下的故障管理對于網絡虛擬化環境下網絡的頑健性、生存性和可管理性具有重要的意義,其目標是及時準確定位網絡故障并迅速隔離和恢復故障。目前這方面的研究主要圍繞故障探測、故障定位和故障恢復這3個方面。在故障探測的研究方面,針對網絡虛擬化環境下網絡規模擴大的特點,需要研究優化的探測機制.包括探測站點和探針集合的優化選擇機制。在故障定位的研究方面,針對多層網絡以及虛擬網絡和物理網絡間映射關系的不確定性等特點.需要研究網絡虛擬化環境下的故障傳播模型以及相應的故障診斷方法。在故障恢復的研究方面,針對網絡虛擬化環境下對服務質量的要求,需要研究合理的故障恢復策略,在有限的物理網絡資源之上生成資源提供成本低且違約損失少的故障恢復方案。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.vmgcyvh.cn/
本文標題:網絡虛擬化環境下的故障管理