業務支撐系統是指由計算機硬件、存儲設備、網絡通訊設備、計算機軟件、信息資源和相關業務管理流程組成的以處理業務信息為目的的系統。業務支撐系統高可用是指系統應對風險具有自動調整和快速反應的能力,以保證業務的連續運轉。高可用保障體系由本地應急系統和容災系統組成,本地應急系統、容災系統與生產系統相互配合共同保證整體業務的連續性。
目前,傳統的應急容災方案通;诒镜卦O備高可用(如主備雙機、存儲柜間鏡像等)、異地數據容災復制等技術,這些方案存在以下不足:(1)本地災難時異地應用恢復時間(RTO)較長。當發生本地機樓級災難時,異地的容災主機需重新加載數據,重新啟動,恢復時間估計為30~120分鐘,這樣會造成較大的損失;(2)異地容災設備資源的浪費,在平時正常情況下,異地主機不承擔或承擔少量生產業務,主機資源浪費嚴重;(3)應急容災切換和災難修復回切操作復雜,需制定完備的容災管理體系,并定時演練,以保障災難時操作的高效。
本文基于存儲虛擬化技術提出一種業務支撐系統容災保障的新思路,可解決傳統高可用保障方案的不足。本地和遠端同時承擔生產和容災的角色,實
現業務雙中心雙活模式,一端發生災難時,另一端可實時接管。該方案基于存儲同步復制技術的雙活業務支持應急系統應用,采用虛擬化存儲,實現兩個站點資源的同時使用,再配合使用文件集群系統,生產端和容災端在平時都承載生產業務,分區域進行業務分擔。理論上可實現同一個數據庫/文件系統被多個主機同時訪問,在本地和異地兩個數據中心節點上均可同時啟動并對外提供服務。
1 業務支撐系統概述
1.1 系統設計的分層結構
按系統功能架構一般可分為IP網絡層、主機層、存儲網絡層和存儲層,各層的高可用設計如下:
IP網絡層:包括交換機、防火墻、路由器、負載均衡器等。通常采用主備雙平面設計,當主網絡平面某節點的網絡設備故障時,自動切換至另一個平面。
主機層:系統主機包括各類數據庫、中間件、后臺應用、WEB和接口服務器等,通常采用雙機主備或雙機/集群負載均衡的部署方式。
存儲網絡層:存儲網絡是未用主機與磁盤陣列之間的高速的網絡傳輸中繼設備,通常采用光纖線纜作為傳輸介質,1+1負載均衡的方式實現高可用冗余。
存儲層:對于關鍵業務的存儲磁盤陣列,通常要求存儲盤陣具有雙控制器,甚至采用雙臺存儲盤陣,結合跨盤陣的數據鏡像方式實現本地高可用冗余。對于異地容災需求則可采用各類遠程數據復制技術實現數據異地容災。
系統架構如圖1所示。
圖1 信息系統架構圖
1.2系統高可用的業務指標
信息系統的高可用能力通?捎2個指標來衡量,包括RTO(RecoveryTime Object)、RPO(RecoveryPoint Object)。RTO(恢復時間目標)是指災難發生后,從IT系統宕機導致業務停頓開始,到IT系統恢復至可以支持各部門運作、業務恢復運營之時兩點之間的時間段;RPO(恢復點目標)是指一個過去的時間點,當災難或緊急事件發生時,數據可以恢復到的時間點。
2 三種高可用技術
2.1 存儲虛擬化技術
存儲虛擬化技術是在物理存儲系統和服務器之間增加一個虛擬層,管理和控制所有存儲并對服務器提供存儲服務。服務器不直接與存儲硬件打交道,存儲硬件的增減、調換、分拆、合并對服務器層完全透明。它屏蔽了存儲硬件的復雜程度,允許將現有的功能集成使用,擺脫了物理容量的局限。
存儲虛擬化主要有兩種實現方式:基于軟件和基于硬件引擎。基于硬件引擎:虛擬引擎在一個專用的硬件設備上或光纖交換機上,從連接到SAN的存儲上劃分虛擬卷。典型產品有IBM SVC、EMCVPLEX;谲浖杭磳⑻摂M化軟件安裝在應用主機上,在連接到主機的不同存儲上劃分虛擬卷。典型產品有Symantec VERITAS CFS。
存儲虛擬化技術提供同步復制功能,來自服務器的更新被寫入本地連接的控制器集群(Cluster)的緩存,該系統將數據轉發給異地數據中心連接的控制器集群的緩存。只有當兩個控制器集群的緩存都擁有數據的拷貝以后本地系統才會向處理器返回一個I/O完成指示。同步遠程拷貝能夠在異地數據中心提供最新程度的數據當前值。
通過利用存儲虛擬化技術的同步鏡像功能,可以保證本地源卷和遠程目的卷的數據完全一致,由此保證了雙活數據中心的業務連續性。它屬于最底層硬件設備提供的“零切換”能力,相對于傳統容災技術可以減少用戶的維護工作量,有效避免故障時技術平臺的切換操作過程。如圖2所示。
圖2 存儲虛擬化同步鏡像機制
2.2集群數據庫Oracle RACE
集群數據庫技術是將多臺數據庫服務器聯合起來組成集群,實現綜合性能優于單個大型數據庫服務器的技術。Oracle RAC又為“真實應用集群”,是其中最典型的產品,用于數據庫服務器的高可用。它采用緩存融合技術,使各數據庫主機將它們的數據緩存合并為一個共享的全局緩存,從而利用所有存活節點的緩存和CPU資源,當某節點發生故障時,可從節點失效中快速恢復。如圖3所示。
圖3 Oracle RAC集群
2.3集群文件系統
集群文件系統可以實現同一個文件系統通過SAN光纖網絡同時被多個主機訪問,在邏輯卷層面上保證了雙數據中心的應用對文件系統數據的并發雙活訪問。應用程序在雙數據中心節點上均可以同時啟動并對外提供服務,發生故障時無需切換。而且高可用集群可以自動進行業務的切換,降低了人工操作的難度和時間。
3 業務支撐系統容災保障新思路探討
通過虛擬化存儲技術,存儲可以異地部署,實現兩個數據中心的存儲資源同步。利用數據庫集群及集群文件系統,實現源數據和災備數據可同時被讀寫。結合上述技術的優勢,我們得到一種新的存儲高可用技術,進而形成業務支撐系統容災保障新思路——存儲雙活中心。其中,依據所使用的存儲虛擬化技術不同,存儲雙活中心可以有兩種設計方案實現。
3.1 基于存儲虛擬化硬件引擎的雙活存儲中心設計方案
在主機和IP網絡層,利用大二層以太網絡技術,將本地和異地兩個數據中心的數據庫組成4節點的RAC(4節點RAC之間的Cache Fusion需要高速穩定的網絡來保證)。本地故障時,可使用異地RAC節點進行業務接管,兩個數據中心節點RAC心跳網絡由大二層網絡提供。Web服務器本地采用負載均衡器的方式,異地進行同等服務器性能配置;應用及中間件服務器本地及異地使用相同配置。
在存儲網絡和存儲層,利用光纖鏈路,實現數據同步鏡像(存儲虛擬化+集群文件系統)技術實現本地和遠端的統一存儲池。通過虛擬化的存儲引擎,實現兩個站點資源的同時使用,再配合使用集群文件系統,實現同一份文件系統數據被多個主機同時訪問,在雙數據中心節點上均可以同時啟動并對外提供服務,實現雙活模式。
本方案的優點是可以實現不同站點的不同主機同時訪問同一個數據庫,實現雙活模式;單個站點發生故障或災難時,無需切換應用便可快速接管。不足之處在于雙中心有距離限制,必須在100公里以內,并且對網絡延遲、帶寬、網絡質量穩定性要求高。圖4為基于存儲虛擬化硬件引擎實現的雙活方案。
圖4 基于存儲虛擬化硬件引擎實現雙活方案
3.2基于存儲虛擬化軟件的雙活存儲中心設計方案
在主機和網絡層,同樣利用大二層以太網絡技術,將本地和異地兩個數據中心的數據庫組成4節點的RAC,與基于存儲虛擬化硬件引擎的雙活存儲中心設計方案一致。
在光纖網絡和存儲層,利用存儲虛擬化軟件和光纖鏈路實現本地和遠端的統一存儲池,構建生產存儲和容災存儲為實時鏡像關系,實現存儲數據的遠程容災,再配合使用集群文件系統,實現同一份文件系統數據被多個主機同時訪問,在雙數據中心節點上均可以同時啟動并對外提供服務,實現雙活模式。
該方案去除對存儲虛擬化硬件的需求,采用軟件方式實現存儲虛擬化和存儲數據的實時鏡像,實現不同站點不同主機同時訪問同一個數據庫的雙活模式;單個站點發生故障或災難時,無需切換應用便可快速接管。缺點是雙中心距離更受限制,需要更大的帶寬和較低的延遲來保證性能,并且以軟件方式實現存儲虛擬化會額外消耗主機處理能力。存儲虛擬化軟件實現雙活方案見圖5所示。
圖5 基于存儲虛擬化軟件實現雙活方案
3.3雙活存儲中心與傳統應急容災系統比較
對存儲雙活中心與傳統應急容災系統進行對比,見表1所示。
表1 業務效果的對比
4 結論
雙活數據中心方案可以實現在本地和遠端兩個數據中心在同時提供業務支撐能力,作為一種應急容災新思路,能充分利用容災主機的處理能力,減少資源浪費,同時又能解決業務系統在災難及日常維護過程中造成的停機問題,該思路同樣適用于其他大型、復雜的信息系統容災。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.vmgcyvh.cn/