
北京腫瘤醫院目前的生產系統包括雙機雙存貯的HIS用小機系統、雙機單存貯的PACS用系統服務器及多臺Windows、Linux操作系統的其他業務應用服務器,數據庫有以下三種:
1. Oracle
2. SQL Server
3. Cache
目前多臺其他業務應用數據庫都存儲在每臺服務器的本地硬盤中。信息系統中常見的風險包括:網絡安全風險、計算機設備硬件的物理風險、人為破壞或邏輯錯誤的風險。災備系統要求:
?? 自動保存多數據版本,不占用大量存儲空間。
?? 數據的恢復不能只是依靠恢復過程,而是要求瞬間可用的立即恢復技術(秒級恢
復)。
?? 保存數據的間隔和顆粒度達到精細化的顆粒度(可以達到秒級)。
?? 支持異構操作系統級別的快速恢復
?? 災難發生時,數據可以回滾方式恢復。
?? 所有業務數據實現離線存貯。
北京腫瘤醫院CDP解決方案總體架構
北京腫瘤醫院飛康CDP解決方案架構如下圖所示:
北京腫瘤醫院飛康CDP解決方案架構
北京腫瘤醫院飛康CDP解決方案使用美國飛康CDP服務器1臺,部署在以太網中,保護7臺Windows應用服務器(包括操作系統和數據庫)。當服務器出現故障時,使用飛康軟件隨時接管,保證應用服務器7*24小時的高可用性;同時,使用磁盤陣列作為CDP服務器的存儲,實現應用服務器的連續數據保護和災難備份。
北京斯德銳科技有限公司作為飛康公司在醫療行業的合作伙伴,所提供的飛康CDP容災方案,是專為北京腫瘤醫院設計的一套行之有效的,集磁盤鏡像、數據連續保護和備份、未來遠程容災于一體的綜合容災解決方案。其基本架構為:
在北京腫瘤醫院的以太網中部署1臺飛康CDP管理器(自帶存儲),7臺Windows服務器通過iSCSI協議進行數據保護(如果服務器帶有光纖卡也可通過FC協議進行保護);
7臺Windows主機安裝飛康的DiskSafe軟件,將數據通過以太網鏡像到CDP管理器中;先配置1臺飛康CDP管理器,根據北京腫瘤醫院的業務量和對性能的要求可以隨時增加服務器以滿足需求;
將CDP 管理器采用旁路的方式接入到網絡中,不會對現有網絡拓撲有任何的更改和影響,而且,數據以鏡像的方式備份到CDP管理器中,不影響正常的生產數據。
本次北京腫瘤醫院項目的CDP管理器配置256份快照/生產卷的快照模塊(TimeMark),實現多歷史點保護。
如果生產系統出現人為的錯誤,需提取數據進行查詢或糾正錯誤,只需提取本地快照即可瞬間恢復(這一過程5分鐘即可完成)。
若出現磁盤故障或操作系統無法啟動的情況,可使用飛康CDP+VMware的架構進行異構系統級別的恢復。只需將CDP中的磁盤或快照分配給VMware服務器,再建立虛擬機即可。
實時備份和歷史快照
北京斯德銳科技有限公司公司為北京腫瘤醫院設計的飛康CDP解決方案可以實現連續數據保護。在增加了IPStor CDP設備的新的存儲架構下,系統在本地就提供了多種連續數據保護和恢復模式:
鏡像的保護模式可以有效應對存儲設備的單點故障引起的數據災難。在“主存儲”系統發生設備故障時,CDP系統可以立即提供存儲服務,保證應用服務的持續性。
通過CDP設備提供的邏輯快照功能,可以獲得多256個全備份。這種模式可以應對任何數據邏輯故障,包括:數據庫邏輯錯誤、人為誤操作和病毒等引起的數據庫數據丟失、人為或病毒引起的數據庫崩潰等故障。
利用CDP快照,我們不僅可以對數據庫各類錯誤實現快速恢復,還可以解決傳統備份無法實現的數據庫“表級恢復”。比如在誤操作導致某個數據庫表被誤刪除的情況下,不需要對整個數據庫進行恢復,只需要從快照中提取丟失的“表”,把它恢復到還在運行的數據庫中即可。
需要說明的一個技術優勢是:實現這256個快照全備份,并不需要其他備份方式那樣需要的“256倍存儲空間”,只需要增加大約20%的額外存儲空間就可以滿足所有備份的需要。
有了這256個全備份的支持能力,我們可以非常方便的制定數據備份策略,根據需要,我們可以選擇制定諸如以下案例的備份策略:
2 每小時一次的快照(全備份),可以保留至少10天左右的歷史數據備份,使得我們至少有能力追溯到10天以前的歷史數據。
2 每10分鐘一次的快照,可以保留兩天左右的歷史數據備份,使得我們有能力追溯到接近2天內的歷史數據,而且數據最大只有10分鐘的偏離。
對比:一般磁帶庫備份只能通過速度很慢的“Restore”操作恢復到“前天晚上”的備份點的數據,然后需要結合數據庫日志恢復整整“一天”的交易。而一般的容災系統又無法提供歷史數據的恢復。
利用CDP系統進行的實時數據備份和快照備份,我們可以應對各種數據系統故障和錯誤,保證數據系統的快速恢復。對于北京腫瘤醫院系統而言,采用CDP數據保護架構,可以避免我們以前遇到的各種數據備份的困擾:
2 備份數據無法驗證,潛在的風險是無法保證數據恢復的成功!
2 磁帶庫設備故障率高,難以維護。這個問題各地系統深有體會。
2 備份速度慢,恢復速度更慢,結合第一點的數據恢復的可靠性低,使得數據恢復過程就像一把懸在信息中心頭頂的劍那樣的難受。
重要的是,利用本地的CDP以及快照系統,RPO指標完全可以在0至10分鐘內,這對應用系統而言,相當于增加了一把保險鎖。
災難發生時的接管和恢復
對于北京腫瘤醫院Windows系統可能發生的災難以及恢復方法如下:
Windows系統(包括數據庫)
文件丟失或損壞
當發現數據庫文件或應用程序文件丟失或損壞時,使用CDP恢復只需要3個步驟大約1分鐘的恢復時間。CDP可以對鏡像過來的生產數據做定時的快照,如果發現單個文件丟失或損壞,可以找到沒有丟失的時間點提取快照,并分配給應用主機,然后在應用主機的磁盤管理中可以發行多了一個磁盤,打開這個磁盤找到丟失的文件COPY會原來的目錄即可。
這種方法可以使應用管理員用磁盤COPY的方法進行恢復,比備份軟件中看到的更加直觀,恢復更加方便。同時這種COPY的方法進行恢復當然支持選擇性恢復指定目錄與指定文件。
數據庫和應用系統無法正常啟動
當數據庫或應用系統出現問題無法啟動時,可以先使用CDP中的邏輯資源或快照進行接管。方法是將鏡像關系斷開,然后將鏡像盤分配給應用主機,將分區的盤符修改為正在原來生產系統使用的盤符即可。若邏輯資源也無法啟動,可以使用在各個時間點創建的快照進行查看。
硬盤中毒后的接管和恢復
當硬盤中毒但無物理損壞時,也可以使用CDP進行接管和恢復。首先,當生產盤無法使用時,可以使用CDP上的邏輯資源進行業務接管。方法是:先斷開鏡像關系,然后將鏡像盤分配給應用主機,再將盤符改成生產環境使用的盤符即可,整個過程也是在1分鐘內可以完成,非常簡單方便。然后,使用Disksafe的restore功能在后臺將數據同步到原來生產盤中即可。
硬盤物理損壞的接管和恢復
硬盤篇的故障是一種極為嚴重的威脅,往往對于業務系統具有致命的殺傷力,經常導致許多業務系統的完全癱瘓。以往的各個行業的IT系統對付這類故障一般沒有好的解決方法,都是采用備份系統花費大量的時間恢復到前一天的備份點,即無法達到RPO的數據保存指標,也無法達到RTO的業務恢復指標。
本系統中,美國飛康軟件公司的容災備份架構完全解決了這一點。一旦核心的硬盤出現故障,美國飛康軟件公司的CDP設備會立即接替其運行,應用系統只需等待較短的掛起時間,因此,磁盤系統的故障已完全納入了為無法造成業務威脅的范圍,完全解決了眾多IT系統的殺手問題。
更換硬盤后,再使用Disksafe的restore功能在后臺將數據同步到新的硬盤中。
文章作者:比特網
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄