前言:本站為你精心整理了存儲(chǔ)備份技術(shù)范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
摘要:在當(dāng)今網(wǎng)絡(luò)信息時(shí)代,SAN(存儲(chǔ)區(qū)域網(wǎng)絡(luò))是存儲(chǔ)領(lǐng)域近來十分引人注目的技術(shù)。它一方面能為網(wǎng)絡(luò)上的應(yīng)用系統(tǒng)提供豐富、快速、簡便的存儲(chǔ)資源;另一方面又能共享存儲(chǔ)資源并對其實(shí)施集中管理,成為當(dāng)今理想的存儲(chǔ)管理和應(yīng)用模式。討論了SMR系統(tǒng)中卷復(fù)制技術(shù)和Snapshot備份技術(shù),利用其系列功能,可以大大地減少計(jì)劃外或計(jì)劃內(nèi)的宕機(jī)時(shí)間,充分提高數(shù)據(jù)的可用性,同時(shí)可以提高系統(tǒng)的服務(wù)時(shí)間。
關(guān)鍵詞:存儲(chǔ);備份;卷復(fù)制技術(shù);Snapshot備份技術(shù)
1數(shù)據(jù)存儲(chǔ)備份與恢復(fù)的作用與意義
隨著計(jì)算機(jī)的普及和信息技術(shù)的進(jìn)步,特別是計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,信息安全的重要性日趨明顯。但是,作為信息安全的一個(gè)重要內(nèi)容——數(shù)據(jù)存儲(chǔ)備份的重要性卻往往被人們所忽視。只要發(fā)生數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)交換,就有可能產(chǎn)生數(shù)據(jù)故障。這時(shí),如果沒有采取數(shù)據(jù)存儲(chǔ)備份和數(shù)據(jù)恢復(fù)手段與措施,就會(huì)導(dǎo)致數(shù)據(jù)的丟失。有時(shí)造成的損失是無法彌補(bǔ)和無法衡量的。
數(shù)據(jù)故障的形式是多種多樣的。通常,數(shù)據(jù)故障可劃分為系統(tǒng)故障、事務(wù)故障和介質(zhì)故障三大類。在信息的收集、處理、存儲(chǔ)、傳輸和分發(fā)中經(jīng)常會(huì)存在一些新的問題,其中最值得關(guān)注的就是系統(tǒng)失效、數(shù)據(jù)丟失或遭到破環(huán)。
因此,數(shù)據(jù)存儲(chǔ)備份和數(shù)據(jù)恢復(fù)是保護(hù)數(shù)據(jù)的最后手段。
2數(shù)據(jù)存儲(chǔ)備份系統(tǒng)的基本構(gòu)成
一個(gè)好的數(shù)據(jù)存儲(chǔ)備份系統(tǒng)應(yīng)該具備以下一些基本要素:(1)保護(hù)性:全面保護(hù)用戶的數(shù)據(jù),在災(zāi)難發(fā)生時(shí)能快速可靠地進(jìn)行數(shù)據(jù)恢復(fù);(2)可管理性:這是存儲(chǔ)備份中一個(gè)重要的因素。因?yàn)榭晒芾硇耘c存儲(chǔ)備份的可靠性緊密相關(guān)。最佳的可管理性當(dāng)然就是自動(dòng)化存儲(chǔ)備份方案,這不僅增加了數(shù)據(jù)的安全性和可靠性,而且在數(shù)據(jù)恢復(fù)時(shí)減少了以往十分繁瑣的工作步驟,節(jié)約了大量的人力和時(shí)間;(3)可擴(kuò)展性:存儲(chǔ)備份最大的忌諱就是在存儲(chǔ)備份過程中因介質(zhì)容量不足而更換介質(zhì)。因?yàn)檫@會(huì)降低存儲(chǔ)備份數(shù)據(jù)的可靠性與完整性。因此,存儲(chǔ)介質(zhì)的容量在存儲(chǔ)備份中具有壓倒一切的重要性。
3卷復(fù)制技術(shù)
3.1存儲(chǔ)備份模型
當(dāng)用戶的數(shù)據(jù)需要保留相對比較長的時(shí)間時(shí),最經(jīng)濟(jì)的方法是采用磁帶,這就需要解決因此帶來的需要長時(shí)間存儲(chǔ)備份和恢復(fù)的問題。要完成存儲(chǔ)備份/恢復(fù)操作,最簡單的方案就是:用戶在每次需要進(jìn)行數(shù)據(jù)拷貝時(shí),逐個(gè)指定所使用的源/目的Volume,若需要多個(gè)副本,則需要多次重復(fù)同一過程。這樣把對存儲(chǔ)備份介質(zhì)的管理和對存儲(chǔ)備份過程的控制責(zé)任完全壓在了用戶身上,不但效率低下,而且容易出錯(cuò),也沒有充分發(fā)揮磁盤陣列硬件的并行優(yōu)勢。
為此,備份恢復(fù)管理模塊首先從介質(zhì)的管理入手,它通過引入復(fù)制的觀點(diǎn),即在磁盤陣列中將一些磁盤作為主磁盤,另一些作為主磁盤的冗余盤,也叫從磁盤,通過對主磁盤和從磁盤的pair設(shè)定,并提供復(fù)制、恢復(fù)、分離等命令,可實(shí)現(xiàn)以下功能:主盤上所有數(shù)據(jù)的變化可以直接反映到從盤上;當(dāng)發(fā)生意外時(shí),從盤上的數(shù)據(jù)可以迅速恢復(fù)到主盤上等功能,并且通過各種選項(xiàng)的設(shè)置,實(shí)現(xiàn)不同的復(fù)制狀態(tài),按用戶的需要完成不同的備份恢復(fù)功能。用戶可以事先規(guī)劃好數(shù)據(jù)的備份和恢復(fù)關(guān)系,在用戶的參與下建立起多個(gè)磁盤陣列間的備份網(wǎng)絡(luò),以后的備份/恢復(fù)過程就只需要指定所要操作的備份網(wǎng)絡(luò)即可。
備份/恢復(fù)操作是以邏輯盤LD為單位進(jìn)行的。邏輯盤在備份術(shù)語中稱為“卷”。基本備份/恢復(fù)功能就是通過將磁盤陣列中業(yè)務(wù)卷上的數(shù)據(jù)復(fù)制到復(fù)制卷上,以實(shí)現(xiàn)系統(tǒng)的高安全性。當(dāng)業(yè)務(wù)卷上的數(shù)據(jù)被毀壞時(shí),就可以用它的復(fù)制卷上的數(shù)據(jù)來恢復(fù)業(yè)務(wù)卷上的數(shù)據(jù)內(nèi)容,或者讓服務(wù)器直接訪問這個(gè)復(fù)制卷。
3.2Pair信息的存儲(chǔ)
借助pair關(guān)系的branch(分叉)和chain(鏈?zhǔn)剑┨匦?,可形成一個(gè)備份/恢復(fù)的多叉樹,并進(jìn)而形成一個(gè)強(qiáng)大的備份網(wǎng)絡(luò)。為了在系統(tǒng)中表示與操作這種關(guān)系,需要用一種數(shù)據(jù)結(jié)構(gòu)來存儲(chǔ)它。作為pair中主方的Volume會(huì)具有MV屬性,作為pair中從方的Volume會(huì)具有RV屬性。
關(guān)系總是依賴于實(shí)體而存在的,因此筆者將pair關(guān)系用volume中的一個(gè)稱之為“pairnode”的內(nèi)嵌結(jié)構(gòu)體來表示。pairnode中包含MV或RV的定位信息,以及該pair當(dāng)前所處的狀態(tài)。
為了查詢性能的優(yōu)化,以及為了能通過RDRpair中的一方找到位于遠(yuǎn)地的另一方,在MV和RV所對應(yīng)的Volume中都持有表示同一個(gè)pair關(guān)系的“pairnode”。
pair關(guān)系是有方向性的,為了區(qū)分這一點(diǎn),參照Volume的分類方法,可將MV中的那個(gè)指向RV的“pairnode”稱為“replicationpairnode”,將RV中的那個(gè)指向MV的“pairnode”稱為“masterpairnode”。
MV和RV中表示同一個(gè)pair關(guān)系的“pairnode”中所保存的pair狀態(tài)值在大多數(shù)情況下是完全一樣的,但在pair中一方出現(xiàn)故障而另一方正常時(shí),二者的內(nèi)容可能會(huì)有所差別。另外,系統(tǒng)提供了一些單方強(qiáng)制操作,亦只對pair中的某一方而不是同時(shí)對MV和RV同時(shí)執(zhí)行操作,在這種情況下,MV和RV中的pair狀態(tài)信息也會(huì)有所差別。這種MV和RV中保存的pair狀態(tài)信息的不一致性,也是同時(shí)在MV和RV方保存pair信息的原因之一。
圖1pair信息存儲(chǔ)示意圖
3.3卷復(fù)制功能的實(shí)現(xiàn)
(1)pair的設(shè)定和解除操作。
在設(shè)定pair時(shí),首先要檢查指定的兩個(gè)Volume是否可以被設(shè)定為pair,即:①即將作為RV的Volume必須是一個(gè)IV(獨(dú)立卷);②兩個(gè)Volume的容量、類型等必須完全一致;③若即將作為MV的Volume不是一個(gè)VI,則它所在的所有pair必須處于分離狀態(tài);在解除一個(gè)pair時(shí),要檢查指定的兩個(gè)volume是否己經(jīng)是一對pair,且該pair應(yīng)當(dāng)處于分離狀態(tài)。
(2)Restore/Separate等操作。
這些操作本身的實(shí)現(xiàn)并不難,最主要的是要在命令發(fā)行前根據(jù)硬件的當(dāng)前狀態(tài)進(jìn)行合法性檢查,預(yù)先判斷這些命令發(fā)往硬件后,是否能被執(zhí)行成功。若檢查通過,則將之打包成Agent模塊所能識(shí)別的電文并發(fā)往Agent模塊,等待執(zhí)行結(jié)果的返回。
4Snapshot存儲(chǔ)備份技術(shù)
4.1Snapshot的提出
卷復(fù)制技術(shù)能夠提供塊級的數(shù)據(jù)同步功能,并且在性能上比文件復(fù)制要高出許多。在備份的時(shí)候,可以實(shí)現(xiàn)對數(shù)據(jù)的無間斷備份,僅僅是在主卷和從卷分離的時(shí)候,需要停止在主卷上的作業(yè)。但是,這種I/0操作,即使是處于同一個(gè)磁盤陣列筐體內(nèi)的兩個(gè)磁盤(LD)之間進(jìn)行,速度也不是很理想。而且,這種基于主從卷之間的備份和恢復(fù)技術(shù),更適合于對付突如其來的物理災(zāi)害。
Snapshot技術(shù)是實(shí)現(xiàn)瞬間做成volume在某一時(shí)間的拷貝,大大降低了備份時(shí)業(yè)務(wù)中斷的時(shí)間,同時(shí),它應(yīng)用差分管理技術(shù)實(shí)現(xiàn)了備份成本的降低,并且,使得備份的世代管理成為可能。
4.2Snapshot的實(shí)現(xiàn)方式
從Snapshot實(shí)現(xiàn)的層次來看,Snapshot功能可以由磁盤陣列內(nèi)的固件來實(shí)現(xiàn),也可以在操作系統(tǒng)級由卷管理器軟件或文件系統(tǒng)來實(shí)現(xiàn)。從實(shí)現(xiàn)所采用的技術(shù)來看,可采用指針型實(shí)現(xiàn)方式。其核心是采用虛擬磁盤技術(shù),Snapshot中的每一個(gè)數(shù)據(jù)塊建立一個(gè)指針,指示該數(shù)據(jù)塊所在的實(shí)際地址。對于Snapshot中那些與原始數(shù)據(jù)相同的數(shù)據(jù)塊,不需要額外的數(shù)據(jù)副本,Snapshot中只需要維持一個(gè)指向該原始數(shù)據(jù)塊的指針;只有那些與原始數(shù)據(jù)不同的數(shù)據(jù)塊,需要?jiǎng)?chuàng)建一份舊數(shù)據(jù)的副本。使用Snapshot時(shí),需要制作較多的Snapshot拷貝,一般需要4至8個(gè)Snapshot拷貝循環(huán)使用?;謴?fù)時(shí),需要配合使用原始數(shù)據(jù)volume與最新的那個(gè)Snapshot卷。最重要的是,需要有一種方法來對這些Snapshot拷貝進(jìn)行“世代”管理,記錄它們的“新、舊”程度。而卷復(fù)制方案只需要2至3個(gè)volume,不需要任何“世代”管理方案。
4.3Snapshot的核心技術(shù)實(shí)現(xiàn)
(1)數(shù)據(jù)在SDD中的存放及訪問。
在Snapshot在做成快照映像時(shí),對SOV或是DV寫數(shù)據(jù)是將差異數(shù)據(jù)存放在SDD區(qū)域的LD中,相應(yīng)時(shí)間點(diǎn)做成的DV保存的則是對應(yīng)SDD中數(shù)據(jù)保存位置的地址指針,即通過這些地址指針統(tǒng)一管理所有的差異信息。
圖2SDD的存儲(chǔ)以及世代示意圖
(2)快照磁盤向源磁盤的數(shù)據(jù)恢復(fù)。Snapshot和其他的數(shù)據(jù)備份管理相類似,同樣具有備份和恢復(fù)功能。由于Snapshot的備份是虛擬的,因此SRestore也是虛擬的。它并不采用傳統(tǒng)restore將RV備份的數(shù)據(jù)重新復(fù)制回MV的處理方法,通過DV把SDD中的差異信息重新寫回到SOV上?;謴?fù)的基礎(chǔ)是還存在工作正常的SOV。因此,SRestor,不能象普通的SRestore那樣,只要RV的數(shù)據(jù)是可用的就可以進(jìn)行數(shù)據(jù)恢復(fù),而是如果SOV出現(xiàn)了物理故障,DV失去了恢復(fù)數(shù)據(jù)的基礎(chǔ),從而所有的DV都變成了無效的。
5卷復(fù)制技術(shù)和Snapshot存儲(chǔ)備份技術(shù)比較
卷復(fù)制技術(shù)可以耐物理障害,同時(shí),由于是全盤復(fù)制,對復(fù)制盤的訪問并不會(huì)影響主盤的性能,但是,這些都是在高成本的前提下實(shí)現(xiàn)的。
Snapshot技術(shù)雖然在耐物理障害方面劣勢明顯,但是,它的存儲(chǔ)備份速度是微秒級的,這使得它對業(yè)務(wù)的影響最小,當(dāng)然,代價(jià)是對主盤訪問的性能會(huì)有所下降。同時(shí),由于Snapshot只復(fù)制變化的數(shù)據(jù),所以占用空間較少,成本比較低。
綜述之,卷復(fù)制技術(shù)和Snapshot技術(shù),各有利弊,各有適合使用的應(yīng)用場合,也可以同時(shí)使用,對于中間過程的存儲(chǔ)備份或經(jīng)常性的存儲(chǔ)備份利用Snapshot,對于階段性的存儲(chǔ)備份利用卷復(fù)制技術(shù),這樣結(jié)合使用可以實(shí)現(xiàn)更加靈活的存儲(chǔ)備份策略。
參考文獻(xiàn)
[1]RobertSPadlnig,郭迅華.存儲(chǔ)網(wǎng)絡(luò)完全手冊[M].北京:電子工業(yè)出版社,2007.
[2]牛云,徐慶.數(shù)據(jù)備份與災(zāi)難恢復(fù)[M].北京:機(jī)械工業(yè)出版社,2006.
[3]聶丹.適合中小企業(yè)的數(shù)據(jù)備份方案[J].常州工學(xué)院學(xué)報(bào),2007,(4).
[4]王春.數(shù)據(jù)存儲(chǔ)技術(shù)的發(fā)展與未來[J].鐵路通信信號(hào)工程技術(shù),2006,(2).
[5]劉賢揩.網(wǎng)絡(luò)存儲(chǔ)方案的選擇[J].信息技術(shù).2005,(4).