雖然數(shù)據(jù)中心備份是基本數(shù)據(jù)保護策略的一個核心要素,但主要關(guān)注數(shù)據(jù)保護,保護和可用性的企業(yè)戰(zhàn)略集團(ESG)的資深分析師杰森 布福因森解釋了為什么存儲快照和復制也是必須一樣策略的原因。
人們可能聽說過存儲快照并不是備份的口頭禪。這當然是真的,但存儲快照在現(xiàn)代數(shù)據(jù)保護中越來越重要。根據(jù)企業(yè)戰(zhàn)略集團的數(shù)據(jù),10個組織中有9個組織使用以存儲為中心的保護技術(shù)(快照或復制)來補充高度虛擬化環(huán)境中的數(shù)據(jù)備份措施。
存檔與備份,以及為什么人們需要了解二者之間的差異
從數(shù)據(jù)備份中區(qū)分數(shù)據(jù)備份是IT專業(yè)人員在數(shù)據(jù)恢復方面所遇見的最常見的問題之一。而人們需要知道為什么需要了解兩者之間的區(qū)別,以及為組織構(gòu)建或優(yōu)化最佳數(shù)據(jù)歸檔策略獲得重要提示和最佳實踐。
雖然備份繼續(xù)支持每個組織的數(shù)據(jù)保護策略,但存儲快照通常是確保IT基礎(chǔ)架構(gòu)的可靠保護和快速恢復的一種補充方法。此外,快照與復制是現(xiàn)代數(shù)據(jù)保護的基礎(chǔ)。
快照的工作原理
雖然粒度細節(jié)可能略有不同,但快照本質(zhì)上是表示文件系統(tǒng)或卷看起來像在一個特定時間點的磁盤塊的集合。無論應(yīng)用程序,虛擬化層或其他抽象層,幾乎所有的存儲產(chǎn)品都可以歸結(jié)為文件系統(tǒng),其中各個文件和文件夾實際上由存儲系統(tǒng)本身上的盤塊內(nèi)保存的相關(guān)數(shù)據(jù)塊組成。要明確的是,這些可以是存儲陣列內(nèi)的物理塊或軟件定義的存儲或虛擬設(shè)備平臺內(nèi)的虛擬化塊。訪問文件,文件夾和數(shù)據(jù)的關(guān)鍵是磁盤映射,指向塊的本身,并駐留所選文件系統(tǒng)中。
簡單地說,假設(shè)一個75kB文件的數(shù)據(jù)分布在三個32kB磁盤塊上。所有高層訪問方法(包括文件信息,屬性和元數(shù)據(jù)以及應(yīng)用程序相關(guān)性)都包含在由操作系統(tǒng)驅(qū)動的文件系統(tǒng)中,該操作系統(tǒng)將文件提供為結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。文件系統(tǒng)本身僅包含 文件 的條目和到三個磁盤塊的順序指針,這三個磁盤塊隨機分布在實際存儲介質(zhì)上??梢詫⒖煺找暈檫@三個塊的 凍結(jié) 內(nèi)容,以及元數(shù)據(jù)和指針。
文件的中間塊更改后,也許在文件系統(tǒng)下,第一個和第三個塊保留,但第二個塊現(xiàn)在包含新數(shù)據(jù)??煺者^程保留塊的副本,因此可以通過簡單地重新連接三個原始數(shù)據(jù)塊將文件 恢復 到以前的時間點。在充分披露后,快照幾乎總是發(fā)生在卷級別,而不是一個文件級以上例子描述。這個解釋適用于兩者,并且可以通過以下的 快照如何工作 更好地理解。
為什么快照很重要
根據(jù)調(diào)查機構(gòu)ESG公司的研究,67%的服務(wù)器具有不到兩個小時的停機容錯,如調(diào)查的停機時間容錯。
雖然備份系統(tǒng)通??梢蕴幚韮蓚€小時以上的恢復率,但是在七個服務(wù)器中只有一個容忍由傳統(tǒng)備份機制強制停機6小時以上的時間窗口。并且因為備份數(shù)據(jù)將在替代硬件或服務(wù)上比原始數(shù)據(jù)駐留更容易壓縮和可存儲的狀態(tài),所以即使是從備份數(shù)據(jù)進行最快的恢復也有一些實際的限制。另外,恢復到以前的快照的時間為幾分鐘或更少的時間,因未塊位于與主數(shù)據(jù)相同的陣列內(nèi)。雖然逆轉(zhuǎn)從快照看起來肯定比從備份的恢復更好,但有一些常見的權(quán)衡:
本地漏洞。根據(jù)定義,備份是在其他位置保存的副本,快照駐留在與生產(chǎn)數(shù)據(jù)相同的存儲中介質(zhì)中,如果生產(chǎn)陣列被阻礙,快照將不可用。
存儲消耗。有些與此相關(guān),雖然備份經(jīng)常對其存儲庫使用不同類別的存儲介質(zhì),但是快照總是在生產(chǎn)環(huán)境的高性能存儲系統(tǒng)內(nèi)消耗容量。
保護頻率。由于高級的存儲消耗,大多數(shù)組織將保留快照中的數(shù)據(jù)以天計算,與備份的月份或年份相比,存儲時間較短。也就是說,用戶可以在白天(每隔幾個小時或每15分鐘一次)存儲一次快照,而不太頻繁和典型的夜間備份操作。
在使用快照時,大多數(shù)組織應(yīng)該使用快照作為他們最好的存儲方式,這個近乎即時的相對最近的數(shù)據(jù)可恢復性,然后將備份(甚至從磁盤)作為恢復的第二個選項。他們還應(yīng)該將快照與備份結(jié)合起來,以確保數(shù)據(jù)在陣列外部可生存時間更長。
區(qū)分快照機制
快照方法中的一個可區(qū)別的特征是寫入時復制(CoW)與寫時重寫(RoW),基本上涉及當寫入新數(shù)據(jù)時磁盤塊的行為。
參考一下前面的例子:
將需要三個磁盤塊的文件寫入塊A,B和C.
調(diào)用快照,可能是由于存儲用戶界面中的策略或與存儲陣列集成的備份應(yīng)用程序。
文件已更新,需要替換邏輯文件中間的信息。
如果存儲系統(tǒng)使用寫入時復制,將發(fā)生以下情況:
磁盤塊B的內(nèi)容將復制到卷上的其他位置-新塊 D 。
更新的文件數(shù)據(jù)寫入現(xiàn)有塊B-覆蓋現(xiàn)在已在其他位置保存的初始數(shù)據(jù)。
通過將新數(shù)據(jù)寫入塊B,可以順序訪問這三個塊(ABC)。
或者,如果存儲系統(tǒng)使用寫入重定向,則需要滿足以下條件:
新數(shù)據(jù)立即寫入新塊D.
文件系統(tǒng)中的指針現(xiàn)在指示文件由塊 ADC 組成,原始塊B保留為快照。
通過將更改重定向到新塊,在生產(chǎn)使用期間不必在存儲系統(tǒng)中進行額外的I/O操作。
從歷史上看,額外的I/O導致明顯的碎片化,導致一些存儲系統(tǒng)執(zhí)行回收或重組任務(wù),特別是當文件系統(tǒng)保持在單個陣列(例如,個人計算機與多軸陣列)上時。在CoW和RoW示例中,當快照保留窗口已經(jīng)過期(例如,在72小時的時間內(nèi)至少已發(fā)生一個備份)時,磁盤系統(tǒng)回收作為自由空間的塊(CoW中的D,RoW中的B)快照指針將消失。
如何從快照獲得更多
從快照啟用的兩個常見功能包括克隆和可移動的快照。
克隆,提供了各種品牌的術(shù)語,通常指使用快照功能用于除數(shù)據(jù)恢復之外的目的。許多組織希望將其數(shù)據(jù)副本用于應(yīng)用程序開發(fā),補丁測試,報告和分析等。但是他們不能承受所有的增量存儲容納不同的副本,也不想承受I/O從生產(chǎn)系統(tǒng)傳輸所有的數(shù)據(jù)。相反,因為快照字面上是指向塊的指針,所以這些指針通??梢员槐┞稙榈诙€文件系統(tǒng)(即,克隆),而不占用任何額外的存儲容量。雖然生產(chǎn)用戶繼續(xù)訪問實時數(shù)據(jù),但開發(fā)人員,分析人員和其他受益人可以訪問克隆用于其目的,假定存儲陣列可以確保足夠的IOPS,以免阻礙生產(chǎn)環(huán)境的運行。雖然新數(shù)據(jù)可能會消耗少量的增量存儲,但它通常是臨時性的,并且遠遠少于創(chuàng)建數(shù)據(jù)集的完整新副本。
盡管技術(shù)上不是快照的一部分,復制的塊本身通常被供應(yīng)商所吹捧,往往被吹捧的供應(yīng)商提供更有效的比基于文件的復制技術(shù)所執(zhí)行的更高級別的功能。在存儲產(chǎn)品中通常是相同的基礎(chǔ)技術(shù),用于管理作為快照編織在一起或傳輸以進行復制的塊功能。
移動快照利用基于塊的一些陣列復制,但也復制從第二個數(shù)組重建相同快照所需的元數(shù)據(jù)和指針?;蛘撸梢悦啃r在主陣列上配置快照,但僅在非現(xiàn)場二次陣列上每四個小時調(diào)用快照,在需要備份進行還原之前需要更長的保留時間。
上面描述的所有內(nèi)容(CoW與RoW,克隆,復制等)特定于各個陣列的機制,但是,如前所述,快照通常與傳統(tǒng)的備份機制相結(jié)合,用于更靈活和全面的恢復場景。歷史上,存儲管理員使用獨立于備份管理員界面,采用供應(yīng)商陣列的特定工具專門管理許多組織的快照。如今,許多領(lǐng)先的備份軟件產(chǎn)品集成了主流存儲產(chǎn)品的可管理性及其快照功能。雖然支持集成管理的陣列有很大差異,快照管理功能的集成和可擴展性也是如此,更常見的配置允許以下內(nèi)容:
單個管理UI(備份控制臺),用于通過類似于計劃備份方式的策略配置快照計劃,從而獲得所有每日,每周和每月恢復點(來自備份)和每小時恢復點(從快照)。
單個目錄,其中主存儲上的快照迭代被視為恢復的另一個來源,以及備份軟件本機使用的任何磁盤,磁帶或云存儲。也就是說,關(guān)于目錄的可用性,供應(yīng)商之間存在很大差異,其中一些備份界面與正確的存儲陣列相結(jié)合,可以呈現(xiàn)所有文件及其在每個快照中的版本的索引。其他組合在備份管理員手動安裝之前,無法查看快照。
恢復(來自備份)不能夠滿足業(yè)務(wù)部門的當前服務(wù)級別,特別是對于數(shù)據(jù)庫或虛擬化主機等核心平臺。然而,必須為那些事務(wù)應(yīng)用程序提供額外的技術(shù)調(diào)整,由此存儲快照供應(yīng)商向數(shù)據(jù)庫或管理程序?qū)犹峁┘蓴U展,因此快照具有其處于最佳可行狀態(tài)的數(shù)據(jù)。這樣做,許多備份應(yīng)用程序可以從快照中恢復單個項目,因為它們可以從自己的備份存儲介質(zhì)中恢復,這是將數(shù)據(jù)保護策略現(xiàn)代化的整個過程。
編輯:Harris