是時候重新審視你的重復(fù)數(shù)據(jù)刪除策略了。如今大部分環(huán)境都需要使用重復(fù)數(shù)據(jù)刪除技術(shù),不論是面臨資源瓶頸、規(guī)模制約,還是兩者皆有,重復(fù)數(shù)據(jù)刪除已作為一種實用工具迅速普及。但是當面臨持續(xù)快速增長的數(shù)據(jù)時,這項過于依賴基礎(chǔ)硬件設(shè)備的策略則可能會產(chǎn)生其他技術(shù)問題。
先來看一些數(shù)據(jù):平均來說,目前數(shù)據(jù)正以每年40%的速度增長,換句話說,每兩年翻一番,并且沒有結(jié)束的跡象——無論你承認與否,數(shù)據(jù)增長的事實就擺在眼前1。
面對這樣的現(xiàn)狀,“Parallel Deduplication”(并行重復(fù)數(shù)據(jù)刪除)的概念適時而出,以提供大規(guī)模、可擴展和高彈性的重復(fù)數(shù)據(jù)刪除為前提,通過以軟件為中心的方式為最大的數(shù)據(jù)以及需求最多的應(yīng)用程序設(shè)計,并通過一個基于網(wǎng)格架構(gòu)和利用重復(fù)數(shù)據(jù)刪除數(shù)據(jù)庫(DDB)和介質(zhì)運行的。根據(jù)網(wǎng)格結(jié)構(gòu),并行重復(fù)數(shù)據(jù)刪除將聯(lián)合多個DDB一起為數(shù)據(jù)保護工作(客戶端和子客戶端)提供一個單一、大規(guī)模的重復(fù)數(shù)據(jù)刪除池:例如,兩節(jié)點平行數(shù)據(jù)刪除池的架構(gòu)模型。由此可以通過接近線性的方式擴展重復(fù)數(shù)據(jù)刪除容量和吞吐量,用來支持負載繁重的數(shù)據(jù)刪除工作。
考慮到這一點,CommVault在其最新推出的Simpana® 10中推出了其第四代重復(fù)數(shù)據(jù)刪除技術(shù),該技術(shù)主要基于并行重復(fù)數(shù)據(jù)刪除技術(shù),以應(yīng)對數(shù)據(jù)持續(xù)爆炸性增長帶來的挑戰(zhàn)。通過全新的基于網(wǎng)格的結(jié)構(gòu),第四代重復(fù)數(shù)據(jù)刪除在性能及規(guī)模上都提升了一倍,從而能夠使企業(yè)的基礎(chǔ)設(shè)施運行更加智能化。除了可以提供大規(guī)模容量和吞吐量,企業(yè)也可以將并行重復(fù)數(shù)據(jù)刪除方法與CommVault獨有的GridStor®技術(shù)相結(jié)合,得到完整的負載平衡和作業(yè)故障轉(zhuǎn)移選項。如果重復(fù)數(shù)據(jù)刪除池的一個節(jié)點出現(xiàn)故障,那么其他節(jié)點會立刻接管現(xiàn)有任務(wù)從而避免任何宕機的可能。
圖示1:兩節(jié)點并行重復(fù)數(shù)據(jù)刪除池配置示例
舉例來說(圖示1),將兩個重復(fù)數(shù)據(jù)刪除節(jié)點聯(lián)合在一起,每個節(jié)點最多可保護120TB的前端容量2和大約4.5TB/小時的吞吐量3。通過將兩個節(jié)點聯(lián)合到一個單一的重復(fù)數(shù)據(jù)刪除池,我們最多可以對240TB的數(shù)據(jù)和9TB/小時的吞吐量進行重復(fù)數(shù)據(jù)刪除管理。
并行重復(fù)數(shù)據(jù)刪除技術(shù)只是Simpana 10眾多功能之一,它可以讓重復(fù)數(shù)據(jù)刪除更加智能。隨著數(shù)據(jù)的不斷增長和數(shù)據(jù)處理的復(fù)雜性,在制定重復(fù)數(shù)據(jù)刪除策略時,有必要考慮:
1. 將遠程及中央辦公室的重復(fù)數(shù)據(jù)刪除整合到一個單一的軟件架構(gòu)中。企業(yè)可以在遠程站點利用單一節(jié)點重復(fù)數(shù)據(jù)刪除策略。然后在中央站點利用并行重復(fù)數(shù)據(jù)刪除策略,采用DASH Copy技術(shù)將刪除的重復(fù)數(shù)據(jù)拷貝到中央站點。將單一節(jié)點和多節(jié)點重復(fù)數(shù)據(jù)刪除功能融為一體,可以為企業(yè)提供足夠的靈活性,基于企業(yè)的業(yè)務(wù)需求,對每個站點的數(shù)據(jù)容量進行相應(yīng)的調(diào)整。
2. 利用DASH FULL技術(shù)進行永久增量備份。這可以在最大限度降低對生產(chǎn)服務(wù)器和網(wǎng)絡(luò)影響的同時,大大提高備份策略的智能性,更好地利用原有的基礎(chǔ)設(shè)施。例如,采用傳統(tǒng)的每日增量備份、每周完全備份的方式,虛擬機(VM)每個節(jié)點的備份數(shù)據(jù)僅能達到20-25TB。而采用永久增量和DASH備份技術(shù),每個節(jié)點就可備份40-50TB的虛擬機數(shù)據(jù)。
3. 基于數(shù)據(jù)類型,通過單一控制臺全面統(tǒng)一管理多個重復(fù)數(shù)據(jù)刪除池,可確保企業(yè)創(chuàng)建的重復(fù)數(shù)據(jù)刪除池在刪除重復(fù)數(shù)據(jù)方面帶來最大的效益,從而優(yōu)化資源的利用。
最后,關(guān)于并行重復(fù)數(shù)據(jù)刪除,企業(yè)還需要做額外考慮:Simpana 10在并行重復(fù)數(shù)據(jù)刪除策略中支持兩個節(jié)點,雖然該策略對重復(fù)刪除數(shù)據(jù)可以聯(lián)合的節(jié)點沒有硬件上的限制。并且企業(yè)可以期待CommVault把單一并行重復(fù)數(shù)據(jù)刪除策略的節(jié)點數(shù)量推向一個極限;此外,在存儲策略中,需要預(yù)先對并行重復(fù)數(shù)據(jù)刪除節(jié)點進行配置——單一的節(jié)點無法轉(zhuǎn)換為兩個節(jié)點,兩個節(jié)點也不會轉(zhuǎn)換為4個節(jié)點,因此應(yīng)對數(shù)據(jù)增長的解決方案仍然需要提前進行規(guī)劃。
注解:
1 2013年消費傾向調(diào)查表,ESG 2013年1月
2 120TB需要使用SSD——DDB商店
3吞吐量初測為Simpana10的標準,這個數(shù)字預(yù)計在Simpana10的生命周期中還會增長。
Phil Curran,CommVault基礎(chǔ)設(shè)施解決方案產(chǎn)品營銷總監(jiān)。