分布式存儲系統(tǒng)
是集成眾多標準IT技術的綜合系統(tǒng),因此,在使用部署的時候需要根據(jù)業(yè)務系統(tǒng)的需求,合理的規(guī)劃網(wǎng)絡資源、數(shù)據(jù)保護方式、存儲池安全級別以及制定相關的運維策略,來保證分布式存儲系統(tǒng)的安全、穩(wěn)定、高效的工作。
網(wǎng)絡規(guī)劃
分布式存儲系統(tǒng)一般提供數(shù)據(jù)副本或糾刪碼的數(shù)據(jù)保護方式來保證數(shù)據(jù)的安全,這個特性會對網(wǎng)絡產(chǎn)生不一樣的性能壓力。比如,我們使用2副本的數(shù)據(jù)保護方式,就意味著當有1MB的數(shù)據(jù)寫入時,存儲內(nèi)部將產(chǎn)生2MB的數(shù)據(jù)存儲量。因此,當業(yè)務網(wǎng)絡產(chǎn)生1MB的寫入數(shù)據(jù)時,存儲網(wǎng)絡就需要產(chǎn)生2MB的數(shù)據(jù)流量將數(shù)據(jù)分散的存儲在各個存儲節(jié)點。因此,在網(wǎng)絡規(guī)劃階段,應根據(jù)不同的數(shù)據(jù)保護方式特性,來規(guī)劃業(yè)務網(wǎng)絡與存儲網(wǎng)絡之間的數(shù)據(jù)冗余比配置關系。
數(shù)據(jù)保護方式
數(shù)據(jù)副本和糾刪碼是兩種最常用的數(shù)據(jù)保護方式。數(shù)據(jù)副本的技術實現(xiàn)方式最為簡單——直接使用拷貝的方式形成多副本數(shù)據(jù),以保證數(shù)據(jù)的安全;在數(shù)據(jù)需要恢復的時候,只需要再拷貝一份數(shù)據(jù)副本即可完成數(shù)據(jù)的重建。而糾刪碼則是需要通過CPU的計算來形成數(shù)據(jù)校驗塊——類似于傳統(tǒng)的RAID3或5的原理,在數(shù)據(jù)重建的時候,再通過剩余的數(shù)據(jù)塊來算出丟失的數(shù)據(jù)塊。因此,糾刪碼方式需要消耗一定的CPU資源。比較而言,數(shù)據(jù)副本模式對存儲節(jié)點CPU處理資源的占用非常少,而糾刪碼方式對存儲節(jié)點CPU處理資源占用比較多,特別是在數(shù)據(jù)重建的過程中將消耗大量的CPU資源。并且,由于有些業(yè)務系統(tǒng)會進行文件的部分寫或者讀的操作,那么,這個過程對于使用糾刪碼的環(huán)境下,將會大大的降低系統(tǒng)的性能,因此,需要針對這樣的特性進行針對性的優(yōu)化才能滿足性能的需要。由此可見,糾刪碼方式對性能有一定影響,副本方式占用消耗更多的存儲容量。兩種方式各有利弊,在實際應用中應根據(jù)業(yè)務系統(tǒng)特點進行合理規(guī)劃,以適應不同業(yè)務場景需求。
存儲池安全級別
針對小規(guī)模分布式存儲系統(tǒng)來說,使用基本的數(shù)據(jù)保護方式即可達到相應的數(shù)據(jù)安全級別。但對于大規(guī)模分布式存儲環(huán)境,就不僅僅要考慮數(shù)據(jù)安全級別,更要考慮整個存儲池的安全級別,以便降低在大規(guī)模部署時丟失數(shù)據(jù)的風險。比如,5臺存儲節(jié)點使用副本3的話,這樣的安全級別是足以讓人心感到安全的,但如果是50個甚至500個存儲節(jié)點的話,使用副本3的策略,就不會讓人感到放心。通常,這個時候就要考慮犧牲容量來增加數(shù)據(jù)安全了。如何用最少的存儲容量消耗最大化保障數(shù)據(jù)安全,以提高整個集群的利用率呢?故障域是一種分區(qū)策略,將一個大集群分成若干個子域,每個子域都提供相同的數(shù)據(jù)保護方式。這樣一來,相當于把雞蛋放在多個籃子里,就可以達到我們希望的最理想的狀態(tài)了。
柏科數(shù)據(jù)
產(chǎn)品解決方案
PRODUCT SOLUTIONS
最近案例
CASE STUDY