混合存儲(chǔ)是否正在走向滅亡?混合存儲(chǔ)的HDD硬盤是否確實(shí)是一款垂死的產(chǎn)品品種?業(yè)界又將如何審視和面臨今天的閃存數(shù)據(jù)存儲(chǔ)所帶來的存儲(chǔ)簡(jiǎn)化這一挑戰(zhàn)呢?此外,對(duì)象級(jí)存儲(chǔ)越來越多地日漸普及的深層原因又是什么呢?
混合存儲(chǔ)陣列走向滅亡的謠言可能不只是炒作
鑒于全閃存陣列市場(chǎng)在當(dāng)前的高速增長(zhǎng),以及某些AFA(全閃存陣列)供應(yīng)廠商對(duì)于其首次公開募股(IPO)的高調(diào)炒作,直接導(dǎo)致了 混合存儲(chǔ)是否正在走向滅亡 的這一問題的提出;也使得企業(yè)的IT存儲(chǔ)管理員們也在努力試圖捋清這一切。這個(gè)問題看似簡(jiǎn)單;然而,答案絕對(duì)是否定的!
讓我們從這一定義開始探討吧:究竟什么是混合存儲(chǔ)?目前,對(duì)于一個(gè)混合存儲(chǔ)陣列(也被稱為混合閃存陣列)的傳統(tǒng)定義是 作為一款存儲(chǔ)數(shù)據(jù)管理系統(tǒng),其使用Flash閃存的組合,如固態(tài)驅(qū)動(dòng)器(SSD)和較慢的硬盤驅(qū)動(dòng)器(HDD)來控制操作內(nèi)存,進(jìn)而提供最符合成本效益的高性能I/O?;旌洗鎯?chǔ)嘗試通過I/O性能需求來平衡存儲(chǔ)介質(zhì)的成本。Flash閃存可以設(shè)置作為一個(gè)讀緩存、讀寫緩存或者作為一個(gè)高性能存儲(chǔ)層,基于諸如數(shù)據(jù)的年齡、訪問頻率或數(shù)據(jù)的重要性等策略,以捕獲所有的寫操作和數(shù)據(jù)移動(dòng)到硬盤驅(qū)動(dòng)器的操作。
Flash SSD固態(tài)驅(qū)動(dòng)器容量能力的快速增長(zhǎng),以及每TB存儲(chǔ)成本定價(jià)的同步快速下跌正為HDD硬盤能否繼續(xù)作為一種可行的存儲(chǔ)介質(zhì)帶來了巨大的市場(chǎng)壓力。高容量的Flash SSD固態(tài)驅(qū)動(dòng)器和高容量的HDD硬盤之間的價(jià)格差距正在縮小。并且,由于Flash NAND 3D技術(shù)的顯著進(jìn)步,使得這一價(jià)格差距縮小的速度比從前預(yù)期的要快得多的多。
最高容量的2.5英寸小尺寸規(guī)格(SFF)的Flash SSD固態(tài)驅(qū)動(dòng)器是在2015年正式上市推出的,約為4 TB。而在2016年年初,小尺寸規(guī)格Flash SSD固態(tài)驅(qū)動(dòng)器的容量約為16 TB,并將在今年年底迅速達(dá)到約32 TB。相比之下,3.5英寸的大型封裝HDD硬盤的容量則在2015年和2016年突破了10 TB。
混合存儲(chǔ)陣列的核心問題
關(guān)于大容量的Flash SSD固態(tài)驅(qū)動(dòng)器有一個(gè)陷阱。許多高容量的Flash SSD將基于三級(jí)單元(Triple Level Cell,TLC)NAND技術(shù)。 今天,TLC是最為明確的成本最低的Flash技術(shù),但其有一些顯著的問題,例如其相對(duì)較短的磨損壽命期限。要知道,F(xiàn)lash SSD讀取對(duì)于存儲(chǔ)驅(qū)動(dòng)器的壽命而言幾乎沒有成本,反而是寫操作會(huì)有成本。每次執(zhí)行寫操作,都會(huì)對(duì)存儲(chǔ)材料或多或少的造成一定程度的損耗。磨損壽命期限是編程/擦除(PE)的周期數(shù);而較之多層單元閃存(multi-level cell,MLC),TLC至少具有一個(gè)數(shù)量級(jí)的較低數(shù)目的PE周期數(shù)。
TLC的寫入和讀取速度也比MLC相對(duì)要慢一些,但他們較之HDD仍然至少有10倍的性能優(yōu)勢(shì)。這意味著基于TLC 3D NAND的小尺寸規(guī)格SSD固態(tài)硬盤更適合讀取,而非通常與Flash SSD閃存相關(guān)的高強(qiáng)度寫操作。對(duì)于這種低成本、高容量、高密度,較慢的Flash SSD閃存而言,目前最適合的工作負(fù)載與當(dāng)前正被用在一個(gè)混合存儲(chǔ)陣列的HDD硬盤是一樣的。
混合存儲(chǔ)陣列正在從一個(gè)內(nèi)存、閃存SSD和高容量HDD的組合演變?yōu)橐粋€(gè)內(nèi)存的混合;高性能、寫入優(yōu)化的閃存SSD;大容量、讀取優(yōu)化的閃存SSD固態(tài)硬盤。而思考未來的混合存儲(chǔ)的另一種方式是將其視為一個(gè)多層次的全閃存陣列。混合存儲(chǔ)背后的原則和邏輯是相同的 并非所有的數(shù)據(jù)都具有相同的價(jià)值,并且這些數(shù)據(jù)的價(jià)值應(yīng)與其所存儲(chǔ)的存儲(chǔ)介質(zhì)的成本相匹配。
因此,盡管HDD硬盤混合存儲(chǔ)是一個(gè)垂死的產(chǎn)品品種,但我們可以期待混合多閃存仍然還會(huì)有較長(zhǎng)的壽命。
簡(jiǎn)化數(shù)據(jù)存儲(chǔ)技術(shù)是很難的
我曾經(jīng)想當(dāng)然的認(rèn)為,數(shù)據(jù)存儲(chǔ)是一項(xiàng)簡(jiǎn)單的技術(shù),具有相當(dāng)合乎邏輯的替代品。然而,事實(shí)證明,我當(dāng)時(shí)只是: 圖樣圖森破! 當(dāng)我了解到當(dāng)前數(shù)據(jù)存儲(chǔ)的現(xiàn)狀之后,我懷疑自己為何曾經(jīng)一直那樣天真。這該死的東西真的是越來越復(fù)雜了。
我曾經(jīng)寫過關(guān)于在剛剛過去的幾年中數(shù)據(jù)存儲(chǔ)領(lǐng)域的可選方案如何獲得了急劇性的增長(zhǎng)的文章,使得現(xiàn)如今有了比以往任何時(shí)候都更多的存儲(chǔ)選擇,來幫助您解決數(shù)據(jù)存儲(chǔ)問題。各種不同的數(shù)據(jù)存儲(chǔ)技術(shù)運(yùn)行在從傳統(tǒng)媒介到陣列設(shè)計(jì)、再到以軟件為中心的方法,以及再到全新的架構(gòu)。不久前的一段時(shí)間,我第一次撰寫了關(guān)于這一新的數(shù)據(jù)存儲(chǔ)現(xiàn)狀的文章,但其只是變得越來越復(fù)雜了 這無疑進(jìn)一步突顯了數(shù)據(jù)存儲(chǔ)的發(fā)展演變過程中既有好消息,也有壞消息。
有選擇當(dāng)然是不錯(cuò)的。因此這是一個(gè)好消息。但是,選擇太多也可能會(huì)讓人感覺撲朔迷離。這可以說是壞消息 至少部分而言是壞消息。許多新的數(shù)據(jù)存儲(chǔ)技術(shù),一旦他們?cè)跀?shù)據(jù)中心實(shí)踐操作層面完全部署開始采用,可能會(huì)對(duì)其它部分的存儲(chǔ)基礎(chǔ)設(shè)施產(chǎn)生反射的效果。這是一種類似于打鼴鼠游戲的效果:當(dāng)舊的問題被消除后,又會(huì)導(dǎo)致新的瓶頸問題的彈出。
存儲(chǔ)市場(chǎng)的變化
退后一步,看起來似乎數(shù)據(jù)存儲(chǔ)行業(yè)仍在努力適應(yīng)新的 解決方案 。根據(jù)IDC的最近報(bào)道,全球企業(yè)級(jí)存儲(chǔ)系統(tǒng)的銷售與去年同期相比下降了7%(僅僅只有82億美元)。通過對(duì)全球總出貨量的考察測(cè)得,該行業(yè)遭遇了4%的低迷下滑。在所有的存儲(chǔ)巨頭中,只有惠普企業(yè)公司在2016年第一季度獲得營(yíng)收增長(zhǎng)(11%)。
而與此同時(shí),鑒于大數(shù)據(jù)和物聯(lián)網(wǎng)已經(jīng)開始主宰了人們的IT交流話題,似乎企業(yè)組織實(shí)際上正在購(gòu)買更少的存儲(chǔ)是不可思議的。但事實(shí)的確如此。我們可以回顧所有這些新的數(shù)據(jù)存儲(chǔ)技術(shù),來看看為什么會(huì)發(fā)生這樣的事情。當(dāng)前的企業(yè)組織機(jī)構(gòu)固然可能比以往任何時(shí)候所存儲(chǔ)的數(shù)據(jù)都多 盡管容量圖的曲線從來沒有向下彎曲,但企業(yè)組織在這方面所做的工作更好了,而且也更有效率了。
閃存和超融合存儲(chǔ)所帶來的影響
例如,全閃存陣列(AFA)通常被認(rèn)為是一個(gè)純粹的性能發(fā)揮。因?yàn)槠鋰@著旋轉(zhuǎn)磁盤運(yùn)行。但是,當(dāng)一家企業(yè)通過將其從一個(gè)基于磁盤的陣列遷移到全閃存系統(tǒng),以提升一款關(guān)鍵應(yīng)用程序的性能時(shí),可能也會(huì)帶來一個(gè)安裝容量能力的下降。Short-stroked傳統(tǒng)硬盤擠出了最后的性能,老硬盤陣列的容量很可能過度配置了。而新的AFA則提供了良好的性能,同時(shí)無需過度配置。事實(shí)上,因?yàn)槠渖踔聊艹槌鰩讉€(gè)周期來對(duì)其數(shù)據(jù)執(zhí)行重復(fù)數(shù)據(jù)刪除,則使得閃存陣列所需要的容量可能要少得多。
同樣,我們也可以看到諸如超融合基礎(chǔ)架構(gòu)這樣的新架構(gòu)是如何基于其模塊化和易于規(guī)模化的特點(diǎn)而帶來更高效的存儲(chǔ)空間利用的?;诜?wù)器存儲(chǔ)的、內(nèi)置的PCIe和非易失性存儲(chǔ)器標(biāo)準(zhǔn)(Non-Volatile Memory Express)閃存的重生,也有助于通過集中于容量和性能,特別是在其需要方面,來降低容量需求。
最近,Evaluator Group公司與存儲(chǔ)網(wǎng)絡(luò)行業(yè)協(xié)會(huì)合作,共同發(fā)布了一項(xiàng)關(guān)于超融合技術(shù)的調(diào)查結(jié)果。該調(diào)查報(bào)告指出,在所有的調(diào)查受訪者中, 47%的受訪者表示說,他們所在的企業(yè)正在計(jì)劃使用一種超融合的解決方案,以整合基礎(chǔ)設(shè)施,并取代傳統(tǒng)的計(jì)算和存儲(chǔ)。
您企業(yè)的數(shù)據(jù)已經(jīng)不會(huì)再老位置了
當(dāng)然,有些數(shù)據(jù)根本就不再企業(yè)內(nèi)部存儲(chǔ)了。雖然這一數(shù)字有時(shí)似乎言過其實(shí),但很明顯的是,當(dāng)前的企業(yè)組織機(jī)構(gòu)已經(jīng)開始更頻繁,更深入地采用云存儲(chǔ),進(jìn)而得以能夠?qū)⑺麄冏约旱臄?shù)據(jù)中心存儲(chǔ)從單調(diào)乏味的日常數(shù)據(jù)處理瑣事如存儲(chǔ)存檔中解放出來。這大大幫助減少了企業(yè)組織數(shù)據(jù)中心存儲(chǔ)的開銷,而隨著人們對(duì)于云存儲(chǔ)的信心逐步增長(zhǎng),這方面的削減很可能會(huì)更令人震驚。
使用SaaS和基于云的應(yīng)用程序,如Salesforce和無數(shù)其他類似服務(wù)的增加,也有助于將遷移的數(shù)據(jù)遷出數(shù)據(jù)中心存儲(chǔ)系統(tǒng)。如果您企業(yè)不是通過將數(shù)據(jù)復(fù)制到數(shù)據(jù)中心來備份這些應(yīng)用程序的話,您企業(yè)將創(chuàng)造大量根本不需要任何內(nèi)部存儲(chǔ)的新數(shù)據(jù)。
這些只是少數(shù)幾個(gè)新的數(shù)據(jù)存儲(chǔ)技術(shù)已經(jīng)接管替代了傳統(tǒng)的存儲(chǔ)產(chǎn)品的例子。您企業(yè)還可以添加軟件定義的存儲(chǔ)、對(duì)象、融合等等新的技術(shù)到這一不斷增長(zhǎng)的名單。
有時(shí),簡(jiǎn)單即復(fù)雜
具有諷刺意味的??是,盡管很多新的數(shù)據(jù)存儲(chǔ)技術(shù)和架構(gòu)可能在部署、使用和管理方面更為簡(jiǎn)單和容易,但它們可能會(huì)在無意中增加了整體存儲(chǔ)的復(fù)雜性。而且因?yàn)楹芏噍^新的替代品的設(shè)計(jì)旨在解決具體問題或工作負(fù)荷,很可能最終會(huì)導(dǎo)致您企業(yè)孤立應(yīng)用程序和數(shù)據(jù)的增加,因?yàn)槟髽I(yè)需要部署更多的專用系統(tǒng)。
備份也需要一定的反思,特別是如果您所在的企業(yè)堅(jiān)持執(zhí)著于 經(jīng)典的 應(yīng)用程序備份方式的話。借助這一新的多樣的存儲(chǔ)系統(tǒng)和架構(gòu),備份數(shù)據(jù)可能會(huì)有很大的困難,這可能會(huì)有助于說服您企業(yè)開始考慮使用新的數(shù)據(jù)保護(hù)技術(shù)和工具,如flat備份,云到云的備份和擦除編碼。
對(duì)象級(jí)別存儲(chǔ)的采用獲得迅速普及的九大原因分析
現(xiàn)如今,對(duì)象級(jí)存儲(chǔ)比以往任何時(shí)候都獲得了更為普及的采用。從遵守合規(guī)性要求到可擴(kuò)展性問題和預(yù)算限制,對(duì)象存儲(chǔ)已被充分證明是對(duì)傳統(tǒng)的文件存儲(chǔ)的一種有效的替代方案。如下,有九大原因解釋了為什么當(dāng)前有越來越多的企業(yè)組織正在轉(zhuǎn)向采用對(duì)象存儲(chǔ)技術(shù)。
原因1:非結(jié)構(gòu)化數(shù)據(jù)的增長(zhǎng)
根據(jù)IDC的調(diào)研數(shù)據(jù)顯示,非結(jié)構(gòu)化數(shù)據(jù)的復(fù)合年均增長(zhǎng)率約為62%。面向?qū)ο蟠鎯?chǔ)的細(xì)粒度的方法,使其成為了一種有價(jià)值的資源,用于處理大量的非結(jié)構(gòu)化的數(shù)據(jù)。
原因2:可擴(kuò)展性
對(duì)象存儲(chǔ)可以規(guī)?;瘮U(kuò)展到幾十乃至幾百艾字節(jié)的可用容量,而且對(duì)于為什么對(duì)象級(jí)存儲(chǔ)不能規(guī)?;綕勺止?jié),甚至堯字節(jié)并不存在什么技術(shù)方面的原因。其利用了最高密度的存儲(chǔ),無論是硬盤驅(qū)動(dòng)器,固態(tài)驅(qū)動(dòng)器或兩者兼而有之。
原因3:無需遷移數(shù)據(jù)
基于對(duì)象的存儲(chǔ)是一個(gè)無共享的向外擴(kuò)展的系統(tǒng),所以其不需要傳統(tǒng)意義上的技術(shù)更新。當(dāng)硬件需要更新時(shí),其只是涉及到需要添加新的對(duì)象存儲(chǔ)節(jié)點(diǎn)到通常與標(biāo)準(zhǔn)以太網(wǎng)網(wǎng)絡(luò)連接的系統(tǒng)中。隨之需要的是從系統(tǒng)上刪除舊的節(jié)點(diǎn),一次刪除一個(gè)。無需遷移數(shù)據(jù)。除了自愈算法,擦除編碼或多拷貝鏡像,在新的節(jié)點(diǎn)上再次創(chuàng)建所需的數(shù)據(jù)。隨著容量的增加,數(shù)據(jù)跨所有的對(duì)象存儲(chǔ)節(jié)點(diǎn)自動(dòng)被調(diào)整。
原因4:與Hadoop和NoSQL的兼容性
對(duì)于Hadoop或NoSQL,對(duì)象級(jí)的存儲(chǔ)往往是一個(gè)很好的存儲(chǔ)選項(xiàng)。取決于供應(yīng)商的不同,某些供應(yīng)商,如Caringo和Cloudian公司,甚至在其對(duì)象存儲(chǔ)產(chǎn)品本身內(nèi)置了分析功能。
原因5:取代了傳統(tǒng)的文件存儲(chǔ)
對(duì)象存儲(chǔ)獲得迅速普及的另一個(gè)原因是,其被認(rèn)為是下一代的文件存儲(chǔ)。今天市面上的大多數(shù)對(duì)象存儲(chǔ)系統(tǒng)包括NFS、SMB和內(nèi)置到系統(tǒng)中的iSCSI接口。地理分布功能和分析功能使對(duì)象存儲(chǔ)作為文件存儲(chǔ)是非常有用和有價(jià)值的。
原因6:比磁帶效率更高,但成本仍然較低
較之磁帶,對(duì)象存儲(chǔ)是最具成本效益的數(shù)據(jù)存儲(chǔ)方式。不過,盡管磁帶對(duì)于大多數(shù)分析、活動(dòng)歸檔或從備份中快速恢復(fù)而言太慢了,對(duì)象存儲(chǔ)則速度太快了。不像磁帶,對(duì)象存儲(chǔ)也非常擅長(zhǎng)于在地理上分散的人員之間,及使用Hadoop基礎(chǔ)設(shè)施工作的人員之間共享非結(jié)構(gòu)化數(shù)據(jù),并能夠非常好的保持所有數(shù)據(jù)超過30年。磁帶和對(duì)象存儲(chǔ)都可以實(shí)現(xiàn)一次寫入,多次讀取技術(shù),但只有對(duì)象存儲(chǔ)可以限制對(duì)某對(duì)象或文件的訪問。
原因7:即時(shí)一致性的改進(jìn)
對(duì)象級(jí)存儲(chǔ)的一個(gè)缺點(diǎn)是,其是最終一致的。由于數(shù)據(jù)同時(shí)在兩個(gè)不同的節(jié)點(diǎn)或地理位置被更新,這可能會(huì)導(dǎo)致錯(cuò)誤。然而,幾家對(duì)象存儲(chǔ)提供商,例如Caringo、Cloudian、HGST和三星旗下的Joyent公司,現(xiàn)在均借助對(duì)象存儲(chǔ)技術(shù)提供即時(shí)一致性。
原因8:更快的閃存SSD性能
對(duì)象存儲(chǔ)也容易受到高延遲和較慢的響應(yīng)時(shí)間的影響。更快的戰(zhàn)略實(shí)施,相對(duì)較低的成本,密集的大容量閃存SSD硬盤基于多層存儲(chǔ)單元和3D TLC(Triple-Level Cell)已經(jīng)消除了這一弱點(diǎn)。
原因9:標(biāo)準(zhǔn)化
也許對(duì)象級(jí)存儲(chǔ)的采用迅速被普及的最為突出的原因是亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)和亞馬遜簡(jiǎn)單存儲(chǔ)服務(wù)(S3)的興起。 Amazon S3是AWS的對(duì)象存儲(chǔ),而該S3應(yīng)用程序編程接口已經(jīng)成為事實(shí)上的標(biāo)準(zhǔn)對(duì)象存儲(chǔ)API。所有的對(duì)象存儲(chǔ)供應(yīng)商 即使是OpenStack Swift和Ceph這樣的開源項(xiàng)目甚至也進(jìn)行了變化 都在一定程度上采用了S3 API,以便使自己能夠與那些已經(jīng)在使用它的應(yīng)用程序兼容。這帶來了大批新的為實(shí)現(xiàn)與AWS S3兼容的私有對(duì)象存儲(chǔ)的應(yīng)用程序的編寫。