有些人認(rèn)為,計算和I/O密集型的大數(shù)據(jù)工作負(fù)載不會偏離到云計算中,而為了安全性而保留在數(shù)據(jù)中心現(xiàn)有基礎(chǔ)設(shè)施。
如今,似乎整個IT世界都可能遷移到云計算,但計算增長和I/O密集型的分析的許多新的大數(shù)據(jù)工作負(fù)載一直保持在企業(yè)的本地數(shù)據(jù)中心,而不是在云計算中,至少目前是這樣。
新的網(wǎng)絡(luò)工作負(fù)載都是圍繞著移動設(shè)備、云服務(wù)、社交技術(shù)和大數(shù)據(jù)建立的,即所謂的第三平臺。如IDC描述,可以迅速壓倒現(xiàn)有的數(shù)據(jù)中心基礎(chǔ)設(shè)施。這些工作負(fù)載具有不可預(yù)知的規(guī)模,分散的部件,并能產(chǎn)生、處理和儲存大量的敏感數(shù)據(jù)。與此同時,公共云的成熟和成本尚未完全滿足這些新的工作負(fù)載類型,尤其是大數(shù)據(jù)分析的實驗組織的需求。
最近的服務(wù)器市場上的數(shù)字反映了這些動態(tài)。近年來,全球服務(wù)器市場持續(xù)增長,IDC報告稱,2015年IBM公司的高端服務(wù)器業(yè)務(wù)有所下降(第四季度下降了17.2%)??傮w而言,2015年服務(wù)器收入增長2.3%,達(dá)到了509億美元,與2014年相比,單位出貨量同比增加了2.9%,達(dá)到了920萬臺。
在成交量方面,通過超大規(guī)模的IT企業(yè)和電信運營商的投資,以支持新的工作負(fù)載的投資增長了4.9%,2015年第四季度達(dá)到了108億美元。同時,2015年第四季度,企業(yè)在第三方平臺的工作負(fù)載的新的可擴展系統(tǒng)的投資增長了21.1%,中端服務(wù)器市場增長達(dá)到了14億美元。
這么多的分析工作負(fù)載仍然都在本地運行是毫不奇怪的,企業(yè)都在兜售這些第三方平臺的應(yīng)用程序,甚至是一些完全支持云計算的應(yīng)用。
以一家基于ApacheHadoop軟件的數(shù)據(jù)管理廠商Cloudera公司為例。 當(dāng)我們建立應(yīng)用時,我們認(rèn)為主要的部署模式將是云計算。 Cloudera公司產(chǎn)品副總裁查爾斯 澤德萬斯科說, 我們很快就明白了這個概念。 他指出,如今90%以上的企業(yè)都部署在本地運行。
為什么Cloudera公司沒有放棄云計算?首先,一個云部署模型的分析立即消除了許多客戶不需要移動到云計算的想法,或可能出于安全原因。
澤德萬斯科說, 人們看到那些擁有大量的數(shù)據(jù)的組織,如聯(lián)邦政府,金融服務(wù)行業(yè),電信運營商等都在他們的數(shù)據(jù)中心進(jìn)行了大量投資,因此不需要這種外包的能力。
同時,這些用戶會考慮采用數(shù)據(jù)中心托管服務(wù),很多人預(yù)計Cloudera公司不僅僅主要經(jīng)營Hadoop。 他們希望我們幫助托管他們的數(shù)據(jù)中心,我們有很多的任命蠕變。 他說。
利用亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)并不是一個真正的選項。公共云服務(wù)處于起步階段,只有有限的實例類型,很少有企業(yè)客戶實施。因此,Cloudera公司建立和維護(hù)自己的數(shù)據(jù)中心這是一個昂貴的命題。
但此后發(fā)生了很多改變, 澤德萬斯科說?,F(xiàn)在Cloudera公司可以為大量的基礎(chǔ)設(shè)施即服務(wù)提供商托管數(shù)據(jù)中心。無論AWS和WindowsAzure支持強大的實例類型,并對數(shù)據(jù)處理的工作量要求苛刻的。也有更多的數(shù)據(jù)和應(yīng)用在云計算進(jìn)行分析。
沒有正確的方法托管工作負(fù)載
企業(yè)戰(zhàn)略集團(tuán)的高級分析師尼克 羅達(dá)說,盡管云計算具有靈活性,企業(yè)正在考慮為他們的大數(shù)據(jù)分析工作負(fù)載主要采和本地基礎(chǔ)設(shè)施。
在一項調(diào)查中,ESG發(fā)現(xiàn)當(dāng)涉及到新的大數(shù)據(jù)基礎(chǔ)設(shè)施時,18%的受訪者表示,他們正計劃使用專用的(非虛擬化)服務(wù)器來分析工作負(fù)載;30%的受訪者正在尋找傳統(tǒng)的虛擬化基礎(chǔ)設(shè)施;而21%的受訪者正在考慮采用Oracle和Teradatata公司的專門的分析設(shè)備。只有21%的受訪者正在考慮公共云,而另外10%正的受訪者在考慮公共云/私有云的混合部署。 還有各種各樣的部署選項在那里,人們?nèi)栽趪L試。 羅達(dá)說。
通常情況下,圍繞大數(shù)據(jù)服務(wù)器的決定最終是基于超出工作負(fù)荷需要的其他東西。有時候人們所思考的是,我們一直都是這么做的,于是人們堅持他們的意見或認(rèn)為的最佳實踐。 羅達(dá)說, 也就是說,分析應(yīng)用程序比其他工作負(fù)載有不同的要求,這有很多的改變,也有一些人說,他們現(xiàn)有的基礎(chǔ)設(shè)施是完全符合他們的新的需求。
他說,任何新的基礎(chǔ)設(shè)施應(yīng)該評估其能力可以支持大數(shù)據(jù)的屬性,例如:
可擴展性。
獨立于位置適當(dāng)?shù)男阅堋?/p>
成本效益。假設(shè)公共云總是更便宜的,這并不一定適用于分析工作負(fù)載。
進(jìn)入數(shù)據(jù)生活
對于大數(shù)據(jù)工作負(fù)載,最重要的是在這里被處理生活中的數(shù)據(jù)。 如果你的社交平臺是基于云計算的,那么它對你的基于云計算的分析平臺是意義的。 羅達(dá)說。如果數(shù)據(jù)在內(nèi)部已經(jīng)存在,在數(shù)據(jù)中心服務(wù)器上處理它,以盡量減少網(wǎng)絡(luò)費用。這也加快了訪問時間和分析過程。
提供了很好的數(shù)據(jù)存取時間尤為重要,因為在使用分析數(shù)據(jù)庫的員工大幅增加,羅達(dá)說。只有少數(shù)人,如商業(yè)分析師,數(shù)據(jù)科學(xué)家,以及一些高管需要這些數(shù)據(jù)庫,目前在一些組織高達(dá)40%的員工依賴于這些數(shù)據(jù)。例如卡車司機可以查看運輸?shù)膬?yōu)化路徑,或銷售代表查看更新庫存和定價等。
事實上,數(shù)據(jù)的位置是許多分析供應(yīng)商的指南針。 無論你在哪里創(chuàng)建的數(shù)據(jù),數(shù)據(jù)就會保留在那里,因為移動這些數(shù)據(jù)是很困難的。 澤德萬斯科說。
從傳統(tǒng)倉儲企業(yè)到服務(wù)提供商這些不同行業(yè)廠商,希望吸引企業(yè)處理其大數(shù)據(jù)工作負(fù)載。
編輯:Harris