云計(jì)算的“橫空出世”讓很多人將其視為一項(xiàng)全新的技術(shù),但事實(shí)上它的雛形已出現(xiàn)多年,只是最近幾年才開始取得相對(duì)較快的發(fā)展。
云計(jì)算的 橫空出世 讓很多人將其視為一項(xiàng)全新的技術(shù),但事實(shí)上它的雛形已出現(xiàn)多年,只是最近幾年才開始取得相對(duì)較快的發(fā)展。確切地說,云計(jì)算是大規(guī)模分布式計(jì)算技術(shù)及其配套商業(yè)模式演進(jìn)的產(chǎn)物,它的發(fā)展主要有賴于虛擬化、分布式數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、編程模式、信息安全等各項(xiàng)技術(shù)、產(chǎn)品的共同發(fā)展。近些年來,托管、后向收費(fèi)、按需交付等商業(yè)模式的演進(jìn)也加速了云計(jì)算市場的轉(zhuǎn)折。云計(jì)算不僅改變了信息提供的方式,也顛覆了傳統(tǒng)ICT系統(tǒng)的交付模式。與其說云計(jì)算是技術(shù)的創(chuàng)新,不如說云計(jì)算是思維和商業(yè)模式的轉(zhuǎn)變。
下面詳細(xì)談一談云計(jì)算的核心技術(shù)。
云計(jì)算是一種以數(shù)據(jù)和處理能力為中心的密集型計(jì)算模式,它融合了多項(xiàng)ICT技術(shù),是傳統(tǒng)技術(shù) 平滑演進(jìn) 的產(chǎn)物。其中以虛擬化技術(shù)、分布式數(shù)據(jù)存儲(chǔ)技術(shù)、編程模型、大規(guī)模數(shù)據(jù)管理技術(shù)、分布式資源管理、信息安全、云計(jì)算平臺(tái)管理技術(shù)、綠色節(jié)能技術(shù)最為關(guān)鍵。
1、虛擬化技術(shù)
虛擬化是云計(jì)算最重要的核心技術(shù)之一,它為云計(jì)算服務(wù)提供基礎(chǔ)架構(gòu)層面的支撐,是ICT服務(wù)快速走向云計(jì)算的最主要驅(qū)動(dòng)力??梢哉f,沒有虛擬化技術(shù)也就沒有云計(jì)算服務(wù)的落地與成功。隨著云計(jì)算應(yīng)用的持續(xù)升溫,業(yè)內(nèi)對(duì)虛擬化技術(shù)的重視也提到了一個(gè)新的高度。與此同時(shí),我們的調(diào)查發(fā)現(xiàn),很多人對(duì)云計(jì)算和虛擬化的認(rèn)識(shí)都存在誤區(qū),認(rèn)為云計(jì)算就是虛擬化。事實(shí)上并非如此,虛擬化是云計(jì)算的重要組成部分但不是全部。
從技術(shù)上講,虛擬化是一種在軟件中仿真計(jì)算機(jī)硬件,以虛擬資源為用戶提供服務(wù)的計(jì)算形式。旨在合理調(diào)配計(jì)算機(jī)資源,使其更高效地提供服務(wù)。它把應(yīng)用系統(tǒng)各硬件間的物理劃分打破,從而實(shí)現(xiàn)架構(gòu)的動(dòng)態(tài)化,實(shí)現(xiàn)物理資源的集中管理和使用。虛擬化的最大好處是增強(qiáng)系統(tǒng)的彈性和靈活性,降低成本、改進(jìn)服務(wù)、提高資源利用效率。
從表現(xiàn)形式上看,虛擬化又分兩種應(yīng)用模式。一是將一臺(tái)性能強(qiáng)大的服務(wù)器虛擬成多個(gè)獨(dú)立的小服務(wù)器,服務(wù)不同的用戶。二是將多個(gè)服務(wù)器虛擬成一個(gè)強(qiáng)大的服務(wù)器,完成特定的功能。這兩種模式的核心都是統(tǒng)一管理,動(dòng)態(tài)分配資源,提高資源利用率。在云計(jì)算中,這兩種模式都有比較多的應(yīng)用。
2、分布式數(shù)據(jù)存儲(chǔ)技術(shù)
云計(jì)算的另一大優(yōu)勢就是能夠快速、高效地處理海量數(shù)據(jù)。在數(shù)據(jù)爆炸的今天,這一點(diǎn)至關(guān)重要。為了保證數(shù)據(jù)的高可靠性,云計(jì)算通常會(huì)采用分布式存儲(chǔ)技術(shù),將數(shù)據(jù)存儲(chǔ)在不同的物理設(shè)備中。這種模式不僅擺脫了硬件設(shè)備的限制,同時(shí)擴(kuò)展性更好,能夠快速響應(yīng)用戶需求的變化。
分布式存儲(chǔ)與傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)并不完全一樣,傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用集中的存儲(chǔ)服務(wù)器存放所有數(shù)據(jù),存儲(chǔ)服務(wù)器成為系統(tǒng)性能的瓶頸,不能滿足大規(guī)模存儲(chǔ)應(yīng)用的需要。分布式網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺(tái)存儲(chǔ)服務(wù)器分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。
在當(dāng)前的云計(jì)算領(lǐng)域,Google的GFS和Hadoop開發(fā)的開源系統(tǒng)HDFS是比較流行的兩種云計(jì)算分布式存儲(chǔ)系統(tǒng)。
GFS(Google File System)技術(shù):谷歌的非開源的GFS(GoogleFile System) 云計(jì)算平臺(tái)滿足大量用戶的需求,并行地為大量用戶提供服務(wù)。使得云計(jì)算的數(shù)據(jù)存儲(chǔ)技術(shù)具有了高吞吐率和高傳輸率的特點(diǎn)。
HDFS(Hadoop Distributed File System)技術(shù):大部分ICT廠商,包括Yahoo、Intel的 云 計(jì)劃采用的都是HDFS的數(shù)據(jù)存儲(chǔ)技術(shù)。未來的發(fā)展將集中在超大規(guī)模的數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)加密和安全性保證、以及繼續(xù)提高I/O速率等方面。
3、編程模式
從本質(zhì)上講,云計(jì)算是一個(gè)多用戶、多任務(wù)、支持并發(fā)處理的系統(tǒng)。高效、簡捷、快速是其核心理念,它旨在通過網(wǎng)絡(luò)把強(qiáng)大的服務(wù)器計(jì)算資源方便地分發(fā)到終端用戶手中,同時(shí)保證低成本和良好的用戶體驗(yàn)。在這個(gè)過程中,編程模式的選擇至關(guān)重要。云計(jì)算項(xiàng)目中分布式并行編程模式將被廣泛采用。
分布式并行編程模式創(chuàng)立的初衷是更高效地利用軟、硬件資源,讓用戶更快速、更簡單地使用應(yīng)用或服務(wù)。在分布式并行編程模式中,后臺(tái)復(fù)雜的任務(wù)處理和資源調(diào)度對(duì)于用戶來說是透明的,這樣用戶體驗(yàn)?zāi)軌虼蟠筇嵘?。MapReduce是當(dāng)前云計(jì)算主流并行編程模式之一。MapReduce模式將任務(wù)自動(dòng)分成多個(gè)子任務(wù),通過Map和Reduce兩步實(shí)現(xiàn)任務(wù)在大規(guī)模計(jì)算節(jié)點(diǎn)中的高度與分配。
MapReduce是Google開發(fā)的java、Python、C++編程模型,主要用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。MapReduce模式的思想是將要執(zhí)行的問題分解成Map(映射)和Reduce(化簡)的方式,先通過Map程序?qū)?shù)據(jù)切割成不相關(guān)的區(qū)塊,分配(調(diào)度)給大量計(jì)算機(jī)處理,達(dá)到分布式運(yùn)算的效果,再通過Reduce程序?qū)⒔Y(jié)果匯整輸出。
4、大規(guī)模數(shù)據(jù)管理
處理海量數(shù)據(jù)是云計(jì)算的一大優(yōu)勢。那么如何處理則涉及到很多層面的東西,因此高效的數(shù)據(jù)處理技術(shù)也是云計(jì)算不可或缺的核心技術(shù)之一。對(duì)于云計(jì)算來說,數(shù)據(jù)管理面臨巨大的挑戰(zhàn)。云計(jì)算不僅要保證數(shù)據(jù)的存儲(chǔ)和訪問,還要能夠?qū)A繑?shù)據(jù)進(jìn)行特定的檢索和分析。由于云計(jì)算需要對(duì)海量的分布式數(shù)據(jù)進(jìn)行處理、分析,因此,數(shù)據(jù)管理技術(shù)必需能夠高效的管理大量的數(shù)據(jù)。
Google的BT(BigTable)數(shù)據(jù)管理技術(shù)和Hadoop團(tuán)隊(duì)開發(fā)的開源數(shù)據(jù)管理模塊HBase是業(yè)界比較典型的大規(guī)模數(shù)據(jù)管理技術(shù)。
BT(BigTable)數(shù)據(jù)管理技術(shù):BigTable是非關(guān)系的數(shù)據(jù)庫,是一個(gè)分布式的、持久化存儲(chǔ)的多維度排序Map.BigTable建立在 GFS, Scheduler, Lock Service和MapReduce之上,與傳統(tǒng)的關(guān)系數(shù)據(jù)庫不同,它把所有數(shù)據(jù)都作為對(duì)象來處理,形成一個(gè)巨大的表格,用來分布存儲(chǔ)大規(guī)模結(jié)構(gòu)化數(shù)據(jù)。 Bigtable的設(shè)計(jì)目的是可靠的處理PB級(jí)別的數(shù)據(jù),并且能夠部署到上千臺(tái)機(jī)器上。
開源數(shù)據(jù)管理模塊HBase:HBase是Apache的Hadoop項(xiàng)目的子項(xiàng)目,定位于分布式、面向列的開源數(shù)據(jù)庫。HBase不同于一般的關(guān)系數(shù)據(jù)庫,它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫。另一個(gè)不同的是HBase基于列的而不是基于行的模式。作為高可靠性分布式存儲(chǔ)系統(tǒng),HBase在性能和可伸縮方面都有比較好的表現(xiàn)。利用HBase技術(shù)可在廉價(jià)PC Server上搭建起大規(guī)模結(jié)構(gòu)化存儲(chǔ)集群。
1 2 閱讀全文