黑客攻擊數(shù)據(jù)中心成真?烏克蘭遭受了嚴重的停電事故,這被認為是黑客的惡意攻擊所造成的。
黑客攻擊數(shù)據(jù)中心的風(fēng)險正在逐步提高,作為網(wǎng)絡(luò)化設(shè)備存儲、調(diào)控與管理中心,數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備受到攻擊的可能性很大。如果黑客利用遠程網(wǎng)絡(luò)進行攻擊數(shù)據(jù)中心,那么電網(wǎng)與其他基礎(chǔ)設(shè)施存在的風(fēng)險將變成現(xiàn)實,2015年底,這個警告已經(jīng)成真:烏克蘭遭受了嚴重的停電事故,這被認為是黑客的惡意攻擊所造成的。
如果這是真的,那么黑客中斷數(shù)據(jù)中心運營商的電力意味著什么?
改變了什么?
數(shù)據(jù)中心與電網(wǎng)的相互聯(lián)系發(fā)生了什么改變?2014年一個調(diào)查機構(gòu)對美國電網(wǎng)進行了研究,由此提出了關(guān)于現(xiàn)代化的電網(wǎng)數(shù)據(jù)采集與監(jiān)控(SCADA)系統(tǒng)幾個問題: 矛盾的是,隨著電網(wǎng)日益網(wǎng)絡(luò)化,在提高效率和整體態(tài)勢感知能力的同時,也越來越容易受到來自網(wǎng)絡(luò)空間的入侵和攻擊。
攻擊的到來
調(diào)查機構(gòu)對于關(guān)注電力脆弱性報告的發(fā)布正當其時,事實上,黑客成功地攻擊了烏克蘭能源供應(yīng)商prikarpatjeo blenergo公司的電力設(shè)施。
SANS研究所的工業(yè)控制系統(tǒng)(ICS)研究團隊試圖揭開這次網(wǎng)絡(luò)攻擊的前因后果。ICS隊研究了烏克蘭電網(wǎng)遭受網(wǎng)絡(luò)攻擊的惡意軟件潛在的樣本,并對烏克蘭電網(wǎng)的協(xié)同攻擊進行了確認,并公布了初步調(diào)查結(jié)果。
對于黑客攻擊,SANSICS研究團隊負責(zé)人,調(diào)查報告的第二作者米迦勒 杰 埃斯安特說: 攻擊者展示了其周密的規(guī)劃和協(xié)調(diào)性,并有效地使用惡意軟件,可能采用直接遠程訪問系統(tǒng)進行調(diào)度,引起電力基礎(chǔ)設(shè)施配電設(shè)施不良狀態(tài)的變化,并試圖通過SCADA服務(wù)器消除他們引起的中斷延遲的痕跡。
幸運的是,烏克蘭電力公司的工程師可以使用手動模式關(guān)閉惡意軟件感染的SCADA系統(tǒng),這讓電力工程師們在不到六個小時的時間內(nèi)恢復(fù)整個電網(wǎng)的供電。埃斯安特警告說,如今,電網(wǎng)系統(tǒng)更加依賴自動化設(shè)備,今后將有可能無法以類似的方式恢復(fù)他們的大部分系統(tǒng)。
數(shù)據(jù)中心發(fā)生了什么事?
對于數(shù)據(jù)中心來說,遭遇電網(wǎng)停電就是一個重大故障,不管是什么原因造成的。而惡意攻擊造成的電力中斷可能會持續(xù)下去,或者說是時間更長和。但保護的措施是相同的,就是部署冗余和后備電源。
有多種方式可以處理電源冗余。大部分的設(shè)計采用開關(guān)控制器進行控制,在使用備用發(fā)電機/電網(wǎng)的電力之間進行選擇,尤其是小型數(shù)據(jù)中心設(shè)施。控制器將電源饋送給UPS供電系統(tǒng),UPS供電系統(tǒng)再將電力提供給機房IT基礎(chǔ)設(shè)施。
如果電網(wǎng)斷電,開關(guān)控制器無法向UPS供電系統(tǒng)傳輸電力。但是,UPS通過蓄電池逆變的電力繼續(xù)為關(guān)鍵IT設(shè)備供電,但持續(xù)時間有限。此時,開關(guān)控制器有兩個選擇:一是繼續(xù)供電(一個指定的時間),繼續(xù)等待電網(wǎng)的電力恢復(fù)正常,如果電源中斷是暫時的話。
第二個選擇就是啟動備份發(fā)電機,這時UPS系統(tǒng)的電池沒有完全耗盡。當電源恢復(fù)時,操作過程與此相反。
保持燃料儲備
大多數(shù)數(shù)據(jù)中心運營商都會接受六個小時的停電的事實,類似于發(fā)生的烏克蘭電力中斷事件,這是一個偶然事件,而在此期間,即使備用發(fā)電機組在滿載情況下,數(shù)據(jù)中心運營商將會有足夠的時間添加足夠的燃料,以應(yīng)對更長時間的停電。此外,數(shù)據(jù)中心運營商一般會與燃油供應(yīng)商簽署合同,明確說明其數(shù)據(jù)中心將無限期運行,并對其提供燃料所需要的時間進行了規(guī)定。
詹姆斯 漢密爾頓了解數(shù)據(jù)中心基礎(chǔ)設(shè)施的供電方式,他重申燃料合同的重要性。數(shù)據(jù)中心運營商應(yīng)堅持獲得最高優(yōu)先級的供應(yīng)。漢密爾頓還強調(diào)燃料供應(yīng)商必須供應(yīng)足夠數(shù)量的燃油,而在停電期間提供更多的燃料來源,以及保障提供燃油的方法是重要的。
面臨其他挑戰(zhàn)
在不斷激烈競爭的市場中,數(shù)據(jù)中心運營商采用了一種稱為功率超額預(yù)定技術(shù),為計算設(shè)備提供超過功率總量的更多的電能。這允許電力基礎(chǔ)設(shè)施托管更多的服務(wù)器,而不需要升級。在大多數(shù)情況下,超額預(yù)定并不是所有的服務(wù)器在同一時間達到的最大功耗。
然而,計算設(shè)備的總功耗在某些時候超過可用容量,這是完全可能的。此外,由于數(shù)據(jù)中心運營商并沒有升級電力基礎(chǔ)設(shè)施。如果電網(wǎng)停電,并且數(shù)據(jù)中心設(shè)備功耗過大的話(通常是意外或黑客進行所謂的 攻擊 ),UPS和備用發(fā)電機系統(tǒng)容量較小,則是一個潛在的隱患。
維護和故障
漢密爾頓提出了另外一個建議,就是冗余系統(tǒng)在IT設(shè)備正常運行時很少使用,而數(shù)據(jù)中心電力系統(tǒng)無法處理更多的負荷時,也就是最需要冗余電源系統(tǒng)的時候,而這時冗余系統(tǒng)也有可能不會發(fā)揮其保障作用。
答案是顯而易見的,就是要對這些設(shè)備進行定期的維護。獨立的IT顧問和作家保羅 柯萬在一個專欄指出: 維護就是定期檢查備用電源系統(tǒng),并在制造商的建議下進行調(diào)度和試驗。維護的另一個重要方面就是進行基準測試。在維護期間執(zhí)行各種測試,這種測試的結(jié)果是最有意義的,而不是簡單地通過計算來判斷其是否合格。
操作失誤是漢密爾頓的關(guān)注的另一個問題。數(shù)據(jù)中心的工作人員在被迫應(yīng)對特殊的情況時,可能會面臨越來越大的壓力,或遇到不熟悉的情況,這二者都增加錯誤的可能性。雖然事情并不總是會發(fā)生,但必須對此高度關(guān)注。
規(guī)則和底線
隨著越來越多的企業(yè)將其數(shù)字業(yè)務(wù)轉(zhuǎn)移到云計算,數(shù)據(jù)中心越來越成為了許多居心叵測的人的新選擇。數(shù)據(jù)中心運營商要了解這一情況,并確保其設(shè)施可以應(yīng)用對所有已知的手段。
然而,居心不良的人并不會遵守規(guī)則。他們可以通過一項對數(shù)據(jù)中心的所謂 電力攻擊 ,就會讓運營商的過度配置不堪一擊。例如通過運行合法租用的服務(wù)器,使其達到最大功率,再讓采用數(shù)字化變電站供電的數(shù)據(jù)中心電力中斷。這是出乎人們意料之外的手段,但確實是行之有效的。