杰夫·克勞斯先生是美國英特爾公司數(shù)據(jù)中心管理器(DCM)解決方案總經(jīng)理。在英特爾公司,杰夫·克勞斯擁有13年以上的團(tuán)隊(duì)管理經(jīng)驗(yàn)。他的團(tuán)隊(duì)正在開拓能耗與熱量管理中間件產(chǎn)品。
文/?美國英特爾公司數(shù)據(jù)中心管理器(DCM)解決方案總經(jīng)理杰夫 克勞斯
2015年是全球有史以來最熱的一年,然而不幸的是,根據(jù)美國國家航空航天局(NASA)和美國國家海洋和大氣管理局(NOAA)氣候研究院預(yù)測,地球表面的平均溫度將在2016年再次創(chuàng)下新高。不僅如此,2016年夏天將成為有史以來最為酷熱的一個夏天。這標(biāo)志著全球平均氣溫將首次連續(xù)三年屢創(chuàng)新高!
夏天對大部分人來說是美好的,我們可以盡情享受各種愜意的戶外活動,比如高爾夫、網(wǎng)球、騎自行車遠(yuǎn)足、戶外燒烤,或曬曬日光浴讓自己擁有更為健康的膚色。但對于數(shù)據(jù)中心的管理人員而言,夏天的到來意味著溫度的急劇攀升和隨之而來的能耗增加。室外溫度的上升可輕易導(dǎo)致數(shù)據(jù)中心的室溫升高,從而迫使機(jī)房空調(diào) (CRAC) 的運(yùn)行時間延長,增加能耗。
在北半球,IT基礎(chǔ)設(shè)施表現(xiàn)不佳和IT設(shè)備全面停運(yùn)的狀況通常出現(xiàn)在每年的6到8月份。然而在2015年1月,時值大洋洲的酷暑季節(jié),位于澳大利亞西部的一個數(shù)據(jù)中心因設(shè)備故障原因造成斷網(wǎng),當(dāng)時,一股熱浪使數(shù)據(jù)中心外部溫度上升到創(chuàng)紀(jì)錄的44.4攝氏度。異常炎熱的氣候,加上多個空調(diào)設(shè)備出現(xiàn)故障,導(dǎo)致部分服務(wù)器需要暫時關(guān)閉。最終造成成千上萬的客戶無法正常發(fā)送電子郵件以及訪問企業(yè)網(wǎng)站。這次運(yùn)行中斷持續(xù)了將近7個小時。
數(shù)據(jù)中心每次運(yùn)行中斷的平均成本高達(dá)28,900美元,而服務(wù)恢復(fù)的平均時間將近8個小時。這對于數(shù)據(jù)中心管理人員而言是一場痛苦的煎熬,他們可沒有心情去海灘度假,或者坐下來看看閑書。
那么,數(shù)據(jù)中心管理者應(yīng)采取哪些預(yù)防措施來應(yīng)對炎炎夏日的考驗(yàn)?zāi)?尤其是今天還有43%的數(shù)據(jù)中心管理者目前仍然依賴人工方法進(jìn)行產(chǎn)能規(guī)劃和預(yù)測。這個問題的答案遠(yuǎn)不止一種,特別是對于那些決定放棄使用Excel電子表格和Stanley卷尺,選擇更為先進(jìn)管理方法的管理者而言,更是如此。
事實(shí)上,與一般常理和大多數(shù)的硬件協(xié)議規(guī)定相反,數(shù)據(jù)中心可以在較高溫度環(huán)境下運(yùn)行,即使是高峰負(fù)荷期間。假設(shè)數(shù)據(jù)中心的室溫從標(biāo)準(zhǔn)的21攝氏度或更低上升到26-27攝氏度,每提升1度將節(jié)省2%的電耗,而全年節(jié)省下來的耗電量將非??捎^。要實(shí)現(xiàn)數(shù)據(jù)中心運(yùn)行環(huán)境溫度的安全提升,關(guān)鍵在于獲取運(yùn)行中的實(shí)時數(shù)據(jù)。
數(shù)據(jù)中心基礎(chǔ)設(shè)施管理解決方案(DCIM)是一款將IT設(shè)備與建筑設(shè)施功能相結(jié)合的軟件平臺,工程師和管理人員可通過DCIM全面查看數(shù)據(jù)中心的運(yùn)行狀況。無論當(dāng)?shù)貧庀髮W(xué)家預(yù)測的是一股洶涌熱浪,還是即將到來的極地渦旋,數(shù)據(jù)中心管理人員都需要通過獲得有關(guān)能耗、熱量、氣流和使用率的準(zhǔn)確信息來采取應(yīng)對之策。此外,數(shù)據(jù)中心基礎(chǔ)設(shè)施管理解決方案(DCIM)實(shí)現(xiàn)了更高級別的自動化控制,使數(shù)據(jù)中心管理人員能夠及時接收運(yùn)行信息,從而更好地管理產(chǎn)能規(guī)劃、分配及散熱效率。
服務(wù)器 高溫 運(yùn)行,意即在高溫環(huán)境(HTA)條件下運(yùn)行一個數(shù)據(jù)中心,在保持服務(wù)器設(shè)備組件規(guī)格不變的條件下,提高進(jìn)氣溫度,從而降低數(shù)據(jù)中心制冷設(shè)備能耗成本,并提高能耗利用效率。英特爾數(shù)據(jù)中心管理平臺(DCM)通過監(jiān)測、控制、設(shè)定和限制能耗,從而提高服務(wù)器運(yùn)行效率并降低運(yùn)營成本。DCM軟件平臺能夠讀取存儲設(shè)備、電源分配單元 (PDU) 及網(wǎng)絡(luò)設(shè)備的溫度等級,從而為散熱和供暖提供相關(guān)信息。對于平均300臺機(jī)柜300萬瓦功率的機(jī)房來說,溫度每升高2.2攝氏度即可節(jié)約20%的散熱成本。對于大型數(shù)據(jù)中心而言,電能成本占到整體運(yùn)營成本的很大比例,而英特爾DCM軟件平臺能夠幫助企業(yè)更加深入地了解電能與熱能管理,從而直接影響到企業(yè)的盈虧。
當(dāng)我們從更廣泛的角度審視DCIM解決方案時,一個很有趣的發(fā)現(xiàn)是近期一項(xiàng)調(diào)查表明,32%從未使用DCIM工具的數(shù)據(jù)中心管理人員缺少足夠的可依賴數(shù)據(jù)幫助他們做出日常決定或長期預(yù)測。事實(shí)上,仍有五分之一的數(shù)據(jù)中心目前依然完全依賴機(jī)架級熱傳感器和電子表格來實(shí)現(xiàn)散熱效率的最大化。
熱點(diǎn)審計可有效用于復(fù)查其它措施的有效性,并彌補(bǔ)相關(guān)流程的不足,盡管57%的數(shù)據(jù)中心在去年接受調(diào)查期間表示經(jīng)歷了熱能所帶來的挑戰(zhàn),并對數(shù)據(jù)中心的運(yùn)營效率造成了不利影響,但仍有7%的數(shù)據(jù)中心將熱點(diǎn)審計作為監(jiān)測溫度的唯一手段。
沒有使用DCIM分析工具的數(shù)據(jù)中心不可能完成計算流體動力學(xué)(CFD)的模擬工作,更不會像他們的同行那樣使用熱點(diǎn)審計。CFD模擬可以通過實(shí)時監(jiān)控的信息持續(xù)改進(jìn)和調(diào)整散熱策略和空調(diào)選擇。
現(xiàn)在,讓我們好好放松一下吧。如果你是一名正在使用英特爾數(shù)據(jù)中心管理平臺(DCM)的管理人員,即使面臨炎炎酷暑的考驗(yàn),你也可以輕松提高數(shù)據(jù)中心的運(yùn)營效率,并有效節(jié)省大量成本。
Intel一直致力于提高數(shù)據(jù)中心的自動化管理水平,并努力幫助管理者打造更加節(jié)能和環(huán)保的數(shù)據(jù)中心。在這方面,Intel DCM已經(jīng)展開與行業(yè)領(lǐng)導(dǎo)者的進(jìn)一步合作,通過采用更多智能技術(shù),在不影響數(shù)據(jù)中心業(yè)務(wù)表現(xiàn)的前提下有效降低能耗支出,同時大幅提升數(shù)據(jù)中心的管理運(yùn)行效率。