杰夫·克勞斯先生是美國英特爾公司數(shù)據(jù)中心管理器(DCM)解決方案總經(jīng)理。在英特爾公司,杰夫·克勞斯擁有13年以上的團隊管理經(jīng)驗。他的團隊正在開拓能耗與熱量管理中間件產(chǎn)品。
文/?美國英特爾公司數(shù)據(jù)中心管理器(DCM)解決方案總經(jīng)理杰夫 克勞斯
2015年是全球有史以來最熱的一年,然而不幸的是,根據(jù)美國國家航空航天局(NASA)和美國國家海洋和大氣管理局(NOAA)氣候研究院預測,地球表面的平均溫度將在2016年再次創(chuàng)下新高。不僅如此,2016年夏天將成為有史以來最為酷熱的一個夏天。這標志著全球平均氣溫將首次連續(xù)三年屢創(chuàng)新高!
夏天對大部分人來說是美好的,我們可以盡情享受各種愜意的戶外活動,比如高爾夫、網(wǎng)球、騎自行車遠足、戶外燒烤,或曬曬日光浴讓自己擁有更為健康的膚色。但對于數(shù)據(jù)中心的管理人員而言,夏天的到來意味著溫度的急劇攀升和隨之而來的能耗增加。室外溫度的上升可輕易導致數(shù)據(jù)中心的室溫升高,從而迫使機房空調 (CRAC) 的運行時間延長,增加能耗。
在北半球,IT基礎設施表現(xiàn)不佳和IT設備全面停運的狀況通常出現(xiàn)在每年的6到8月份。然而在2015年1月,時值大洋洲的酷暑季節(jié),位于澳大利亞西部的一個數(shù)據(jù)中心因設備故障原因造成斷網(wǎng),當時,一股熱浪使數(shù)據(jù)中心外部溫度上升到創(chuàng)紀錄的44.4攝氏度。異常炎熱的氣候,加上多個空調設備出現(xiàn)故障,導致部分服務器需要暫時關閉。最終造成成千上萬的客戶無法正常發(fā)送電子郵件以及訪問企業(yè)網(wǎng)站。這次運行中斷持續(xù)了將近7個小時。
數(shù)據(jù)中心每次運行中斷的平均成本高達28,900美元,而服務恢復的平均時間將近8個小時。這對于數(shù)據(jù)中心管理人員而言是一場痛苦的煎熬,他們可沒有心情去海灘度假,或者坐下來看看閑書。
那么,數(shù)據(jù)中心管理者應采取哪些預防措施來應對炎炎夏日的考驗呢?尤其是今天還有43%的數(shù)據(jù)中心管理者目前仍然依賴人工方法進行產(chǎn)能規(guī)劃和預測。這個問題的答案遠不止一種,特別是對于那些決定放棄使用Excel電子表格和Stanley卷尺,選擇更為先進管理方法的管理者而言,更是如此。
事實上,與一般常理和大多數(shù)的硬件協(xié)議規(guī)定相反,數(shù)據(jù)中心可以在較高溫度環(huán)境下運行,即使是高峰負荷期間。假設數(shù)據(jù)中心的室溫從標準的21攝氏度或更低上升到26-27攝氏度,每提升1度將節(jié)省2%的電耗,而全年節(jié)省下來的耗電量將非??捎^。要實現(xiàn)數(shù)據(jù)中心運行環(huán)境溫度的安全提升,關鍵在于獲取運行中的實時數(shù)據(jù)。
數(shù)據(jù)中心基礎設施管理解決方案(DCIM)是一款將IT設備與建筑設施功能相結合的軟件平臺,工程師和管理人員可通過DCIM全面查看數(shù)據(jù)中心的運行狀況。無論當?shù)貧庀髮W家預測的是一股洶涌熱浪,還是即將到來的極地渦旋,數(shù)據(jù)中心管理人員都需要通過獲得有關能耗、熱量、氣流和使用率的準確信息來采取應對之策。此外,數(shù)據(jù)中心基礎設施管理解決方案(DCIM)實現(xiàn)了更高級別的自動化控制,使數(shù)據(jù)中心管理人員能夠及時接收運行信息,從而更好地管理產(chǎn)能規(guī)劃、分配及散熱效率。
服務器 高溫 運行,意即在高溫環(huán)境(HTA)條件下運行一個數(shù)據(jù)中心,在保持服務器設備組件規(guī)格不變的條件下,提高進氣溫度,從而降低數(shù)據(jù)中心制冷設備能耗成本,并提高能耗利用效率。英特爾數(shù)據(jù)中心管理平臺(DCM)通過監(jiān)測、控制、設定和限制能耗,從而提高服務器運行效率并降低運營成本。DCM軟件平臺能夠讀取存儲設備、電源分配單元 (PDU) 及網(wǎng)絡設備的溫度等級,從而為散熱和供暖提供相關信息。對于平均300臺機柜300萬瓦功率的機房來說,溫度每升高2.2攝氏度即可節(jié)約20%的散熱成本。對于大型數(shù)據(jù)中心而言,電能成本占到整體運營成本的很大比例,而英特爾DCM軟件平臺能夠幫助企業(yè)更加深入地了解電能與熱能管理,從而直接影響到企業(yè)的盈虧。
當我們從更廣泛的角度審視DCIM解決方案時,一個很有趣的發(fā)現(xiàn)是近期一項調查表明,32%從未使用DCIM工具的數(shù)據(jù)中心管理人員缺少足夠的可依賴數(shù)據(jù)幫助他們做出日常決定或長期預測。事實上,仍有五分之一的數(shù)據(jù)中心目前依然完全依賴機架級熱傳感器和電子表格來實現(xiàn)散熱效率的最大化。
熱點審計可有效用于復查其它措施的有效性,并彌補相關流程的不足,盡管57%的數(shù)據(jù)中心在去年接受調查期間表示經(jīng)歷了熱能所帶來的挑戰(zhàn),并對數(shù)據(jù)中心的運營效率造成了不利影響,但仍有7%的數(shù)據(jù)中心將熱點審計作為監(jiān)測溫度的唯一手段。
沒有使用DCIM分析工具的數(shù)據(jù)中心不可能完成計算流體動力學(CFD)的模擬工作,更不會像他們的同行那樣使用熱點審計。CFD模擬可以通過實時監(jiān)控的信息持續(xù)改進和調整散熱策略和空調選擇。
現(xiàn)在,讓我們好好放松一下吧。如果你是一名正在使用英特爾數(shù)據(jù)中心管理平臺(DCM)的管理人員,即使面臨炎炎酷暑的考驗,你也可以輕松提高數(shù)據(jù)中心的運營效率,并有效節(jié)省大量成本。
Intel一直致力于提高數(shù)據(jù)中心的自動化管理水平,并努力幫助管理者打造更加節(jié)能和環(huán)保的數(shù)據(jù)中心。在這方面,Intel DCM已經(jīng)展開與行業(yè)領導者的進一步合作,通過采用更多智能技術,在不影響數(shù)據(jù)中心業(yè)務表現(xiàn)的前提下有效降低能耗支出,同時大幅提升數(shù)據(jù)中心的管理運行效率。