數(shù)據(jù)中心遷移并不是個(gè)輕松的任務(wù),但是卻是企業(yè)必須面臨的問題,因?yàn)閿?shù)據(jù)中心需要進(jìn)行合并、轉(zhuǎn)移、整合、構(gòu)建以及其他更新。毫無疑問,…
數(shù)據(jù)中心遷移并不是個(gè)輕松的任務(wù),但是卻是企業(yè)必須面臨的問題,因?yàn)閿?shù)據(jù)中心需要進(jìn)行合并、轉(zhuǎn)移、整合、構(gòu)建以及其他更新。毫無疑問,這樣一項(xiàng)任務(wù)會(huì)很快成為數(shù)據(jù)中心管理員的新挑戰(zhàn),特別是當(dāng)需要進(jìn)行地面布局和有其他物理需求時(shí)。
除了一部分很明確的規(guī)劃,如設(shè)置機(jī)器的修養(yǎng)期、安排舊設(shè)備淘汰和進(jìn)行服務(wù)器整合,管理員也必須考慮應(yīng)用軟件的停工期。幸運(yùn)的是,由于可進(jìn)行數(shù)據(jù)中心托管并且硬件價(jià)格低廉,因此徹底停止數(shù)據(jù)中心的服務(wù)在當(dāng)前是可以避免的。
然而,應(yīng)用軟件托管需要充分的預(yù)先計(jì)劃,任何階段和產(chǎn)品需求都不能出差錯(cuò)。盡管當(dāng)前將核心系統(tǒng)轉(zhuǎn)換到外部環(huán)境的情況已大大減少,有時(shí)管理員還是不得不咬緊牙關(guān)選擇托管的方式以確保應(yīng)用軟件的持續(xù)運(yùn)行。
恰當(dāng)?shù)挠?jì)劃是使服務(wù)和設(shè)備轉(zhuǎn)換平穩(wěn)進(jìn)行的關(guān)鍵,只有這樣才能使用戶的工作不受到任何影響。最終管理員結(jié)束這一艱巨的任務(wù),這需要不同IT小組(包括工程師和技師)之間良好的溝通,可以使這一重新部署任務(wù)圓滿完成。
最近,CMP通路檢測中心實(shí)驗(yàn)室(CMP Channel Test Center lab)需要進(jìn)行遷移。為了圓滿完成這一遷移,必須創(chuàng)建一個(gè)小型計(jì)劃,這樣就可以保證只有兩到三天時(shí)間基礎(chǔ)設(shè)施無法達(dá)到最大利用率。在整個(gè)計(jì)劃完成了一半時(shí),地面設(shè)計(jì)、動(dòng)力資源供給、USP服務(wù)和網(wǎng)絡(luò)設(shè)計(jì)等都發(fā)生了改變。為了將轉(zhuǎn)移期間停工時(shí)間最小化,我們迅速制定出了行動(dòng)計(jì)劃。如下是計(jì)劃的實(shí)施步驟,解決方案提供者可以制訂相似的轉(zhuǎn)移計(jì)劃,這樣就可以盡量避免轉(zhuǎn)移過程中問題的發(fā)生。
1、將設(shè)備、電工和IT員工相協(xié)調(diào):從一開始,我們就很明確地告訴每個(gè)小組我們需要轉(zhuǎn)移基礎(chǔ)設(shè)施設(shè)備和機(jī)架的最小量。遷入的新服務(wù)器機(jī)房比以前小,因此我們面臨著潛在的所需機(jī)架和架子的空間安排問題。我們計(jì)算出所需機(jī)架和架子的最小量 既可滿足需要,又可放入新機(jī)房內(nèi)。
2、停機(jī)但是保證數(shù)據(jù)中心持續(xù)運(yùn)行:在轉(zhuǎn)移的當(dāng)天我們提出一個(gè)普通但是很卻很有效的行動(dòng)計(jì)劃。員工在轉(zhuǎn)移設(shè)備和部件時(shí)不斷開關(guān)鍵的網(wǎng)絡(luò)通路。
3、冷卻系統(tǒng)和其他系統(tǒng):此處有一個(gè)被忽略的內(nèi)容。由于設(shè)計(jì)原因,CMP Channel Test Center新服務(wù)器機(jī)房需要更少的冷卻設(shè)施,但是數(shù)據(jù)中心總的工作量卻沒發(fā)生變化。我們需要仔細(xì)觀察并進(jìn)行測量。轉(zhuǎn)移一個(gè)數(shù)據(jù)中心時(shí),你也需要與電工討論相關(guān)問題,例如新機(jī)房可獲得的最大電力負(fù)荷,以確保未來的機(jī)器數(shù)目增長可與之相適應(yīng),同時(shí)也使CIO和CEO們了解機(jī)房的電力承載力。
4、維持?jǐn)?shù)據(jù)中心運(yùn)行:數(shù)據(jù)遷移和保證核心應(yīng)用軟件運(yùn)行從來不是什么大問題。然而,根據(jù)我們的經(jīng)驗(yàn),成本最少的行動(dòng)方案是將工作分解。換句話說,在遷移期間實(shí)際存在兩個(gè)數(shù)據(jù)中心。維護(hù)小型數(shù)據(jù)中心的VAR應(yīng)該推薦采用這一方式以保證數(shù)據(jù)中心的持續(xù)運(yùn)行。這可實(shí)現(xiàn)在遷移過程中不需要進(jìn)行基礎(chǔ)設(shè)施托管。
5、開始運(yùn)行:不在萬不得已的情況下,不要斷開機(jī)架和網(wǎng)絡(luò)的線路連接。斷開的連接越少,花費(fèi)越少,同時(shí)一個(gè)客戶機(jī)可以更加迅速地恢復(fù)運(yùn)行。為了加快CMP Channel Test Center的遷移速度,員工盡量保證線路連接,同時(shí)在斷開的網(wǎng)絡(luò)連接上貼上標(biāo)簽。結(jié)果顯示我們節(jié)約了大量時(shí)間。
6、測試,測試再測試:不要對(duì)任何一個(gè)小的環(huán)節(jié)掉以輕心。檢測網(wǎng)絡(luò)連接,外部服務(wù)和服務(wù)器,和其他參與遷移的人員保持聯(lián)系,并讓其對(duì)任何損壞負(fù)責(zé)。
對(duì)實(shí)驗(yàn)室的重新部署點(diǎn)醒了我們大家。很多工作中和設(shè)備測試中經(jīng)常被忽略的小細(xì)節(jié)都顯示出其重要性,需要在遷移中引起重視。
生產(chǎn)量計(jì)劃也是一個(gè)需要引起我們重視的核心環(huán)節(jié)。這次是二十年來實(shí)驗(yàn)室的第四次遷移。盡管中間出現(xiàn)了一些小的卡殼,但是工作順利進(jìn)行,我們感到很有信心,因?yàn)檫w移過程中潛在的無法預(yù)料的電力供給和需求增長以及其他網(wǎng)絡(luò)限制問題都沒有對(duì)整個(gè)遷移過程構(gòu)成影響。
延伸閱讀:推動(dòng)數(shù)據(jù)中心向100G網(wǎng)絡(luò)進(jìn)發(fā)
數(shù)據(jù)中心建設(shè)向二三線城市延伸