本預案在發(fā)生通知停電與突發(fā)停電后啟動,用于盡可能避免硬件損壞和數(shù)據(jù)丟失。
一、????????? 應急原則
1、關機前做好相關備份,保證供電后恢復運行。
2、UPS電力耗盡前所有設備主動關機,盡量避免硬件受損。
3、根據(jù)停電時間執(zhí)行預案等級以確保關鍵服務EDI, Exchange。
4、群集和按開關機操作步驟操作。
二、????????? 設備分組
1、Device Group1:?? R3和R4機柜所有網(wǎng)絡設備和防火墻
2、Device Group2:?? R1機柜所有服務器,S38及KVM等
3、Device Group3:?? R2機柜所有服務器
4、Device Group4:?? R10機柜網(wǎng)絡設備,Avaya機柜設備
5、Device Group5:?? S61-S66, S13, S53,S06,S41,S34,N99,S40
6、Device Group6:?? R7機柜所有設備,S39,S21,S46
7、Device Group7:?? R8機柜所有設備
8、Device Group8:?? 26F交換機
三、????????? 快速數(shù)據(jù)備份
1、網(wǎng)絡設備配置備份,兩份拷貝。
2、按重要性和耗時開始備份作業(yè)。
四、????????? 應急處理等級—工作時間9:00AM-18:00PM
1、4級,適用情況:停電時間在1小時內(nèi),關閉DG6和DG7所列設備,備份網(wǎng)絡設備配置。
2、3級,適用情況:停電時間在1-2小時之內(nèi),關閉DG4-DG7所列設備,備份網(wǎng)絡設備配置.
3、2級,適用情況:停電時間超過2小時,先關閉DG4-DG7所列設備,備份網(wǎng)絡設備配置,半小時后開始關閉DG3和DG2設備。
4、1級,適用情況:突發(fā)停電,了解停電原因,關閉DG6和DG7設備,再依據(jù)實際情況執(zhí)行相應的應急等級。
五、????????? 應急處理等級—非工作時間
1、4級,適用情況:停電時間在1小時內(nèi),關閉DG6和DG7所列設備,備份網(wǎng)絡設備配置,通過查看UPS日志選擇是否到現(xiàn)場。上班前1小時到達公司開機并測試功能。
2、3級,適用情況:停電時間在1-2小時之內(nèi),關閉DG4-DG7所列設備,備份網(wǎng)絡設備配置。每15分鐘觀察一次UPS狀態(tài),根據(jù)實際情況決定是否關閉DG2和DG3設備,在上班前2-1.5小時抵達現(xiàn)場開機并測試功能。
3、2級,適用情況:停電時間超過2小時,先關閉DG2-DG7所列設備,備份網(wǎng)絡設備配置。在上班前2-1.5小時抵達現(xiàn)場開機并測試功能。
4、1級,適用情況:突發(fā)停電!1小時內(nèi)獲知停電消息,并且電力沒有恢復,立刻依次關閉DG3,DG2,DG4-DG7設備,上班前2-1.5小時抵達現(xiàn)場開機并測試功能。超過UPS支撐時間后得知停電,在電力恢復穩(wěn)定后趕到現(xiàn)場開機檢測硬件及應用程序功能,處理各種可能的結果。
六、????????? 系統(tǒng)開機順序
1、2個核心交換機啟動
2、約5分鐘左右開啟其他網(wǎng)絡設備,無特殊順序。
3、6個SAS存儲設備。
4、開啟S01,登錄后約5分鐘再開啟S07,S35,S61,S40。
5、開啟S04和S10,完全啟動后且距SAS盤柜開機約5分鐘后開啟S11,S11完全啟動后開啟S12,檢測webmail.cn.dsv.com和Cluster。
6、距SAS盤柜開機約5分鐘后開啟S02,S02完全啟動后開啟S15,S17,S18,S22,檢測EDI登錄。
7、開啟其他服務器,檢測相應功能。
七、????????? 人員組織
平時做好數(shù)據(jù)備份工作,停電時嚴格按應急預案處理各項工作,記錄處理中的異常情況以備案。所有人員積極配合以應對可能的突發(fā)事件。