現在很多企業IT部門都不太重視災備的演練,但在2016年即將結束時,一家蘇州生產面板的企業在年終災備演練中再次佐證了企業災備演練的重要性和不可替代性。
災備演練是驗證災難發生時,業務系統能否有效聯動切換的極為重要的手段。沒有災備的演練計劃和手段,往往無法預知災難發生時生產中心和災備中心的數據一致性,也無法預知災備中心是否具有了業務接管的一切必要條件。
那我們除了計劃階段性的災備演練外,平時怎麼採取必要的預防性維護有效防止數據中心系統宕機呢?
預防性維護可以確保最高的可靠性。通過採取積極的預防措施,以減少數據中心計劃外的設備停機時間和其他可以避免的故障。預防性維護的目的是要實行定期檢查,使設備的某些缺陷變得更加嚴重之前被發現。就像一輛汽車如果定期進行保養,那麼相對於只是時不時的進行維護或乾脆只是在有部件損壞情況下維修,其運行一定更高效,維修次數一定很少,正常運行時間一定更長。數據中心不定期進行有計劃和預防性的資產維護,會面臨運行失敗增加的風險。
宕機將會對現代化的企業造成嚴重的後果。挽回由宕機造成的收入損失和重建企業信譽將會非常困難,當然也不是不可能。雖然不能期望IT人員避開每次宕機事件,因為大多數系統宕機都是預防失敗造成的。
一個大型的數據中心內部往往都包含了很多小系統,運維工作都是圍繞著這些具體的應用系統展開的,而往往一次大的故障都是從開始的一點小故障逐漸擴展最終引發整個大系統的崩潰的,所以在出現一些小的異常時一定要及時消除,而這些異常就要靠完善的監控和報警系統來檢測。
「千里之堤,潰於蟻穴」,故障防患於未然,採取必要的預防性維護,在出現任何小的隱患,要及時排除隱患,避免導致重大故障出現,所以數據中心日常的例行檢查工作枯燥,但也很重要,可以及時發現一些運行中的隱患。同時數據中心承載的業務不會是一成不變的,隨著業務的多樣化和不斷發展,經常要對業務進行調整,包括服務器和網絡的設置。因此要對服務器和網絡設備操作很熟悉,根據應用的需要,及時準確做出變更。數據中心的設備一般運行週期是五年,不斷地有設備需要逐漸淘汰進行更換,硬件升級時需要做好回退機制,採取預防機制,以防升級出現問題時無法回退。
數據中心的技術運維人員們必須在進行預防性維護活動時意識到這些潛在的安全風險,在執行預防性維護任務時,採取一個預防性維護策略可以讓數據中心保持在一個最佳狀態下高效的運行,降低意外的修復成本,提高數據中心總體層面的可用性。預防性維護可有效避免問題變成災難 在系統元件故障發生前主動的確認潛在宕機事件,數據中心管理者再也不會在半夜接到有關小問題演變成災難的電話了,這主要歸功於他們在數據中心中應用了預防性維護策略。定期的預防性維護可以減少設備運行失敗的機會。根據系統應用及技術維護的建議實施預防性維護是一個好的開始,而這些預防性維護計劃可以隨著時間的推移進行修改,不斷提高數據中心的安全性,提高運維管理工作效率、改善運維管理工作質量,最終保證lT系統運維管理水平的可持續性提升,業務連續性的實現。

相 關 產 品