IT 自動化運維系統功能

IT自動化運維,可實現日常設備監控、主動發現問題、自動分析定位、基於標準化流程工具規範化處理、通過自動化運維操作工具處理修復等系統功能,最終實現監管治自動化運維,主要從以下主要功能體現。

一.監控自動化,監控自動化是運維自動化的基礎,通過自動化監控平臺對各類IT資源(包括伺服器、資料庫、中介軟體、存儲備份、網路、安全、機房、業務應用、作業系統、虛擬化等)進行即時監控,出現故障後進行告警歸集並處理,解決同設備同指標同告警頻報問題。當然,監控自動化的範疇很廣,除了監控告警回應,系統也可從業務角度出發,根據業務系統運行情況,判斷業務系統健康度。

二.資料獲取自動化,資料自動化採集是保障運維人員即時瞭解系統運行狀況的前提,系統通過自訂採集策略,週期性採集,主動上報,進行資料分析處理,並統一在系統上進行展示。

三.日常巡檢自動化,運維服務管理可通過系統組態,指定需要巡檢的設備、介面及每天的巡檢時間和次數,系統按照巡檢範本定時巡檢並生成巡檢報表發送到指定郵箱,無需人工巡檢填寫巡檢報告,讓運維人員不論身處何地,也能定時瞭解系統日常運行情況,減少了工程師標準化、重複的工作,化人工作業為自動化過程,使工程師可以專注于其他更有價值工作。

四.設備配置比對自動化,運維服務系統標準化的腳本,通過腳本執行,定期下載備份系統組態及檔。系統通過日常備份設定檔比對分析,將變化內容高亮顯示,讓運維人員一目了然哪些配置被修改過;當配置發生變化後,會第一時間在告警台進行展示。當設備不可用時,通過快速恢復功能一鍵恢復。

五.故障定位自動化,運維服務可通過智慧化的故障排查處理機制,立足提高工程師處理效率,靈活的故障策略能適應各種各樣的IT變化,幫助工程師在海量的告警中,準確的定位故障、通過自動抓取設備快照,瞭解當時系統運行情況,快速定位故障,有效縮短排障時間,解決運維難題。

六.資料分析自動化,大資料時代,可監控的系統資源設備性能資料和其他業務系統運行日誌進行分析,掌握當前業務系統運行情況,瞭解性能、容量瓶頸問題,根據日常的運行情況及性能資訊指標,綜合進行預測,防患於未然。

七.流程處理自動化,運維服務管理平臺的可遵循ITIL管理思想,通過流程與資產的無縫對接,建立資源運維規範化流程;通過流程化運維方式,讓每一次運維都有相應的記錄,可隨時查看運維歷史及運維記錄,包括排障記錄、變更記錄、服務記錄等,並且提供表單自訂和流程自訂功能,實現客戶運維管理標準化、規範化。在工單處理完後,一鍵轉化為知識庫,提高工作效率。

八.故障處理自動化,大批量的系統每天會產生海量的告警,很多告警都屬於常規性告警,如磁碟空間不足,CPU、記憶體利用率過高等問題。當產生告警後,根據預先配置的策略,自動生成工單,不同的告警進行不同的工單、派單處理,有效地將服務台和服務請求、事件問題、標準變更發佈流程整合,使運維服務過程有統一的任務優先順序排序、跟蹤和評估 / 審批,運維人員只需要根據工單進行處理即可。

九.日常備份自動化,為了保證出現問題後快速恢復、確保資料完整和有效性,定期的備份就顯得尤為重要。通過編寫Shell、Python、Bat腳本,通過視覺化流程編排設計器,將運維操作和被管資源相結合,通過定時批量備份資料,減少人工工作量。

十.系統優化自動化,自動化運維可通過腳本,以定時或者人工觸發的方式,實現定時優化系統、故障自動化處理、批量配置系統、關鍵服務啟停功能,構建企業自動化運維、從而提到運維效率,降低操作風險。

十一.大批量配置自動化, 運維人員在日常工作中,需要針對設備進行常規性配置,如創建使用者、增加磁碟空間、安裝程式補丁包等重複性工作。面對數以千計的設備,傳統運維方式下,工程師需要逐個登陸系統進行配置,不但效率低下而且極容易出錯。通過編寫腳本,關聯被管設備,定時批量執行,可大大提高運維效率,保障了執行的準確性。