IT 自動化運維系統設計

隨著運維技術的進步以及運維服務體系的完善,自動化運維作爲一個充滿活力的方向,也隨著規模、場景的變遷迎來新的挑戰和變化。運維的活動範圍更多介于硬件與操作系統之上、應用之下,其與基礎架構也像是人的兩條腿,相輔相成,總是一前一後交替往前推進。基礎架構决定運維方向,同樣運維體系又使得基礎架構發揮最大收益。故而自動化運維平臺的根本,不是僅僅把操作界面化,讓人們簡單地在界面點擊按鈕就能管理系統,而是在底層的基礎架構與上層的業務系統之間搭建一個良好的橋梁,使得業務系統能够充分、穩定而又不必過度關注底層架構特性。
做好自動化運維管理平臺設計首先完成基礎數據的收集,進而對其進行必要的詳盡的監控。建立起監控平臺,實現主動監控業務系統、服務器、網絡系統在出現問題時,可以第一時間收到告警,這樣在面對IT故障的時候,可以在與業務部門溝通中占據優先權,而非等業務投訴了,才知道系統出現故障。
同時通過精准有效的報警策略做到專業的事由專業的人去做。生産系統可以實現郵件、微信、短信告警等功能,可以根據故障類型和影響級別及時通知到相應人員,幷且可以根據SLA進行事件升級。
虛擬化和私有雲的搭建可以更好的結合進行全域備份。完整、可用的備份集是保障企業數據不丟或是最少丟失的最後一道保障。同時做好備份策略,備份驗證。有備份就一定要有驗證,而且驗證要持續不間斷,有計劃地實施。只要通過驗證可用的備份集才能保障系統的可用性。
在完成了監控和灾備之後,運維的冗餘工作量會得到一定的减少。接下來可以進行自動化的運維工作,例如自動裝機,自動部署服務,利用自動化運維將日常的重複工作讓系統完成,大大解放運維的勞動力。讓運維可以有更多的時間和精力保障整個IT系統的安全、穩定和高效。
新一代的自動化運維平臺應該是可以基于API來自動維護和管理相關的服務器、存儲、網絡、負載均衡的資源的。通過API對資源的操作都應該被作爲操作日志記錄下來,以備作爲後續操作審計的基礎數據。然而這些API是構建一個自動化CMDB的基礎。
在完成了基礎數據采集、CMDB(配置管理數據庫)建立、監控平臺、灾備、運維自動化、虛擬化和私有雲之後,可以采用基于開源的CMDB進行同步整合,CMDB不統一起來,就意味著一旦要增加一台服務器,可能要在各個運維工具裏面都要進行同步,因此CMDB項目不能一蹴而就,而是一個循序漸進、持續發展的過程,需要企業後續的投入和不斷改進服務。
因此自動化運維不僅僅是工具上的革新,更多的是思想上的轉變,流程上的優化,這將會是一個持續改進的過程。在設計上首先,運維需要規範化流程化。其次,運維工具容器化,將常用的運維工具和公司産品構建到容器或者VM中,儘量减少部署時間。再次,日常維護需脚本化,通過配置管理工具實現自動配置維護,幷且儘量减少人工的處理與參與。最後,是自動化。
一個真正的自動化運維平臺幷不只是通過人或者通過技術去减少人工的參與成本,而是需要和運維産品相結合,最終做到智能運維,自動化運維。

相 關 產 品