數據中心機房監控管理介紹

數據中心機房監控主要是針對機房所有的設備及環境進行集中監控和管理的,其監控對象構成機房的各個子系統:動力系統、環境系統、消防系統、保安系統、網絡系統、服務器系統等。機房監控系統基于網絡綜合布綫系統,采用集散監控,在機房監視室放置監控主機,運行監控軟件,以統一的界面對各個子系統集中監控。

數據中心監控管理系統首先是一個多系統集成的綜合系統,這是由它監控的對象及其特徵所决定的。數據中心承擔不同功能的設備,類型多,數量多,參數多,連接多,數據中心機房監控系統就是將這些分系統通過物聯網、互聯網的方式對所有分系統進行綜合控制管理,將網絡和設備智能連接起來,從而實現智能監控信息化,幷且它們自身也可以組成一個個相對獨立的硬件系統,通過一個統一的監控管理平臺,集成這些系統,就可以組成一個完整的監控管理系統。

數據中心監控管理系統也是一個數據采集、加工處理、統計分析的數據管理平臺。可從邏輯架構、物理架構、系統部署架構三個方面介紹監控管理系統的整體架構。

邏輯架構描述了監控管理系統軟件由哪些邏輯構件組成、以及這些邏輯構件之間的關係。系統邏輯架構由以下四大邏輯構件組成:監控系統,運行管理系統,總控中心系統,基礎服務系統。

物理架構規定了系統的物理元素、這些物理元素之間的關係、以及它們部署到硬件上的策略。物理架構可以反映出軟件系統動態運行時的組織情况。隨著分布式系統的流行,物理層的概念大家早已耳熟能詳。物理層和分布有關,通過將一個整體的軟件系統劃分爲不同的物理層,可以把它部署到分布在不同位置的多台計算機上,從而爲遠程訪問和負載均衡等提供了手段。

數據中心監控管理系統設計充分考慮了系統性能、可靠性、可擴展性和可伸縮性,在數據中心部署時需根據系統規模和最大在綫用戶數進行配置。一個通用的部署原則是將數據和應用分布在不同物理服務器;當管理設備增加時,可以將不同應用模塊分布到不同物理服務器;當用戶數增加時,增加服務器數量均衡負載;爲保證高可用性,可以將一個應用模塊部署到多個物理服務器生成多個應用實例;可實現灾備系統,生産系統和備份系統分別運行在不同空間和物理區域,避免自然灾害和戰爭等不可抗力對系統造成的毀滅性損失。

數據中心監控系統的核心功能按照邏輯關係可劃分成四大功能集:監控系統功能、運行管理功能、總控中心功能、系統服務功能(含數據庫)。

數據中心基礎設施監控功能主要完成數據采集、分析處理、存儲、展示,使用戶能實時掌控數據中心的基礎設施運行情况。

數據中心運行管理功能目標是用較少的運行成本實現數據中心盡可能高的可用性。圍繞這一目標,監控管理系統需要配置“運維管理”、“資産管理”、“容量管理”、“能耗管理”等基本管理功能模塊構成“運行管理子系統”。運行管理子系統主要從監控子系統與總控中心子系統獲得管理所需信息,實現管理功能與目標。

總控中心功能是運維管理驅動信息的重要入口,特別是爲IT用戶提供“一站式服務”的窗口。總控中心系統是總控中心必須配置的基礎工具,包括服務台(含語音通信),大屏展示(監控管理信息可視化)、報表、告警告知等功能模塊,與運維管理系統一起保證數據中心的可用性。

系統服務主要給監控管理系統各個模塊提供公共功能。最主要的公共功能包含:系統日志功能、用戶和權限管理功能、系統維護功能、雙機熱備功能。

監控管理系統包含統一日志記錄功能。日志是記錄系統中硬件、軟件和系統問題的信息,同時還可以監視系統中發生的事件。監控管理系統具備安全的用戶和權限管理。系統中的用戶可以按權限組進行分級管理,可以通過定義用戶的對監控管理系統的操作動作,操作對象範圍任意劃分成多個權限組,從而實現多級權限管理。監控管理系統提供了方便的維護工具和手段。隨著數據中心的擴容,監控管理系統也需要進行對應的變更,在綫擴容可以在不停止監控管理系統的前提下,增加監控對象或者管理功能。根據數據中心可用性等級設計要求,高可用性等級的數據中心的監控管理系統必須配備雙機熱備功能。該功能可以使監控管理系統在一台主機出現故障時,自動將監控業務切換到備機,從而保障監控業務的持續性。