管理現狀
由于業務系統和設備數量不斷整合增加,各應用系統的運行維護、系統安全保障、硬件設備性能及其他指標的監測等工作量和復雜度不斷增大,完全依靠手工方式對大量的業務系統硬件、軟件、數據庫進行監控、管理,已經無法保障系統平臺、應用軟件和數據庫的正常運行;無法保障其性能的穩定性;無法實時監測、分析機房環境、網絡、操作系統、數據庫、中間件等的運行狀態及性能;故障預警能力差,不能對故障進行跟蹤,快速處理。
因此需要建設一套統一監控運維管理平臺,實現針對IT基礎架構的整體監控與管理自動化,以便最大限度的保證信息系統不間斷,從而為業務開展提供有力的運維保障服務。
用戶需求1強化主動監控,實現集中管理
實現網絡、業務資源、業務應用的全面集中監控,構建統一集成的系統資源監控平臺,主動、及時地發現問題,解決被動服務的局面。
2快速定位故障,減少維護成本
建立集中的告警分析處理機制和故障預警機制,當故障產生時,可以快速定位故障,很快發現問題根源并找到相應的解決方案,從而縮短故障解決時間,減少維護成本。
3全面直觀的運行可視化
提供運行可視化展示能力,以網絡、業務系統、機房等角度展示IT 資源運行情況、性能狀況等,使領導、管理者、技術人員能迅速掌握IT運行狀態。
解決方案
01、資源集中監控
系統將不同廠家,不同型號,不同系統類型,不同用途,不同地域的設備按照設備類型統一納入監控范疇,資源分門別類,占用一目了然,規劃有條不紊,管理一覽實現集中管控,實時一覽完成批量查看。可以實時監控相關設備的實時運行狀態,如在線狀態,cpu、內存利用率,服務器進程,網卡狀態,安裝軟件,磁盤分區使用情況,數據庫的關鍵指標,鏈路的上下行速率,丟包率等。
02、動態化拓撲展示
系統可以自動生成拓撲圖,內置多種拓撲圖布局效果,包含了眾多的設備圖元,生成拓撲后可根據習慣性操作更改布局,貼近自己的操作和使用習慣,圖元顏色由設備綜合性能指標控制,達到預設閥值便可呈現對應的顏色,故障定位根源,以告警燈的方式閃爍提示位置,系統平臺監控的設備可以在拓撲圖中按照真實環境區域設置,方便管理人員在網絡故障時判斷故障的影響范圍和問題根源。
03、硬件狀態監控
網管系統提供的服務器IPMI監控和惠普服務器ILO監控,貴飛公司用戶可簡單有效的對服務器內部的電源,風扇,cpu,內存,硬盤等各個部件工作狀態進行監控,幫助用戶避免因服務器硬件損壞導致對業務和設備的損失。
04、體驗化管理
網管系統提供的真實接口背板圖,系統將設備的接口可視化展示,設備接口會自動和上聯設備關聯,直觀的可以看到接口的流量,容量,vlan等信息。用戶也可以對設備的各個端口進行查看,關閉和打開的操作,當交換機端口異常或流量異常時能及時的把端口宕掉。幫助用戶不用登錄設備或到機房設備人工巡檢,方便輕松的管理設備,減輕技術人員的工作壓力,可以更好的提高辦事效率。
05、快速定位故障
登錄系統可以看到系統最新故障,通過故障詳細頁,可了解到當前故障出現的具體位置,持續時長,故障級別,所屬地域,關聯知識解決方案,是否被其他管理員確認,所屬那個地域管理員,以及關聯到哪些設備鏈路等。
06、全面數據分析
對系統進行調優需要對軟、硬件指標進行全方位的數據分析,有效的分析數據才能滿足用戶需求,進一步進行系統分析找出瓶頸,優化瓶頸,提高系統整體性能。全面的數據分析,提供實時分析,歷史分析,對比分析,支持Excel數據導出,為決策人提供有力的證據,資源合理利用,效率最高,可實現經濟可行性,以及故障追根溯源時間點等。
07、高效智能巡檢
智能巡檢幫助用戶對日常的巡檢內容進行個性化設置,并在指定點對核心關注點進行掃描記錄。用戶可以按不同巡檢內容和設備制定周期性的定點智能巡檢,自定義添加檢測點,構建巡檢規則。以模板規范標準值為依據,根據預設的要求進行數據采集進行定期巡檢。以報表的形式直觀反映巡檢結果,快速反映本次巡檢的異常, 系統會定期生成并主動發送運維人員。支持對系統監控巡查的整體進行評價和備注說明,導出多種格式方便技術人員向領導匯報工作。