在企业业务信息化之后,企业业务依赖于各种应用系统,应用系统又依赖于各种IT资源。当IT资源出现故障或性能下降时,会导致应用宕机或性能下降,进而影响企业业务产出。资源监控就是对那些可能影响IT资源服务能力的各种技术性能参数进行全面监控,以便提前发现问题隐患并预警,帮助企业将故障消灭于萌芽状态之中。
华汇数据IT综合运营管理平台DCOM在出厂时已经内置了网络设备、服务器硬件、虚拟化平台、主机/操作系统、数据库、WEB服务器、中间件、存储设备等常见IT资源监控模板。
重要的资源监控有以下几点:
1.网络监控
系统的网络监控是基于SNMP 管理协议开发的跨厂商、跨平台的通用网络管理模块,能全面管理支持SNMP 协议各个网络设备厂商的产品,监控设备类型包括交换机、路由器、防火墙、负载均衡等设备,监控内容包括设备可用性(ping)、端口流量、端口使用率、内存使用率、CPU使用率等。
2.服务器
系统的服务器监控从多个方面对服务器硬件资源和操作系统进行监控管理,监控内容包括非法登录监测、存储空间监测、CPU负载监测、物理内存监测、交换区空间监测、IO负载监测、集群状态监测、指定进程监测和系统日志监测等。支持IBM AIX、HP-UX、Solaris、Windows、Linux、Red Hat、CentOS等多种操作系统及IBM、HP、Lenovo等服务器设备。
3.数据库
系统的数据库监控从可用性、性能、占用资源、安全事件和异常错误等多个方面对数据库进行全面监控,如响应时间监测、连接进程数监测、连接客户端监测、指定进程监测、长事务监测、锁监测、进程回滚监测、数据库空间监测和数据日志监测等。支持ORACLE、Sybase、DB2 、SQL Server、Informix、MySQL等多种数据库。
4.中间件
中间件是位于网络、操作系统和数据库之上和应用系统之下的一种独立的系统软件或服务程序,常见的中间件类型有交易中间件、消息中间件、RPC中间件、应用服务器和WEB服务器等。系统的中间件监控支持各种常用的中间件软件监控,如Tuxedo 、WebLogic、WebSphere、JBoss、Tomcat、Apache、IIS、Exchange Server、Lotus Notes and Domino等。系统的中间件监控从可用性、性能、占用资源、安全事件和异常错误等几个方面对中间件进行全方位监测,如Apache监测内容包括服务进程监测、负载监测、请求监测、闲置监测、内存使用情况监测和数据库连接监测等信息。
资源监控是否有效的关键在于科学和合理地规划监控内容,监控内容应该能全面覆盖可能导致该资源可能出现可用性和性能问题潜在隐患点。监控平台对每类IT资源都参考故障树分析(Fault Tree Analysis,FTA)方法自上而下仔细梳理可能导致资源不可用或性能下降的各种隐患点,然后再据此设计监控指标和参数,最大限度地保证监控全面和有效性。
在实际运行过程中可根据实际情况增加监控指标,对采集频率、采集时段、告警阀值等监控参数进行调优,以使系统达到最佳监控效果。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。