温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
监控告警是如何产生的以及如何配置监控策略?策略就是定义产生告警的规则,比如某个指标在达到设定的阈值后就会产生告警,并将所产生的告警通知给某人。那么我们该如何配置监控策略呢?首先我们打开监控平台菜单,进入监控配置策略,在这里我们可以看到系统默认已经内置了主机告警相关策略,这些内置策略默认是对当前所在的整个业务生效。接下来我们演示新建一个监控CPU使用率的策略。输入策略名称之后选择监控指标。然后选择我们要监控的CPU使用率指标。汇聚方法,它的作用是对数据进行计算告警策略,在查询指定时间范围的指标数据之后,通过具体的算法对数据进行处理,如求和、最大最小平均值个数等统计方式。汇聚周期它的作用是按多长的时间取一次数据,比如指标数据是一分钟上报一条汇聚周期,我们选的是五分钟,则会将五个点的数据作为一个数据点结果来展示。
01:04
监控维度,维度是代表这条数据的具体属性,如这条数据代表具体的某个磁盘分区、具体的某个设备名等。监控条件增加监控维度之后,我们便可以添加监控条件,对数据进行筛选过滤。例如,我们有十台主机,但只需关注其中的某一台主机的CPU使用率,那么我们就在监控条件这边新增目标IP,输入这台主机的IP,就表示只有这台主机会产生CPU使用率告警。例如,我们这里选择目标IP。输入我们需要关注的IP地址。那么这条策略就只会对这个IP生效了。监控目标则是选择在什么范围内生效。在这里,我们可以定义致命、预警、提醒三种级别的告警等级。每个级别中可以配置不同的检测算法,如同比、环比、静态阈值等多种多样的检测算法。具体使用情况可以根据实际来选择配置。通知告警组定义了该条告警发送给谁,组里面定义了通知人、通知渠道等内容。
02:05
通知间隔则是该告警未恢复的时候重复通知的时间间隔。在高级设置中可以配置个性化的通知内容监控系统,内置了非常多的变量等待您去发掘哦。到这里,我们就新建了一条CPU使用率的监控策略啦。策略配置后满足了触发阈值就会产生告警,如果产生了告警,则会看到策略,这里有个红色警灯,点击可以查看该策略产生的告警内容,点击这里可以查看事件详情以及看到告警的具体内容和视图。也可以在流转记录中查看告警事件的详细记录。已确认的告警是不会再重复通知的,如果是重要告警且需要重复通知的,请不要点击告警确认功能哟。在快捷屏蔽中可以进行相关屏蔽,屏蔽的是告警内容的这类事件,不仅仅屏蔽当前的事件,还包括后续屏蔽时间内产生的事件。屏蔽的内容可以在屏蔽菜单中查看。到这里,我们就成功配置了监控策略和如何处理告警信息啦。
我来说两句