首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

告警平台设计及告警收敛通用解决方案

运维就要无所不能,无所不会 告警平台设计及告警收敛通用解决方案 先有监控,后有告警。...虽厂商有自动换号机制,但健康检测不可少 级联告警告警收敛打基础,减少告警信息,避免告警风暴 告警收敛 特别重要,依次要有告警自愈、级联告警告警收敛 告警权重 针对不同告警权重,做对应告警策略。...告警分层 分业务、分模块、分团队、分时段,必不可少 告警升级 包括告警通道告警告警职级升级 四、告警收敛通用解决方案 告警收敛首先要解决的问题是告警风暴!...定时告警静默的功能,也不能覆盖全场景。且已经了出来的告警,再静默无效。 告警收敛 收敛有很多方式,常见的如:同属性维度收敛、时间维度收敛、次数收敛。...同属性维度收敛zabbix相同事件名、相同主机名、相同业务名称、告警统一ID,等可以做为唯一标识的字段,做频次收敛,或告警合并 时间维度收敛:判断单位时间内告警条数,做告警合并。

6.4K62
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    zabbix 告警设计

    告警设计 通过zabbix api 查询报警信息 (已实现) 通过查询sql 查询告警信息 然后通过转发实现消息推送( 重新定义一个数据库,使用触发器把zabbix...数据库中的告警数据同步到新库,查询新库和平台对接) 重写源码接口 改写源码的消息发送方式....与平台对接用的 requests 模块 发送URL 具体实现 方案一 通过zabbix api 查询报警信息 (已实现) 方案二 通过查询sql 查询告警信息 然后通过转发实现消息推送...( 重新定义一个数据库,使用触发器把zabbix数据库中的告警数据同步到新库,查询新库和平台对接) # 添加字段 hostid ## 可以在新库上面拓展字段 # 创建数据库 report 创建表...`events`.eventid=new.eventid; END; $$ DELIMITER ; 方案三 重写源码接口 还没有找到具体的收集告警的代码, (收集数据是在 zabbix_agent

    1K20

    zabbix设置邮件告警

    配置zabbix 配置——》动作——》创建动作 ? 设置动作,例如触发器达到什么级别告警 ? 设置操作,包括标题及发送的消息内容,然后再设置一些细节,给谁发此消息 ? ? 完整的示例如下: ?...设置报警媒介类型 这里是通过执行服务器上的脚本完成邮件告警的 ? 脚本参考 # cat send_mail.py #!...SendMail(mail_host,mail_user,mail_pass,sender,receivers,content,title) m.sendEmail() 写好脚本后,我们需要修改下zabbix-server...的配置文件,需要指定下脚本位置 vim zabbix_server.conf 增加这么一段配置: AlertScriptsPath=/export/script 修改完成后,重启一下zabbix-server...以上是关于zabbix如何设置邮件告警,有的云主机25端口是封禁状态,所以我们自己写一个脚本,使用加密的465端口,这样会更加安全。

    98410

    ZabbixZabbix微信告警配置演示

    ,把接收消息的人加入进来 记录此账号名称 3、配置Zabbix服务器 1、确认记录相关信息 确认已经获取到告警组用户的账号,企业 CorpID 和 创建应用 2、修改zabbix.conf [root...59 wechat [root@zabbix-server alertscripts]# 4、执行脚本进行测试 Zabbix企业微信告警最新版 (qq.com) /etc/zabbix/alertscripts.../wechat --help 查看帮助命令 4、在zabbix web页面页面配置告警信息 管理—报警媒介类型—创建告警媒介 填写报警媒介信息 --corpid= --corpsecret= --...agentid= --user={ALERT.SENDTO} --msg={ALERT.MESSAGE} 授权终端接收用户 测试报警是否生效 设置告警动作 故障告警:{TRIGGER.STATUS...}:{TRIGGER.NAME} 告警主机:{HOST.NAME} 主机地址:{HOST.IP} 告警时间:{EVENT.DATE} {EVENT.TIME} 告警等级:{TRIGGER.SEVERITY

    97330

    zabbix告警系统--文末彩蛋

    zabbix安装和配置非常简单,学习成本低,但是zabbix告警却是很烦人的,而且关于告警的中文翻译资料非常少....在zabbix里面,告警通道配置太繁琐,我们分别来分析下: 邮件报警: 如需配置邮件报警,就得在Zabbix里配置邮件调用接口。...并且Zabbix邮件报警经常发生延迟(Zabbix自身延迟+邮件服务商延迟),更悲催的是,报警邮件往往没人看.既然看邮件不方便,我们就考虑短信报警 短信报警: 如果配置短信报警,就需要向服务商购买短信服务...需要设定短信末班,在zabbix配置短信调用接口,而且还要避免某个短信服务商延迟和漏发 电话报警: 这个是最坑的,在半夜三更把运维人员从睡梦中弄醒,及时解决紧急故障,比起短信来,电话的提醒效果会更好...无论是邮件报警、短信报警或微信报警,都会存在告警风暴的问题:如果发现类似断网等大面积故障,而且没有告警保护和收敛机制的话,那电话响一个小时的事情是常有的,更不用说说不清的报警邮件,以及让人疯掉的短信.

    1.8K30

    024.Zabbix告警等级机制

    一 等级告警 告警升级可以对告警结果按自定义的时间段进行进行消息发送,并执行命令,形成一个梯度的告警处理。 二 按时间自定义告警梯度 2.1 添加时间发生的时间戳和发送时间 ?...用户MySQL Administration每隔半小时发送一次告警; 用户Database manager在事件发生后的两小时发送告警信息; 在2小时30分钟,执行远程重启MySQL命令; 在3小时候,...机执行远程命令后并未解决问题,发送告警小西给用户Guests; 在4小时候,通过IPMI对机器执行远程重启命令。...三 告警故障排查思路 告警脚本权限、告警账户是否配置正确; 用户对方发送告警信息的机器是否具有可读写权限; 告警信息的接收方是否解决接受告警信息,是否被屏蔽; 告警配置是否正确,是否达到触发器设置的阀值

    1.2K20
    领券