前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >08 Mar 2022 用于监控pod的alerts

08 Mar 2022 用于监控pod的alerts

作者头像
俊采
发布2023-10-17 10:29:04
1550
发布2023-10-17 10:29:04
举报
文章被收录于专栏:LEo的网络日志LEo的网络日志

最近需要使用prometheus监控kubernetes环境下的一些pod状态,定义了一些alert,分享一下:

  • PodRestartingTooMuch:pod重启次数过多,重启次数大于10
代码语言:javascript
复制
sum(kube_pod_container_status_restarts_total{namespace="your_service_ns"}) by (cluster, namespace, pod, container) > 10
  • PodFrequentlyRestarting:pod频繁重启,1分钟之内重启了3次
代码语言:javascript
复制
increase(kube_pod_container_status_restarts_total{namespace="your_service_ns"}[1m]) > 3
  • PodContainerTerminated:pod出于退出状态,比如因为OOM、错误退出和不能正常运行
代码语言:javascript
复制
kube_pod_container_status_terminated_reason{reason=~"OOMKilled|Error|ContainerCannotRun", namespace="your_service_ns"} > 0
  • PodNotReady:pod未处于ready状态,15分钟之内pod没有ready
代码语言:javascript
复制
min_over_time(sum by (cluster, namespace, pod, container) (kube_pod_status_phase{phase=~"Pending|Unknown|Failed",namespace="your_service_ns"})[15m:1m]) > 0
  • DeploymentReplicasMismatch:deployment未按预期replicas运行
代码语言:javascript
复制
kube_deployment_status_replicas_available{namespace="your_service_ns"} != kube_deployment_spec_replicas{namespace="your_service_ns"}
  • StatefulSetReplicasMismatch:statefulset未按预期replicas运行
代码语言:javascript
复制
kube_statefulset_status_replicas_available{namespace="your_service_ns"} != kube_statefulset_replicas{namespace="your_service_ns"}

LEo at 00:12

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档