容器场景监控

最近更新时间:2024-11-06 18:22:52

我的收藏

实践背景

众所周知,Prometheus 是容器场景的最佳监控工具,但自建 Prometheus 对于运维人力有限的中小型企业而言,成本太高;对于业务发展快速的大企业又容易出现性能瓶颈。因而使用云上托管 Prometheus 已成为越来越多上云企业的第一选择。那我们该如何使用托管 Prometheus 监控 腾讯云容器服务(TKE)

实践步骤

步骤1:购买实例

2. 单击新建 ,根据您的需求选择购买地域、存储时长并选择需要关联的 Grafana 实例,若无 Grafana 实例,可参见 相关操作指引 创建(需创建实例并完成购买)。
3. 完成后,单击立即购买即可。详细计费规则请查看 计费规则

步骤2:集成容器服务

1. 新建完实例后,在实例列表中单击对应的实例 ID/名称,进入实例详情页面。
2. 在顶部导航栏中单击数据采集 > 集成容器服务 > 关联集群
3. 在弹窗中选择需要关联的集群,共支持接入4种集群类型(标准集群、弹性集群、注册集群、边缘集群),同时支持集群跨 VPC,不同 VPC 网络不互通的情况需要勾选创建公网 CLB。



4. 关联集群后,可以点击已关联集群列表页中操作列数据采集配置,进入数据采集配置页面,再点击基础监控操作列的指标详情,查看默认采集的免费基础指标,同时可以调整新增或减少采集指标。




步骤3:Grafana 查看监控数据

1. 在实例列表中单击实例名称右侧的 Grafana 图标,进入 Grafana 服务平台。
2. 在 Grafana 服务平台 > Dashboard 搜索列表,默认预设了容器相关的监控面板,单击某个面板名称。



进入面板页面,可以查看预设好的监控数据图表。




步骤4:配置告警策略

在实例列表中,选择对应的 Prometheus 实例,单击顶部菜单栏的告警管理,进入告警策略页面,单击新建告警策略,详情请参见 新建告警策略