本文档介绍 TKE Serverless 集群提供的集群、工作负载、Pod、Container 4个层面的监控数据收集和展示功能。
前提条件
操作步骤
1. 登录容器服务控制台 ,选择左侧导航栏中的 集群。
2. 在集群管理页面,选择 Serverless 集群 ID。
3. 在集群资源管理页面,参考以下文档查看监控及设置告警:
查看监控数据
设置告警
监控及告警指标列表
监控
目前 TKE Serverless 集群提供了以下维度的监控指标,所有指标均为统计周期内的平均值。
集群监控指标
指标 | 单位 | 说明 |
CPU 使用量 | 核 | 集群当前所有运行中 Pod 使用的 CPU 规模 |
内存使用量 | B | 集群当前所有运行中 Pod 使用的内存规模 |
工作负载监控指标
指标 | 单位 | 说明 |
Pod 重启次数 | 次 | 工作负载内所有 Pod 的重启次数之和 |
CPU 使用量 | 核 | 工作负载内所有 Pod 的 CPU 使用量 |
CPU 利用率(占 Pod 规格) | % | 工作负载内所有 Pod 的 CPU 使用量占分配资源总量之比 |
内存使用量 | B | 工作负载内所有 Pod 的内存使用量 |
内存利用率(占 Pod 规格) | % | 工作负载内所有 Pod 的内存使用量占分配资源总量之比 |
Pod 监控指标
指标 | 单位 | 说明 |
异常状态 | - | Pod 的状态,正常或异常 |
CPU 使用量 | 核 | Pod 的 CPU 使用量 |
CPU 利用率(占 Request) | % | Pod 的 CPU 使用量和设置的 Request 值之比 |
CPU 利用率(占 Limit) | % | Pod 的 CPU 使用量和设置的 Limit 值之比 |
CPU 利用率(占 Pod 规格) | % | Pod 的 CPU 使用量占 Pod 分配总量之比 |
内存使用量 | B | Pod 的内存使用量,含缓存 |
内存利用率(占 Request) | % | Pod 的内存使用量和设置的 Request 值之比 |
内存利用率(占 Limit) | % | Pod 的内存使用量和设置的 Limit 值之比 |
内存利用率(占 Pod 规格) | % | Pod 的内存使用量占 Pod 分配总量之比 |
Container 监控指标
指标 | 单位 | 说明 |
CPU 使用量 | 核 | Container 的 CPU 使用量 |
CPU 利用率(占 Request) | % | Container 的 CPU 使用量和设置的 Request 值之比 |
CPU 利用率(占 Limit) | % | Container 的 CPU 使用量和设置的 Limit 值之比 |
内存使用量 | B | Container 的内存使用量,含缓存 |
内存利用率(占 Request) | % | Container 的内存使用量和设置的 Request 值之比 |
内存利用率(占 Limit) | % | Container 的内存使用量和设置的 Limit 值之比 |
告警
目前 TKE Serverless 集群提供了以下维度的告警指标,所有指标均为统计周期内的平均值。
Pod 告警指标
指标 | 单位 | 说明 |
CPU 利用率(占 Pod 规格) | % | Pod 的 CPU 使用量占 Pod 分配总量之比 |
内存利用率(占 Pod 规格) | % | Pod 的内存使用量占 Pod 分配总量之比 |
CPU 利用率(占 Request) | % | Pod 的 CPU 使用量和设置的 Request 值之比 |
内存利用率(占 Request) | % | Pod 的内存使用量和设置的 Request 值之比 |
CPU 利用率(占 Limit) | % | Pod 的 CPU 使用量和设置的 Limit 值之比 |
内存利用率(占 Limit) | % | Pod 的内存使用量和设置的 Limit 值之比 |
Pod 重启次数 | 次 | Pod 的重启次数 |
Pod Ready | - | Pod 的状态,默认 False 时告警 |
CPU 使用量 | 核 | Pod 的 CPU 使用量 |
内存使用量 | MB | Pod 的内存使用量,含缓存 |