功能描述
性能趋势实时监控 Redis 数据库实例、Redis 节点以及 Proxy 节点关键性能指标,包括:CPU、内存、Key 信息、网络使用量、网络使用率、请求、响应等,秒级监控数据采集粒度,以图形化方式动态展示各个指标的变化趋势,以表格形式统计各个指标的最大值、最小值及平均值,多节点指标对比查看、不同时间段指标对比分析,随意调大拖动监控视图。
其强大的数据统计分析能力,丰富多样的展示方式,极高的实时性,可满足数据库实例日常运维、异常定位的各种场景,帮助运维人员快速地掌握数据库性能状况的全貌,及时预防风险。
支持的性能指标
DBbrain 当前支持的腾讯云 Redis 数据库性能指标监控如下:
类别 | 类别子项 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
实例 | CPU | CPU 使用率 | cpu_util | % | 平均 CPU 使用率 |
| | 节点最大 CPU 使用率 | cpu_max_util | % | 实例中节点(分片或者副本)最大 CPU 使用率 |
| 内存信息 | 内存使用量 | mem_used | MB | 实际使用内存容量,包含数据和缓存部分 |
| | 内存使用率 | mem_util | % | 实际使用内存和申请总内存之比 |
| | 节点最大内存使用率 | mem_max_util | % | 实例中节点(分片或者副本)最大内存使用率 |
| 时延 | 平均执行时延 | latency_avg | ms | Proxy 到 Redis Server 的执行时延平均值 |
| | 最大执行时延 | latency_max | ms | Proxy 到 Redis Server 的执行时延最大值 |
| | P99 执行时延 | latency_p99 | ms | Proxy 到 Redis Server 99%的执行时延 |
| | 读平均时延 | latency_read | ms | |
| | 写平均时延 | latency_write | ms | |
| | 其他命令平均时延 | latency_other | ms | Proxy 到 Redis Server 的读写命令之外的命令平均执行时延 |
| Key 信息 | Key 总个数 | keys | 个 | 实例存储的总 Key 个数(一级 Key) |
| | Key 过期数 | expired | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys |
| | Key 驱逐数 | evicted | 个 | 时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys |
| 网络使用量 | 连接数 | connections | 个 | 连接到实例的 TCP 连接数量 |
| | 入流量 | in_flow | Mb/s | 内网入流量 |
| | 出流量 | out_flow | Mb/s | 内网出流量 |
| 网络使用率 | 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数比 |
| | 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量比 |
| | 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量比 |
| | 入流量限流触发 | in_flow_limit | 次 | 入流量超过最大带宽的次数 |
| | 出流量限流触发 | out_flow_limit | 次 | 出流量超过最大带宽的次数 |
| 请求 | 总请求 | cpu_util | % | 平均 CPU 使用率 |
| | 读请求 | cpu_max_util | % | 实例中节点(分片或者副本)最大 CPU 使用率 |
| | 写请求 | cmd_write | 次/秒 | 每秒写命令执行次数 |
| | 其他请求 | cmd_other | 次/秒 | 每秒读写命令之外的命令执行次数 |
| | 大 Value 请求 | cmd_big_value | 次/秒 | 每秒请求命令大小超过32KB的执行次数 |
| | Key 请求数 | cmd_key_count | 次/秒 | 每秒请求 Key 数量 |
| | Mget 请求数 | cmd_cmget | 次/秒 | 每秒通过 Mget 请求的数量 |
| 响应 | 慢查询 | cmd_slow | 次 | 执行时延大于 slowlog - log - slower - than 配置的命令次数 |
| | 读请求命中 | cmd_hits | 次 | 读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标 |
| | 读请求 Miss | cmd_miss | 次 | 读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标 |
| | 读请求命中率 | cmd_hits_ratio | % | Key 命中 / (Key 命中 + KeyMiss),该指标可以反应 Cache Miss 的情况,当访问为0时,该值为 null |
| 执行错误 | 执行错误 | cmd_err | 次 | 命令执行错误的次数,例如命令不存在、参数错误等情况 |
Redis 节点 | CPU | CPU 使用率 | cpu_util | % | 平均 CPU 使用率 |
| 内存信息 | 内存使用量 | mem_used | MB | 实际使用内存容量,包含数据和缓存部分 |
| | 内存使用率 | mem_util | % | 实际使用内存和申请总内存之比 |
| Key 信息 | Key 总个数 | keys | 个 | 实例存储的总 Key 个数(一级 Key) |
| | Key 过期数 | expired | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys |
| | Key 驱逐数 | evicted | 个 | 时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys |
| 复制延迟 | 复制延迟 | repl_delay | Byte | 副本节点的相对主节点命令延迟长度 |
| 网络使用量 | 连接数 | connections | 个 | Proxy 连接到节点的连接数 |
| | 连接使用率 | connections_util | % | 节点连接数使用率 |
| 请求 | 总请求 | commands | 次/秒 | QPS,命令执行次数 |
| | 读请求 | cmd_read | 次/秒 | |
| | 写请求 | cmd_write | 次/秒 | |
| | 其他请求 | cmd_other | 次/秒 | 读写命令之外的命令执行次数 |
| 响应 | 慢查询 | cmd_slow | 次 | 执行时延大于 slowlog-log-slower-than 配置的命令次数 |
| | 读请求命中 | cmd_hits | 次 | 读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标 |
| | 读请求 Miss | cmd_miss | 次 | 读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标 |
| | 读请求命中率 | cmd_hits_ratio | % | Key 命中 / (Key命中 + KeyMiss),该指标可以反应 Cache Miss 的情况 |
Proxy 节点 | CPU | CPU 使用率 | cpu_util | % | Proxy CPU 使用率 |
| 流量 | 入流量 | in_flow | Mb/s | 内网入流量 |
| | 出流量 | out_flow | Mb/s | 内网出流量 |
| 请求 | 总请求 | proxy_commands | 次/秒 | Proxy 执行的命令数 |
| | Key 请求数 | cmd_key_count | 个/秒 | 命令访问的 Key 个数 |
| | Mget 请求数 | cmd_mget | 次/秒 | Mget 命令执行次数 |
| | 执行错误 | cmd_err | 次/秒 | Proxy 命令执行错误的次数,例如,命令不存在、参数错误等情况 |
| | 大 Value 请求 | cmd_big_value | 次/秒 | 请求命令大小超过32KB的执行次数 |
| 网络使用量 | 连接数 | connections | 个 | 连接到实例的 TCP 连接数量 |
| | 每秒建连数 | client_connections_received_per_second | 个 | 每秒建立的 TCP 连接的数量 |
| | 每秒断连数 | client_connections_closed_per_second | 个 | 每秒断开的 TCP 连接的数量 |
| | 每秒异常断连数 | client_connections_aborted_per_second | 个 | 每秒异常断开的 TCP 连接的数量 |
| 网络使用率 | 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数比 |
| | 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量比 |
| | 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量比 |
| | 入流量限流触发 | in_flow_limit | 次 | 入流量触发限流的次数 |
| | 出流量限流触发 | out_flow_limit | 次 | 出流量触发限流的次数 |
| 时延 | 平均执行时延 | latency_avg | ms | Proxy 到 Redis Server 的执行时延平均值 |
| | 最大执行时延 | latency_max | ms | Proxy 到 Redis Server 的执行时延最大值 |
| | P99 执行时延 | latency_p99 | ms | Proxy 到 Redis Server 99%的执行时延 |
| | 读平均时延 | latency_read | ms | |
| | 写平均时延 | latency_write | ms | |
| | 其他命令平均时延 | latency_other | ms | Proxy 到 Redis Server 的读写命令之外的命令平均执行时延 |
查看性能趋势
步骤1:选择监控维度
1. 登录 DBbrain 控制台。
2. 在左侧导航栏,选择诊断优化。
3. 在上方选择 Redis 数据库类型及实例 ID,选择性能趋势页签。
4. 选择待查看的监控维度。
监控维度支持 Redis 实例监控、Redis 节点监控、Proxy 节点监控。
实例:展现整个实例的监控视图,支持查看实时和历史数据。
Redis 节点:支持查看单节点的监控指标,也支持展示节点间各指标的趋势对比查看。多 Redis 节点性能趋势对比查看请参见 多节点性能对比。
Proxy 节点:展现各个 Proxy 里,有相关性的指标对比趋势查看。当选择 Proxy 节点维度时,支持选择聚合视图和节点视图模式下的实时和历史数据。
聚合视图模式中,显示所有 Proxy 节点信息,需要在左上方选择具体查看的指标,然后展示所有节点的单个指标信息。单击每个指标的详情可以跳转到节点视图。
节点视图模式中,展示单个节点的所有监控指标信息。
步骤2:选择监控指标
1. 单击指标下拉框,勾选性能指标,也可在右上方快捷选择全选或全不选,选择指标后,单击保存。
步骤3:查看性能趋势监控视图
根据以上步骤设置的查看条件,查看性能趋势监控视图。
还支持通过以下方式查看性能趋势监控视图。
切换实时或历史视图
1. 单击实时或历史,查看对应的实时性能趋势和历史性能趋势。
实时性能趋势视图:用户可以查看实例的性能趋势状况,默认开启自动刷新,刷新频率为5秒,支持选择5秒、10秒、15秒,并支持关闭自动刷新按钮。
历史性能趋势视图:选择不同的时间段,会显示所选时间段内的性能趋势监控视图,支持近1小时、近3小时、近24小时、近7天以及自定义时间的切换查看。
单击添加时间对比,选定所关注的对比时间段,可以查看多性能指标趋势的时间对比。
多节点性能指标对比
目前仅支持对监控维度为 Redis 节点的多节点性能指标对比。
1. 在页面上方单击多节点性能对比。
2. 在右侧弹框单击新建多节点性能对比,选择类型、监控时间和监控项,单击确定。
3. 在右侧弹框中单击查看。
4. 查看生成的全节点对比图。
开启图表联动
单击页面右侧的图表联动按钮,可以查看多指标监控视图的关联对比。鼠标悬停至任一监控图上的数据点,其他监控视图会显示同一个时间的数据。单击后可固定数据显示,如需取消固定,单击撤销固定即可。
以图表形式展示监控指标数据
在页面右侧单击显示统计分析,全局指标监控图中下方以表格形式展示每一个监控指标最大值、最小值、平均值的统计数据。
在单个指标监控图右上方单击
,以表格形式展示该监控指标最大值、最小值、平均值的统计数据。自定义监控指标对比分析
在任一监控视图右上方,单击
,可添加其他类型的监控指标项进行对比查看分析。
切换监控视图单列/双列显示模式。
单击右上角的图表联动右侧的
,可切换单列模式和双列模式的显示。单列模式请参见下图。
自由拖动监控视图位置
监控视图之间可以随意拖动,鼠标单击监控图的边框部位即可拖动。您可根据运维场景灵活调整监控视图的先后顺序,便于高效查看分析。
细粒度查看监控图
在单个监控图中拖动鼠标选择待放大的时间段,细粒度展示该时间段的趋势图。单击重置可恢复。
放大监控视图
拖动任一监控图右下方的图标,可以任意拉伸放大图片,便于更加清晰地投放展示指标的变化趋势图。