全面的监控指标是您洞察数据库运行状况的“感知系统”。通过实时追踪各项性能数据,您不仅可以掌握全局资源消耗与健康度,还能快速定位性能瓶颈、追溯异常根因,并为容量规划与风险预警提供关键依据。监控体系支持从实例整体到内部节点(如 Mongod、Mongos)的下钻分析。您既可以纵览实例的综合运行状态,也能深入探查任一节点的详细性能指标,精准运维。
实例
监控类别 | 监控指标中文名称 | 监控指标英文名称 | 单位 | 指标说明 |
CPU 监控 | Mongod 最大 CPU 使用率 | mongod_max_cpu_usage | % | 集群所有 Mongod 节点最大的 CPU 使用率。 |
| Mongod 平均 CPU 使用率 | monogd_avg_cpu_usage | % | 集群所有 Mongod 节点 CPU 使用率取平均值。 |
| Mongos 最大 CPU 使用率 | monogs_max_cpu_usage | % | 分片集群所有 Mongos 节点最大的 CPU 使用率。 |
| Mongos 平均 CPU 使用率 | monogs_avg_cpu_usage | % | 分片集群所有 Mongos 节点 CPU 使用率取平均值。 |
内存监控 | Mongod 最大内存使用率 | mongod_max_mem_usage | % | 集群所有 Mongod 节点最大的内存使用率。 |
| Mongod 平均内存使用率 | mongod_avg_mem_usage | % | 集群所有 Mongod 节点内存使用率取平均值。 |
| Mongos 最大内存使用率 | mongos_max_mem_usage | % | 分片集群所有 Mongos 节点最大的内存使用率。 |
| Mongos 平均内存使用率 | mongos_avg_mem_usage | % | 分片集群所有 Mongos 节点内存使用率取平均值。 |
磁盘监控 | 磁盘空间利用率 | disk_usage | % | 实际磁盘使用量与申请的磁盘空间的占比。 |
网络监控 | 连接数量 | cluster_conn | 个 | 连接到实例的 TCP 连接数量。 |
| 连接百分比 | connper | % | 当前集群的连接数量与最大连接数的比例。 |
| 入流量 | cluster_view | Bytes | 集群的入流量字节数统计。 |
| 出流量 | cluster_netout | Bytes | 集群的出流量字节数统计。 |
时延监控 | 所有请求平均时延 | avg_all_request_delay | ms | 集群所有请求执行的平均时延。 |
| 更新平均延迟 | avg_update_delay | ms | 集群更新请求的平均时延。 |
| 插入平均延迟 | avg_insert_delay | ms | 集群插入请求的平均时延。 |
| 读平均时延 | avg_read_delay | ms | 集群读请求的平均时延。 |
| 聚合请求平均时延 | avg_aggregate_delay | ms | 集群聚合请求的平均时延。 |
| Count 的平均延迟 | avg_count_delay | ms | 集群 Count 请求的平均时延。 Count 用于统计集合中满足指定条件的文档数量。 |
| Getmore 平均延迟 | avg_getmore_delay | ms | 集群 Getmore 请求的平均时延。 |
| 删除平均延迟 | avg_delete_delay | ms | 集群删除请求的平均时延。 |
| Command 平均时延 | avg_command_delay | ms | 集群 Command 请求的平均时延。Command 为除 insert、update、delete、query 以外命令的总称。 |
| 10毫秒 - 50毫秒 | 10ms | 次 | 执行时间在10毫秒和50毫秒之间的请求次数。 |
| 50毫秒 - 100毫秒 | 50ms | 次 | 执行时间在50毫秒和100毫秒之间的请求次数。 |
| 100毫秒 | 100ms | 次 | 执行时间超过100毫秒的请求次数。 |
请求监控 | 总请求量 | success_per_second | 次/秒 | 集群每秒所有请求执行成功的次数。 |
| 插入请求 | insert_per_second | 次/秒 | 集群每秒插入请求执行次数。插入请求是按实际插入行数统计,例如 insertMany() 实际插入10条记录,则监控会统计10次插入请求。 |
| 读请求 | read_per_second | 次/秒 | 集群每秒读请求执行次数。 |
| 更新请求 | update_per_second | 次/秒 | 集群每秒更新请求执行次数。 |
| 删除请求 | delete_per_second | 次/秒 | 集群每秒删除请求执行次数。 |
| count 请求 | count_per_second | 次/秒 | 集群每秒收到的 Count 请求的次数。 |
| Getmore 请求 | getmore_per_second | 次/秒 | 集群每秒收到的 Getmore 请求的次数。 |
| Aggregates 请求 | aggregate_per_second | 次/秒 | 集群每秒聚合请求的次数。 |
| Command 请求 | command_per_second | 次/秒 | 集群每秒收到的 Command 请求的次数。Command 为除 insert、update、delete、query 以外命令的总称。 |
请求量 | 总请求量 | node_success | 次 | 集群所有请求的次数。 |
| 插入请求 | node_inserts | 次 | 集群收到的插入请求的次数。 说明: 对 MongoDB 4.4(WT.44.13.1)及以上版本实例,插入请求是按实际插入行数统计,例如 insertMany() 实际插入10条记录,则监控会统计10次插入请求。 |
| 读请求 | node_reads | 次 | 集群收到的读请求的次数。 |
| 更新请求 | node_updates | 次 | 集群更新请求的次数。 |
| 删除请求 | node_deletes | 次 | 集群删除请求的次数。 |
| count 请求 | node_counts | 次 | 集群收到的 Count 请求的次数。 |
| Getmore 请求 | node_getmores | 次 | 集群收到的 Getmore 请求的次数。 |
| Aggregates 请求 | node_aggregates | 次 | 集群聚合所有请求的次数。 |
| Command 请求 | node_commands | 次 | 集群收到的 Command 请求的次数。Command 为除 insert、update、delete、query 以外命令的总称。 |
Mongod 节点
监控维度 | 监控指标中文名称 | 监控指标英文名称 | 单位 | 指标说明 |
CPU 监控 | CPU 使用率 | cpuusage | % | Mongod 节点 CPU 正在执行进程所占用的时间占 CPU 总时间的百分比。 |
内存监控 | 内存使用率 | memusage | % | Mongod 节点的内存中已被使用的空间占内存总容量的百分比。 |
磁盘监控 | 磁盘空间使用量 | diskusage | MBytes | Mongod 节点当前磁盘已被使用的空间占总空间的百分比。 |
| 磁盘读次数 | ioread | 次/秒 | Mongod 节点磁盘每秒读的次数。 |
| 磁盘写次数 | iowrite | 次/秒 | Mongod 节点磁盘每秒写的次数。 |
网络监控 | 入流量 | netin | Bytes | Mongod 节点入流量字节数统计。 |
| 出流量 | netout | Bytes | Mongod 节点的出流量字节数统计。 |
请求平均延迟监控 | 所有请求平均时延 | node_avg_all_requests_delay | ms | Mongod 节点收到的所有请求平均时延。 |
| 更新平均延迟 | node_avg_update_delay | ms | Mongod 节点 update 请求时延平均值。 |
| 插入平均延迟 | node_avg_insert_delay | ms | Mongod 节点 insert 请求时延平均值。 |
| 读平均时延 | node_avg_read_delay | ms | Mongod 节点读请求时延平均值。 |
| 聚合请求平均时延 | node_avg_aggregate_delay | ms | Mongod 节点聚合请求时延平均值。 |
| Count 的平均延迟 | node_avg_count_delay | ms | Mongod 节点 Count 请求时延平均值。 |
| Getmore 平均延迟 | node_avg_getmore_delay | ms | Mongod 节点 Getmore 请求时延平均值。 |
| 删除平均延迟 | node_avg_delete_delay | ms | Mongod 节点删除请求时延平均值。 |
| Command 平均时延 | node_avg_command_delay | ms | Mongod 节点 Command 请求时延平均值。 |
| 10-50毫秒 | 10ms | 次 | 执行时间在10毫秒和50毫秒之间的请求次数。 |
| 50-100毫秒 | 50ms | 次 | 执行时间在50毫秒和100毫秒之间的请求次数。 |
| 100毫秒 | 100ms | 次 | 执行时间超过100毫秒的请求次数。 |
请求监控 | 总请求 | node_success_per_second | 次/秒 | Mongod 节点每秒所有请求的次数。 |
| 插入请求 | node_insert_per_second | 次/秒 | Mongod 节点每秒插入请求的次数。插入请求是按实际插入行数统计,例如 insertMany() 实际插入10条记录,则监控会统计10次插入请求。 |
| 读请求 | node_read_per_second | 次/秒 | Mongod 节点每秒读请求的次数。 |
| 更新请求 | node_update_per_second | 次/秒 | Mongod 节点每秒更新请求的次数。 |
| 删除请求 | node_delete_per_second | 次/秒 | Mongod 节点每秒删除请求的次数。 |
| Count 请求 | node_count_per_second | 次/秒 | Mongod 节点每秒收到的 Count 请求的次数。 |
| Getmore 请求 | node_getmore_per_second | 次/秒 | Mongod 节点每秒收到的 Getmore 请求的次数。 |
| Aggregates 请求 | node_aggregate_per_second | 次/秒 | Mongod 节点每秒聚合请求的次数。 |
| Command 请求 | node_command_per_second | 次/秒 | Mongod 节点每秒收到的 Command 请求的次数。Command 为除 insert、update、delete、query 以外命令的总称 |
内核监控 | 活跃写请求 | aw | 个 | Mongod 节点数据在内存中被写请求的个数。 |
| 活跃读请求 | ar | 个 | Mongod 节点数据在内存中被读请求的个数。 |
| 排队读请求 | qr | 个 | 队列中 Read 请求的等待个数。 |
| 排队写请求 | qw | 个 | 队列中 Write 请求的等待个数。 |
| TTL 删除数据条数 | ttl_deleted | 次 | 在 TTL 过期后,数据库自动删除的数据条数。 |
| TTL 发起次数 | ttl_pass | 次 | 指在数据库中设置的 TTL 时间内,数据被检查的次数。 |
| 活跃 session 数量 | active_session | 个 | Session 表示客户端与服务器之间的一次会话。在客户端与服务器建立连接后,可以通过创建一个 session 来进行数据的读写操作。当 session 被创建后,它会一直保持活跃状态,直到客户端主动关闭连接或者超时断开连接。该指标监控当前 Mongod 节点活跃的 session 数量。 |
| Oplog 保存时长 | node_oplog_reserved_time | 小时 | Oplog 用于记录数据库的操作日志,该指标统计其保存时长。 |
| 主从延迟 | node_slavedelay | 秒 | 从节点定期轮询主节点的 oplog(操作日志)来复制 Primary 节点的数据,该指标统计主从同步数据的时延。 |
| Cache 命中率 | hit_ratio | % | 当前集群 Cache 的命中率。 |
| Cache 使用百分比 | node_cache_used | % | Cache 使用量占总量的百分比。 |
| Cache 脏数据百分比 | node_cache_dirty | % | Cache 脏数据占总量的百分比。 |
请求量 | 总请求量 | node_success | 次 | 集群总请求次数。 |
| 插入请求量 | node_inserts | 次 | 集群插入请求的次数。 说明: 对 MongoDB 4.4(WT.44.13.1)及以上版本实例,插入请求是按实际插入行数统计,例如 insertMany() 实际插入10条记录,则监控会统计10次插入请求。 |
| 读请求量 | node_reads | 次 | 集群读请求的次数。 |
| 更新请求量 | node_updates | 次 | 集群更新请求的次数。 |
| 删除请求量 | node_deletes | 次 | 集群删除请求的次数。 |
| Count 请求量 | node_counts | 次 | 集群收到的 Count 请求的次数。 |
| Getmore 请求量 | node_getmores | 次 | 集群收到的 Getmore 请求的次数。 |
| Aggregates 请求量 | node_aggregates | 次 | 集群聚合请求的次数。 |
| Command 请求量 | node_commands | 次 | 集群收到的 Command 请求的次数。Command 为除 insert、update、delete、query 以外命令的总称。 |
Mongos 节点(分片集群)
监控维度 | 监控指标中文名称 | 监控指标英文名称 | 单位 | 指标说明 |
CPU 监控 | CPU 使用率 | cpuusage | % | Mongos节点的 CPU 使用率。 |
内存监控 | 内存使用率 | memusage | % | Mongos 节点的内存使用率。 |
网络监控 | 内网入流量 | netin | Bytes | Mongos 节点入流量字节数统计。 |
| 内网出流量 | netout | Bytes | Mongos 节点的出流量字节数统计。 |
时延监控 | 所有请求平均时延 | node_avg_all_request_delay | ms | Mongos 节点收到的所有请求平均时延。 |
| 更新平均延迟 | node_avg_update_delay | ms | Mongos 节点更新命令时延平均值。 |
| 插入平均延迟 | replicaset_node | ms | Mongos 节点插入命令时延平均值。 |
| 读平均时延 | node_avg_read_delay | ms | Mongos 节点读命令时延平均值。 |
| 聚合请求平均时延 | node_avg_aggregate_delay | ms | Mongos 节点 aggregate 命令时延平均值。 |
| Count 的平均延迟 | node_avg_count_delay | ms | Mongos 节点 Count 命令时延平均值。 |
| Getmore 平均延迟 | node_avg_getmore_delay | ms | Mongos 节点 Getmore 命令时延平均值。 |
| 删除平均延迟 | node_avg_delete_delay | ms | Mongos 节点删除命令时延平均值。 |
| Command 平均时延 | node_avg_command_delay | ms | Mongos 节点 Command 命令时延平均值。Command 为除 insert、update、delete、query 以外命令的总称。 |
| 10-50毫秒 | 10ms | 次 | 执行时间在10毫秒和50毫秒之间每秒请求次数。 |
| 50-100毫秒 | 50ms | 次 | 执行时间在50毫秒和100毫秒之间每秒请求次数。 |
| 100毫秒 | 100ms | 次 | 执行时间超过100毫秒每秒请求次数。 |
请求监控 | 总请求 | qps | 次/秒 | Mongos 节点每秒所有请求的次数。 |
| 插入请求 | inserts | 次/秒 | Mongos 节点每秒插入请求的次数。 说明: 对 MongoDB 4.4(WT.44.13.1)及以上版本实例,插入请求是按实际插入行数统计,例如 insertMany() 实际插入10条记录,则监控会统计10次插入请求。 |
| 读请求 | reads | 次/秒 | Mongos 节点每秒读请求的次数。 |
| 更新请求 | updates | 次/秒 | Mongos 节点每秒更新请求的次数。 |
| 删除请求 | deletes | 次/秒 | Mongos 节点每秒删除请求的次数。 |
| Count 请求 | counts | 次/秒 | Mongos 节点每秒收到的 Count 请求的次数。 |
| Getmore 请求 | getmores | 次/秒 | Mongos 节点每秒收到的 Getmore 请求的次数。 |
| Aggregates 请求 | aggregates | 次/秒 | Mongos 节点每秒聚合请求的次数。 |
| Command 请求 | commands | 次/秒 | Mongos 节点每秒收到的 Command 请求的次数。Command 为除 insert、update、delete、query 以外命令的总称。 |
请求量 | 总请求量 | node_success | 次 | Mongos 节点收到的总请求次数。 |
| 插入请求量 | node_inserts | 次 | Mongos 节点收到的插入请求的次数。插入请求是按实际插入行数统计,例如 insertMany() 实际插入10条记录,则监控会统计10次插入请求。 |
| 读请求量 | node_reads | 次 | Mongos 节点收到的读请求的次数。 |
| 更新请求量 | node_updates | 次 | Mongos 节点收到的更新请求的次数。 |
| 删除请求量 | node_deletes | 次 | Mongos 节点收到的删除请求的次数。 |
| Count 请求量 | node_counts | 次 | Mongos 节点收到的 Count 请求的次数。 |
| Getmore 请求量 | node_getmores | 次 | Mongos节点收到的 Getmore 请求的次数。 |
| Aggregates 请求量 | node_aggregates | 次 | Mongos 节点收到的聚合请求的次数。 |
| Command 请求量 | node_commands | 次 | Mongos 节点收到的 Command 请求的次数。Command 为除 insert、update、delete、query 以外命令的总称。 |