Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【YashanDB监控运维平台(YCM)】监控指标

【YashanDB监控运维平台(YCM)】监控指标

原创
作者头像
用户11441800
发布于 2025-06-25 08:35:51
发布于 2025-06-25 08:35:51
990
举报

网页路径:【资源监控】>【监控指标库】

supervisionindex
supervisionindex

功能介绍

管理平台提供了丰富的监控指标库,覆盖了数据库、操作系统和服务器的绝大部分关键指标,可以帮助您实时了解目标对象的运行状态、性能、资源用量以及负载等。同时,为日常运维、性能调优等提供丰富的数据基础,助力于及时预防、发现并解决问题,避免问题扩大而产生业务影响。

默认监控指标

系统提供了丰富的默认监控指标,默认监控指标不支持编辑和删除。系统提供的默认监控指标如下表所示:

指标名称

指标类型

表达式

YashanDB高频SQL数量

YashanDB

count(increase(yashandb_high_frequencies_sql[1h])>10000)by(yasdbName,nodeId)

YashanDB锁等待数量

YashanDB

yashandb_lock_waits

YashanDB每秒执行事务数

YashanDB

irate(yashandb_transactions[1m])

YashanDB每秒执行查询数

YashanDB

irate(yashandb_querys[1m])

YashanDB每秒执行操作数

YashanDB

irate(yashandb_operations[1m])

YashanDB进程打开文件数

YashanDB

node_monit_file_open

YashanDB进程内存使用总量

YashanDB

node_monit_mem_total

YashanDB进程内存利用率

YashanDB

node_monit_mem_uasge

YashanDB进程CPU使用率

YashanDB

node_monit_cpu_uasge

YashanDB当前等待事件数量

YashanDB

yashandb_current_waits

YashanDB进程内存读取次数

YashanDB

yashandb_buffer_gets

YashanDB进程磁盘读取时间

YashanDB

yashandb_disk_read_time

YashanDB不活跃用户会话数量

YashanDB

yashandb_user_inactive_sessions

YashanDB活跃用户会话数量

YashanDB

yashandb_user_active_sessions

YashanDB系统会话数量

YashanDB

yashandb_system_sessions

YashanDB最大会话数量

YashanDB

yashandb_max_sessions

YashanDB当前会话数量

YashanDB

yashandb_current_sessions

YashanDB会话使用率

YashanDB

yashandb_current_sessions/yashandb_max_sessions*100

YashanDB表空间使用率

YashanDB

yashandb_tablespace_used_percentage

YashanDB版本检测

YashanDB

yashandb_instance_version

YashanDB数据库状态

YashanDB

yashandb_database_status

YashanDB实例连接状态

YashanDB

yashandb_instance_disconnected

YashanDB主库数量统计

YashanDB

count(yashandb_database_database_role{nodeType!="yascn"} == 1) by(yasdbName, nodeType, nodeGroup)

Yasdn进程启动用户检测

YashanDB

node_monit_check_user{nodeType="yasdn"}

Yascn进程启动用户检测

YashanDB

node_monit_check_user{nodeType="yascn"}

Yasmn进程启动用户检测

YashanDB

node_monit_check_user{nodeType="yasmn"}

YashanDB实例进程状态

YashanDB

node_monit_check_status{type="mix", processType="yasdb"}

YashanDB存在异常长事务

YashanDB

yashandb_alert_long_transactions

YashanDB主库与备库同步延迟过高

YashanDB

yashandb_sync_delay

YashanDB DN的max_workers小于所有CN的max_workers之和

YashanDB

yashandb_max_workers{nodeType="yasdn"} - on(yasdbName) group_left sum(yashandb_max_workers{nodeType="yascn"}) by (yasdbName)

YashanDB自选举发送心跳的周期配置

YashanDB

min(yashandb_ha_heartable_interval) by (yasdbName, nodeGroup, nodeType) - max(yashandb_ha_heartable_interval) by (yasdbName, nodeGroup, nodeType)

YashanDB自选举心跳超时时间配置

YashanDB

min(yashandb_ha_election_timeout) by (yasdbName, nodeGroup, nodeType) - max(yashandb_ha_election_timeout) by (yasdbName, nodeGroup, nodeType)

YashanDB自选举开关配置

YashanDB

min(yashandb_ha_election_enabled) by (yasdbName, nodeGroup, nodeType) - max(yashandb_ha_election_enabled) by (yasdbName, nodeGroup, nodeType)

YashanDB默认表类型

YashanDB

min(yashandb_default_table_type) by (yasdbName) - max(yashandb_default_table_type) by (yasdbName)

YashanDB表空间(UNDO)使用率

YashanDB

((yashandb_dba_tablespace_total_bytes - (yashandb_dba_tablespace_user_bytes+yashandb_dba_tablespace_block_size*(yashandb_undo_segments_ublk_count_total+yashandb_undo_segments_ufb_count_total)))/yashandb_dba_tablespace_max_size{name="UNDO"})*100

YashanDB表空间占用大小

YashanDB

yashandb_sum_tablespaces

YashanDB实例类型最小值

YashanDB

min(yashandb_database_database_role{nodeType!="yascn", yasdbType!="CE"}) by(yasdbName, nodeType, nodeGroup)

YashanDB超过三分钟的事务

YashanDB

yashandb_long_transactions

YashahDB主库与备库延迟

YashanDB

yashandb_sync_delay

YashanDB SQL平均响应时间

YashanDB

yashandb_avg_elapsed_time_sec

YashanDB进程缓存命中率

YashanDB

yashandb_cache_hit_ratio

YashanDB进程磁盘读取次数

YashanDB

yashandb_disk_reads

YashanDB审计日志

YashanDB

internal_yasdb_audit

慢SQL执行时间(秒)

YashanDB

internal_slow_sql_elapsed_time

存储过程慢SQL执行时间(秒)

YashanDB

internal_slow_procedure_elapsed_time

数据库升级失败

YashanDB

cluster_upgrade_failed

数据库回滚失败

YashanDB

cluster_rollback_failed

网络吞吐量(传输)

主机

irate(node_network_transmit_bytes_total[5m])/128/1024

网络吞吐量(接收)

主机

irate(node_network_receive_bytes_total[5m])/128/1024

磁盘IOPS(写)

主机

irate(node_disk_writes_completed_total[1m])

磁盘IOPS(读)

主机

irate(node_disk_reads_completed_total[1m])

交换分区使用率

主机

(1-(node_memory_SwapFree_bytes)/(node_memory_SwapTotal_bytes>0)) * 100

CPU平均负载

主机

node_load1

网络可用性检测

主机

node_network_unavailable

网络时延

主机

node_network_rtt

网络丢包率

主机

node_network_packet_loss

IP地址检测

主机

node_network_ip_exists

磁盘使用率

主机

max((node_filesystem_size_bytes{fstype=~'ext.?|xfs'}-node_filesystem_free_bytes{fstype=~'ext.?|xfs'})*100/(node_filesystem_avail_bytes {fstype=~'ext.?|xfs'}+(node_filesystem_size_bytes{fstype=~'ext.?|xfs'}-node_filesystem_free_bytes{fstype=~'ext.?|xfs'})))by(instance,job)

内存剩余容量

主机

node_memory_MemFree_bytes/1024/1024

内存使用率

主机

(1-(node_memory_MemAvailable_bytes) / node_memory_MemTotal_bytes) * 100

Ycm-Agent进程启动用户检测

主机

node_monit_check_user{processName="ycm-agent"}

NodeExporter进程启动用户检测

主机

node_monit_check_user{processName="node-exporter"}

YashanDBExporter服务状态

主机

up{job="yashandb_exporter"}

NodeExporter服务状态

主机

up{job=~"host.*"}

YCPAgent进程状态

主机

node_monit_check_status{type="mix", processName="ycm-agent"}

Monit进程状态

主机

node_monit_monit_down

CPU使用率

主机

(1-(sum(increase(node_cpu_seconds_total{mode='idle'}[1m]))by(instance,job))/(sum(increase(node_cpu_seconds_total[1m]))by(instance,job)))*100

CPU I/O等待

主机

(sum(increase(node_cpu_seconds_total{mode='iowait'}[1m]))by(instance,job))/(sum(increase(node_cpu_seconds_total[1m]))by(instance,job))*100

监控指标主要用于监控大盘和告警项。默认的监控指标会生成默认告警项和添加到默认监控大盘。

Note: 默认监控大盘中只会添加部分具有图表展示意义的默认监控指标,也只有部分默认监控指标会生成默认告警项。

监控指标支持通过指标名称对监控指标进行搜索。

创建指标

网页路径:【创建指标】

功能介绍

除了系统提供的默认监控指标,还可以通过单击【创建指标】,输入指标名称、指标类型、单位和表达式,创建自定义监控指标。

自定义监控指标支持编辑和删除,但不允许删除已关联告警项的自定义监控指标。

主要内容解释

【指标名称】:监控指标的名称,必填参数,长度范围为[1,24]个字符,名称必须唯一。

【指标类型】:监控指标所属的资源对象的类型,分为数据库(YashanDB)和主机,必填参数。

【表达式】:表达式语法为PromQL,指标可参考默认监控指标。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
构建企业级监控平台系列(十六):Prometheus Node Exporter 详解
Exporter是Prometheus的指标数据收集组件。它负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。和传统的指标数据收集组件不同的是,他只负责收集,并不向Server端发送数据,而是等待Prometheus Server 主动抓取,node-exporter 默认的抓取url地址:http://ip:9100/metrics。
民工哥
2023/10/23
5.1K1
构建企业级监控平台系列(十六):Prometheus Node Exporter 详解
[上篇] 搭建高级的性能监控系统(Prometheus+Grafana+Node Exporter+Alertmanager)
Prometheus、Grafana、Node Exporter 和Alertmanager是一组用于监控和可视化系统性能的开源工具。它们通常一起使用,形成一个强大的完整的监控和告警系统。
老张的哲学
2023/11/30
1.3K0
[上篇] 搭建高级的性能监控系统(Prometheus+Grafana+Node Exporter+Alertmanager)
基于Prometheus和Grafana的监控平台 - 运维告警
今天我们就来聊聊 基于Prometheus和Grafana的监控平台的异常告警功能,这也是Prometheus系列的最后一篇。
JAVA日知录
2019/10/30
1.8K0
基于Prometheus和Grafana的监控平台 - 运维告警
7年磨一剑,prometheus 3.0版本,速去感受了一把
prometheus2.0版本发布于7年前,年前发布了3.0beta版本,月初更新了3.1.0版本。
大侠之运维
2025/01/24
5430
4.Prometheus监控入门之PromQL表达式语法学习
它类似于 SQL 的语言,但是PromQL表现力非常丰富,并且内置函数很多,在日常数据可视化以及 rule 告警中都会使用到它。
全栈工程师修炼指南
2022/09/29
9.2K0
4.Prometheus监控入门之PromQL表达式语法学习
Prometheus监控服务器
监控服务器CPU、内存、磁盘、I/O等信息,首先需要安装node_exporter。node_exporter的作用是用于机器系统数据收集。
拓荒者
2019/08/01
3.9K0
prometheus实战之二:使用常见指标
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 本篇概览 本文是《prometheus实战》系列的第二篇,在《prometheus实战之一:用ansible部署》一文咱们部署了prometheus服务,并且在应用服务器部署了node_exporter,整体情况如下图 目前,prometheus已经可以通过node_exporter从应用服务器取得监控数据,本篇就来学习如何使用这些监控数据来展现应用
程序员欣宸
2023/05/03
5.8K0
prometheus实战之二:使用常见指标
《Prometheus监控实战》第4章 监控主机和容器
第4章 监控主机和容器 首先,我们将在每台主机上安装exporter,然后配置节点和Docker指标让Prometheus来抓取。基本主机资源监控 CPU 内存 磁盘 可用性 然后,我们利用收集的指标来构建一些聚合指标并保存为记录规则 最后,我们会简要介绍Grafana,并对收集的数据进行基本的可视化 回顾USE: 使用率(Utilization) 饱和度(Saturation) 错误(Error) USE方法可以概括为:针对每个资源,检查使用率、饱和度和错误。该方法对于监控那些受高使用率或饱和度的性能问题
yeedomliu
2019/12/19
5.8K0
构建企业级监控平台系列(二十八):Grafana 仪表盘 DashBoard
DashBoard 仪表盘,数据展示的窗口。就像汽车仪表盘一样可以展示很多信息,包括车速,水箱温度等。Grafana的 DashBoard 就是以各种图形的方式来展示从 Datasource 拿到的数据。
民工哥
2023/11/06
2.2K0
构建企业级监控平台系列(二十八):Grafana 仪表盘 DashBoard
Prometheus Operator 常用指标
Prometheus Operator 安装完成后会有很多默认的监控指标,一不注意就大量的报警产生,所以我们非常有必要了解下这些常用的监控指标,有部分指标很有可能对于我们自己的业务可有可无,所以可以适当的进行修改,这里我们就来对常用的几个指标进行简单的说明。
我是阳明
2020/07/24
8.1K0
Prometheus Operator 常用指标
Prometheus:监控主机和容器
在node exporter上设置textfile的路径: --collector.textfile.directory=/var/lib/node_exporter/textfile_collector/ 6、配置systemd收集器 node_exporter --collector.textfile.directory /var/lib/node_exporter/textfile_collector --collector.systemd --collector.systemd.unit-whitelist="(docker|ssh|rsyslog).service" 7、服务端prometheus.yml配置 scrape_configs:
用户5760343
2020/01/15
2.1K0
【YashanDB监控运维平台(YCM)】默认告警项
用户11441800
2025/06/25
790
Prometheus 监控Linux Windows主机(七)
Node_exporter 用于采集Linux系统指标数据数据,prometheus官方提供的exporter,除node_exporter外,官方还提供consul,memcached,haproxy,mysqld等exporter。
Kevin song
2023/02/22
5.1K0
Prometheus 监控Linux Windows主机(七)
使用 Node Exporter 监控 Linux 主机(1)
Node Exporter 是用于暴露 *NIX 主机指标的 Exporter,比如采集 CPU、内存、磁盘等信息。采用 Go 编写,不存在任何第三方依赖,所以只需要下载解压即可运行。
我是阳明
2021/11/08
2.6K0
使用 Node Exporter 监控 Linux 主机(1)
Prometheus 基础入门 (一)
Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本。2016年由Google发起Linux基金会旗下的原生云基金会(Cloud Native Computing Foundation), 将Prometheus纳入其下第二大开源项目。Prometheus和Heapster(Heapster是K8S的一个子项目,用于获取集群的性能数据。)相比功能更完善、更全面。
Kevin song
2023/02/09
1.5K0
Prometheus 基础入门 (一)
使用 Node Exporter 监控 Linux 主机(2)
前文我们介绍了如何使用 Node Exporter 监控 Linux 主机的 CPU 使用率,接下来我们来介绍如何监控 Linux 的磁盘空间、磁盘 IO、网络 IO 等方面。
我是阳明
2021/11/08
2.4K0
使用 Node Exporter 监控 Linux 主机(2)
【YashanDB监控运维平台(YCM)】监控图
监控图是基于监控指标在时间、数量、比率等维度上的数据点之间的关系或趋势,理论上每个监控指标对应一张监控图表,但部分监控指标不适合用图表展示且数据图表无监控意义的则不产生监控图,例如YashanDB自选举开关配置等。
用户11441800
2025/06/25
1240
kubernetes监控-prometheus+grafana完美监控
通过各种exporter采集不同维度的监控指标,并通过Prometheus支持的数据格式暴露出来,Prometheus定期pull数据并用Grafana展示,异常情况使用AlertManager告警。
kubernetes中文社区
2019/06/21
6.5K0
kubernetes监控-prometheus+grafana完美监控
Prometheus使用[笔记]
Prometheus使用 环境 查看上一篇安装篇 MacOS Centos 7 prometheus-2.12.0.linux-amd64.tar.gz grafana-6.3.5-1.x86_64 node_exporter-0.18.1.linux-amd64 pushgateway-0.9.1.linux-amd64 命令行入门实例 CPU使用率计算 CPU在t1到t2时间段总的使用时间 = ( user2+ nice2+ system2+ idle2+ iowait2+ irq2+ softi
suveng
2019/09/17
4.2K0
Prometheus使用[笔记]
prometheus-简介及安装
监控是整个产品周期中最重要的一环,及时预警减少故障影响免扩大,而且能根据历史数据追溯问题。
yuezhimi
2020/09/30
3.5K0
prometheus-简介及安装
推荐阅读
相关推荐
构建企业级监控平台系列(十六):Prometheus Node Exporter 详解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档