首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >高效排障这样做!从碎片化到一体化观测

高效排障这样做!从碎片化到一体化观测

原创
作者头像
腾讯云可观测平台
修改2025-07-11 16:03:08
修改2025-07-11 16:03:08
2130
举报

华北区 CVM 的 CPU 飙升、数据库连接数超限、负载均衡延迟……某运维在多个监控界面间来回切换手忙脚乱,红标狂闪,问题却越查越懵:

CVM 的 CPU 高,是哪个应用在抢资源?与负载均衡节点流量以及后端数据库慢 SQL 有什么关系?告警信息像弹幕刷屏,关键风险须用力查找……

云时代运维的痛点——

  • 资源碎片化:计算、存储、网络、数据库……各类云产品观测界面各自为战,想看全局?先切N个页面;
  • 分析断层化:单一资源异常,找不到上层应用谁出错;
  • 告警轰炸:关键风险被淹没成红色海洋 ……

在云原生架构复杂化、资源类型多元化的技术背景下,云产品监控需求包含了两个核心维度:全局视角 + 精细分析。

腾讯云可观测平台升级了可观测能力,新增资源总览功能以满足以上需求。

可以跟着教程了解使用细节👇

1.统一云资源视图,总览全局

进入控制台,点击“资源总览”模块。

蜂窝图:以可视化方式将计算、存储、网络等资源状态浓缩为直观色块,异常资源自动标红预警,快速锁定全局风险。

列表视图:按资源类型分类,快速筛选目标实例,支持自定义排序与多维度搜索,配合折线图表展现用户所选时间段内的资源性能趋势。

2.从全局到局部,逐级下钻分析,快速进行问题定界

总览全局后来看看指标细节。

点击资源总览界面发出 “红色预警”,比如某区域的云服务器普遍存在没有恢复的告警,可基于资源总览能力进行深度下钻分析,快速找到问题的根源。

点击“基本信息”,可从区域级概览下钻到实例详情,快速定位资源身份。

点击“基础监控”,则可通过关键性能指标(KPI)可视化,实时评估实例运行状态与性能瓶颈。

3.告警情况

进入资源总览查看总体告警情况。

对于具体的云资源,也能够通过一次点击查询未恢复的告警详情。

4.快速接入腾讯云应用性能监控(APM)

在无业务代表侵入的前提下,将应用接入 APM。

完成 APM 接入流程后,云服务器、容量等底层资源便自动与上层应用建立了双向关联关系。对于一台特定的云服务器,可以自动列出该服务器上部署的所有应用。

点击应用后,可直接定位到包含特定异常信息、数据库查询的链路。

无需在云服务器控制台与 APM 控制台之间来回切换,直接通过资源总览页完成从资源异常,到应用影响,再到代码细节和外部依赖的全链路追溯。

学会了吗~快来腾讯云可观测平台试试吧👉:

监控概览 - 腾讯云可观测平台 - 控制台

如有疑问可加群答疑!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.统一云资源视图,总览全局
  • 2.从全局到局部,逐级下钻分析,快速进行问题定界
  • 3.告警情况
  • 4.快速接入腾讯云应用性能监控(APM)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档