首页
学习
活动
专区
圈层
工具
发布

#监控

网络监控与容灾:让网络问题无处遁形

陆业聪

• 豆包App推出付费订阅(68-500元/月),AI工具商业化进入新阶段——免费午餐正在收桌。

100

可观测性不是孤岛:团队协作与文化变革

东风微鸣

说实话,最近跟几个在一线做运维的老哥聊天,大家普遍反映一个现象:公司要么没有专门的人搞可观测性,要么搞了个“集中式可观测性团队”,结果这团队天天忙着修 Graf...

100

凌晨告警排查记:一次AWS EBS磁盘IO利用率100%的真相

东风微鸣

凌晨 3:30(其实是UTC时间, 美国站点的晚上, 我们这边正常上班时间, 嘿嘿嘿),电话响了。心里咯噔一下:这个时间点的告警,十有八九不是什么好事。果然,值...

000

可观测性不是孤岛:团队协作与文化变革

东风微鸣

说实话,最近跟几个在一线做运维的老哥聊天,大家普遍反映一个现象:公司要么没有专门的人搞可观测性,要么搞了个“集中式可观测性团队”,结果这团队天天忙着修 Graf...

6010

测试左移、右移之后,谁来兜底质量?

AI智享空间

左移,意味着将质量活动前置——在需求阶段就介入评审,在开发阶段就嵌入自动化,让缺陷死在摇篮里。右移,意味着将质量验证延伸到生产环境——通过灰度发布、混沌工程、线...

7510

Hermes agent+本地大模型,让Zabbix听懂人话

Zabbix

Hermes agent自动分析需求并自动调取Zabbix API中对应的方法,将文件中主机自动添加到Zabbix监控系统中关联监控模板,启用监控,结果正常返回...

24410

INT之IPT精准路径遥测:端到端网络质量监控详解

星融元Asterfusion

随着人工智能大模型训练和分布式计算等高性能应用的快速发展,智算网络对端到端路径质量的监控需求日益提升。为了应对网络拥塞和时延异常等问题,INT(In-band ...

10110

多门店监控权限实战:RBAC角色设计与数据隔离

ElevenS_it188

去年我们的监控系统管着120多家门店,系统是跑起来了,但权限一直是"先用起来再说"的状态——项目组12个人全是Admin,区域负责人也是Admin,甚至有几个门...

12610

8.0.0alpha1 升级实践

Zabbix

在 Zabbix 8.0中全新引入的散点图(Scatter Plot) 绝对值得业务监控场景重点关注。在过去的监控体系中,我们习惯了看趋势线和平均值,但这往往会...

7110

【QA】Zabbix 答疑精选

Zabbix

该报错的核⼼原因是选择的 “监控项类型” 与输⼊的 “键值(Key)” 格式不匹配。例如,当监控项类型设为 “SSH agent”时,键值必须遵循ssh.run...

10010

手把手教你用Python+迅投miniqmt构建实时大盘涨跌幅图形变化监控

子晓聊技术

今天,我们就利用 Python 和 QMT 的 xtdata 接口,手写一个实时大盘情绪监控工具。这不仅能帮你告别“只赚指数不赚钱”的困惑,更是你学习 Pyth...

23510

多门店IT运维CMDB实战:用这套最小数据模型把100家门店的资产和配置管起来

ElevenS_it188

管理100+门店的运维体系里,监控、告警、工单、自动化核查这些环节可能都已经跑起来了。但有一天你会发现一个问题:每次Ansible跑核查脚本,里面填的设备IP、...

11010

在线考试监控太离谱?这个开源插件让你夺回浏览自由

chouheiwa

关键点:我们没有破坏考试平台的功能,只是让它的监控失效。这就像是在监控摄像头前放了一张循环播放的"正常画面"录像。

9610

从 0 到企业级私有云 | Prometheus + Loki + Tempo 打造可观测性平台

一根头发丝的宽度

至此,许多人可能认为核心链路已搭建完成。但在真实的企业环境中,这仅仅是平台建设的起点。

20810

从 0 到企业级私有云 | 当你走到 Observability,这套体系才真正完整

一根头发丝的宽度

11910

我把K8s实验环境从Workstation迁到了vCenter,才发现之前可能走了些弯路

一根头发丝的宽度

很多人(包括以前的我)会以为 vCenter 只是“高级版 Workstation”

11410

Grafana 一直 No Data?我排查了 2 天,最后竟是这个原因…

一根头发丝的宽度

下面是我 2 天里踩过的 5 个关键坑,从“表面报错”到“隐蔽无提示”,每一个都能让运维人破防👇

20310

Rust 量化统计实战系列 第 5 篇:蒙特卡洛模拟(二)· 期权定价与情景分析实战

不吃草的牛德

上面的实现是离散监控(每天检查一次)。连续监控的理论价格更便宜——因为更容易触及障碍。

17710

定时监控APP运行情况的脚本

科控物联

两个实例运行正常,资源使用合理。17888实例已运行5.5小时以上,内存稳定在46.91MB,表现优秀。

10010
领券