腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(94)
视频
沙龙
1
回答
基于
批处理
作业
的
非周期性
指
标的
Prometheus
警报
、
、
我有一个CronJob,它每20分钟运行一次,只收集构建持续时间超过特定值
的
Jenkins多分支
作业
上
的
活动构建,并将这些指标与构建持续时间作为值发布到
Prometheus
Pushgateway。我已经使用下面的
Prometheus
配置设置了
警报
。labels: severity: 'high' 下面是普罗米修斯中存在
的
一个度量值 jenkins_build_duration{branch="repo/branch_
浏览 21
提问于2020-08-26
得票数 1
回答已采纳
1
回答
使用
Prometheus
中
的
度量监视
批处理
作业
的
状态
、
、
、
、
我们
的
几个应用程序具有每晚聚合数据
的
批处理
作业
。这些
批处理
作业
是Python脚本,它们使用
Prometheus
Pushgateway将指标值推送到
Prometheus
,并且我们有一些规则,可以在这些指标无效(例如,超过某个阈值)时触发
警报
(在Alertmanager我们现在还想使用
Prometheus
指标来仔细检查
批处理
作业
本身是否正确运行:例如,
作业
是否按时启
浏览 42
提问于2020-07-13
得票数 3
回答已采纳
1
回答
MySQL监控工具
、
、
我想部署工具来监视我
的
生产Percona服务器(Linux上
的
5.6)。我以前从未使用过Nagios或任何工具。我确实通过了这个大链接,但是在部署它们之前,我只想澄清几个问题: 我需要在我
的
数据库主机中部署
的
那些mysql出口商和
Prometheus
的
节点出口商--它们
的
开销是什么?资源密集型?任何更好
的
建议也会对我有帮助。
浏览 0
提问于2016-09-11
得票数 0
回答已采纳
1
回答
普罗米修斯
警报
中缺少标签
、
、
、
我设置了各种特定于cAdvisor
的
警报
,例如: expr: (sum(rate(container_cpu_usage_seconds_totaldescription: 'Container CPU usage is above 80%\n VALUE = {{ $value }}\n LABELS: {{ $labels }}' 当条件满足时,我可以在
Prometheus
中
的
"Alerts“选项卡中看到
警报
,
浏览 5
提问于2021-04-26
得票数 4
回答已采纳
2
回答
spring batch在一天结束时失败
、
、
是否有解决方案允许您检查给定
作业
(JobInstance)
的
作业
存储库,当天是否存在已完成
的
作业
,如果当天batch_job_execution表上没有完成状态,那么我必须发送一个通知或退出代码,就像我们今天什么都没有得到
的
那样我计划在一个从JobExecutionListenerSupport扩展
的
类中实现该解决方案,如下所示: public class JobCompletionNotificationListener extends
浏览 1
提问于2020-02-24
得票数 0
1
回答
Grafana过滤任务和目标
、
我需要过滤一个
基于
在
prometheus
.yml中,我在grafana仪表板上有带有目
标的
"node_exporter“
作业
(端口:9100)和带有目
标的
"telegraf”
作业
(端口:9273),我为每个
作业
设置了一个变量,显示适当
的
目标, 如何查询表以显示每个变量
的
相关数据?我在考虑合并"up“和"node_uname_info”
的
度量标
浏览 3
提问于2022-01-20
得票数 0
2
回答
用千分尺发布Spring
批处理
度量
、
、
、
、
我有一个包含20多个spring
批处理
cron jobs.There
的
应用程序,因为它不是rest控制器,因为它是一个分析应用程序,它每天运行,从db读取数据,处理数据,然后将聚合数据存储在另一个db中我希望使用千分尺对
作业
进行spring内置
的
度量,并将它们推送到
Prometheus
.As,我
的
应用程序不是一个will服务器应用程序,所以千分尺仍将在主机上发布结果:8080?我
的
理解是,执行器和应用服务器可以运行不同
的
端口,因为这些端口是不同<em
浏览 4
提问于2021-03-16
得票数 2
回答已采纳
1
回答
如何获取
作业
名称参数
、
、
、
我正在尝试访问消息卡中
的
job_name字段,但我似乎无法理解这是如何实现
的
。我正在使用这个模板https://github.com/
prometheus
-msteams/
prometheus
-msteams/blob/master/examples/templates/default-message-card.tmpl如何在alertmanager中访问
警报
的
实例名称和
作业
名称。
浏览 38
提问于2021-07-07
得票数 0
1
回答
如何使用Elasticseacrh_exporter将弹性搜索指标引入普罗米修斯?
、
、
我使用舵稳定图将
Prometheus
安装到Kubernetes集群中。我们运行弹性搜索,我想从这刮度量,然后创建
基于
事件
的
警报
。我已经通过舵机安装了elasticsearch出口商,但我在哪里可以找到如何将这些指标导入
Prometheus
? 我缺少一些配置,比如创建一个、刮擦
作业
等等。任何人都能帮得上忙。
浏览 0
提问于2019-09-12
得票数 1
1
回答
管理
prometheus
限制推送网关最近
的
刮擦时间
我看到了其他线程/帖子(在github上,堆栈溢出),人们已经请求
prometheus
中
的
功能能够根据指
标的
时间戳(最后一次推送到网关时)过滤或标记过时/过期
的
度量。这似乎违背了普罗米修斯
的
工作方式,这是很好
的
。然而,我想知道人们是如何解决这一问题
的
。在度量中添加了一个包含划时代时间
的
标签。使用此标签值筛选指标(或将度量
的
值更新到某种状
浏览 1
提问于2019-12-04
得票数 2
回答已采纳
1
回答
无法在
prometheus
中推出度量标准
、
我试图在
Prometheus
中使用Pushgateway来推送度量标准,但无法完成任务。:9091');
Prometheus
evaluation_interval: 15s monitor: 'codelab-monitor' scrape_configs:
浏览 6
提问于2017-05-30
得票数 0
回答已采纳
1
回答
Openshift
Prometheus
-只有当出现多个cronjob故障时,我才会发出警告
、
、
、
、
我在Openshift集群中运行了几个cron
作业
,希望监视故障。然而,我并不关心任何一个失败,我只想在连续两个或多个连续失败
的
作业
出现时发出警告。只要
作业
至少每8-12小时完成一次(以4小时
的
步骤运行),那么就不应该触发错误。谢谢。
浏览 8
提问于2022-03-22
得票数 0
1
回答
监视在GKE上运行
的
Cron
作业
、
、
、
、
我试图监视在GKE上运行
的
CronJob,我看不到一种检查CronJob是否实际运行
的
简单方法。如果CronJob运行
的
时间不超过X,并且Stackdriver似乎不支持这一点,我想触发一个
警报
。目前,我尝试使用
基于
日志指
标的
警报
,但这只能在应用程序崩溃或特定错误时发出
警报
,而不是针对平台错误本身。 我研究了一个使用
Prometheus
警报
的
解决方案,它能集成到Stackdriver中吗?更新:只是
浏览 1
提问于2019-09-16
得票数 4
1
回答
Axapta V4中
的
数字序列事件规则问题
因此,我增加了最大值,然后,我在系统Id numberSequence上设置了一个事件规则来检查它是如何增加
的
。 我删除了它,在eventCUD表中仍然有很多生成
的
记录。AX似乎继续记录系统if
的
创建,即使相关规则不再存在。我检查所有的事件规则表,我没有任何“鬼”记录。
浏览 3
提问于2020-02-19
得票数 0
3
回答
监控工作状态
的
最佳方法是什么?
我想监视最近在我
的
公司失败
的
申请工作
的
激增。我们有ELK,grafana,opsgenie,python,bash脚本功能。ELK似乎不起作用,因为它解析日志,而且我们
的
日志没有很好地标准化,我们可以检测出故障
的
尖峰。Grafana似乎
浏览 0
提问于2021-07-01
得票数 0
1
回答
spring batch:如果
作业
在过去xx分钟内失败,则使用grafana &
prometheus
发出
警报
、
、
、
、
从4.2版本开始,spring batch提供了对
基于
微米(https://docs.spring.io/spring-batch/docs/4.2.x/reference/html/monitoring-and-metrics.html例如,我可以使用度量名称spring_batch_job查看
作业
的
执行频率、状态和持续时间。 我希望使用grafana &
prometheus
监视此指标,并在最近xx分钟内
作业
失败时
浏览 25
提问于2020-04-24
得票数 3
回答已采纳
1
回答
有没有办法让Stackdriver Alert变得更具体?
、
、
、
我正在创建几个指
标的
监控
警报
。从它创建
基于
日志
的
度量和
警报
是很好
的
。但它非常通用。如何锁定特定详细信息,如此数据流
作业
(
作业
名称)失败或此用户创建
的
数据流
作业
失败?防火墙规则也是如此,我如何知道更新了所有规则中
的
哪条规则? 如何在
警报
消息本身中包含有问题
的
作业</e
浏览 0
提问于2019-12-04
得票数 0
1
回答
弹簧批监控选项或APM
、
、
、
、
我有许多spring
批处理
应用程序,它们都是简单
的
作业
或任务,它们在linux中通过shell脚本作为一个胖jar运行,我们面临
的
挑战之一是对应用程序指
标的
性能监控,例如处理速度、识别瓶颈、rest调用所花费
的
时间但我想知道是否有任何标准
的
工具/APM为它。迄今探讨
的
备选办法: Spring数据管理:它现在是一个退役
的
项目,似乎无法使用。Spring执行器和HAL浏览器:它需要一个web服务器,但我
的
应
浏览 3
提问于2022-11-04
得票数 0
回答已采纳
1
回答
一个线程如何监控其他线程?
、
、
我正在尝试理解“心跳线程”是如何工作
的
(首先,在概念层面)。"Thread-A“如何检查" Thread-B”
的
状态(在Java中),并相应地将状态更新到某个服务器(它期望Thread-B是活动
的
)。线程A会执行什么机制来获取线程B
的
状态?
浏览 63
提问于2020-01-11
得票数 2
2
回答
如何减少普罗米修斯(联邦)刮伤时间
、
、
我有一个普罗米修斯联盟与2个普罗米修斯
的
服务器-一个每库伯奈特斯集群和一个中央统治他们
的
所有。有谁知道如何在不损失度量
的
情况下减少刮擦时间,并且不需要随着时间
的
推移而越来越多地下降?
浏览 0
提问于2018-11-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Prometheus 监控实战(三):Prometheus 架构
使用Python实现任务调度监控系统
部署Prometheus监控平台,应该考虑6个因素,缺一不可
idou老师教你学Istio 26:如何使用Grafana进行可视化监控
Prometheus基础到源码解读和二次开发(包含8门课程)技术核心组件
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券