前提条件
已开通数据开发治理平台 WeData 服务。
已创建项目,且项目调度模式为“工作流调度”。
已在编排空间完成工作流的创建和提交,且工作流下任务已配置完成。
进入告警监控页面
1. 登录 WeData 控制台。
2. 单击左侧目录树项目列表。
3. 选择对应的工作流调度项目,进入运维中心模块。
4. 在运维中心左侧目录中,可看到以下入口:
离线开发
告警规则
告警信息
告警规则
告警规则页面用于配置和管理工作流和任务的告警规则,支持对配置的告警条件进行监控。
新建告警规则
操作步骤
1. 进入运维中心,单击左侧菜单中的告警规则。
2. 单击页面左上角新建规则,进入新建告警规则页面。
3. 按照以下分组依次填写规则信息,完成后单击确定。
基本信息
字段 | 描述 |
规则名称 | 告警规则名称。 |
规则描述 | 告警规则描述,非必填,不超过 500 字符。 |
监控对象
工作流调度模式下,监控对象支持“工作流”与“任务”两种类型。
监控对象类型 | 描述 |
工作流 | 对工作流的整体执行情况进行监控。 |
任务 | 对工作流下的具体任务节点进行监控。 |
选择“工作流”:
1. 选中“工作流”,单击添加对象,弹出“选择工作流”弹窗。
2. 在弹窗中勾选需要监控的工作流,单击确定。
3. 已选工作流以列表形式展示在监控对象区域。
已选工作流列表字段:
字段 | 描述 |
序号 | 列表序号。 |
工作流名称 | 单击工作流名称可跳转到“工作流详情页”。 |
负责人 | 工作流负责人。 |
操作 | 删除:从已选列表中移除该工作流。 |
说明:
至少选择 1 个工作流才能创建告警规则。
选择“任务”:
1. 选中“任务”,单击添加对象。
2. 配置方式包括:
按工作流配置:勾选已提交运维的工作流,规则将作用于工作流下所有任务。
按任务配置:勾选具体的任务节点。
按项目配置:本项目下所有任务,支持配置白名单。
告警条件
告警条件配置随“监控对象”的不同而不同。
工作流告警条件:
告警条件 | 触发时机 | 配置说明 |
工作流执行触发(周期) | 工作流周期执行被触发时发送告警,仅周期运行场景生效。 | 常用于文件到达触发调度场景。 |
工作流执行失败 | 工作流执行失败时触发告警。 | 包含周期触发和手动触发场景。 |
工作流执行成功 | 工作流执行成功时触发告警。 | 包含周期触发和手动触发场景。 |
工作流完成时间(周期) | 工作流执行超过设定阈值时触发告警,仅周期运行场景生效。 | 配置项: • 阈值类型下拉:固定值 / 历史均值 • 若选“固定值”:展示时区下拉 + 时间选择 |
任务告警条件:
告警条件 | 触发时机 | 配置说明 |
任务执行失败(周期) | 任务执行失败时触发告警,仅周期运行场景生效。 | -- |
任务运行耗时(周期) | 任务运行耗时超过阈值时触发告警。 | 阈值支持“固定值”或“历史均值”。 |
任务完成时间(周期) | 任务未在规定时间点前完成时触发告警,仅周期运行场景生效。 | 阈值支持“固定值”或“历史均值”。 |
任务等待总耗时(周期) | 任务从计划调度时间到实际开始运行的等待时长超过阈值时触发告警,仅周期运行场景生效。 | 阈值支持“固定值”或“历史均值”。 |
任务执行成功(周期) | 任务执行成功时触发告警,仅周期运行场景生效。 | -- |
告警通知
字段 | 描述 |
告警级别 | 单选项,包括:“普通”“重要”“紧急”。 |
告警方式 | 多选项,可选渠道包括:邮件、短信、微信、电话、企业微信、HTTP、企业微信群、飞书群、钉钉群、Slack 群、Teams 群、WebHook 和自定义邮箱。 |
告警接收人 | 单选项,包括: 指定人员:从项目成员中选择任意用户。 工作流负责人:自动以工作流负责人为接收人(监控对象为“工作流”时支持)。 任务责任人:自动以任务负责人为接收人(监控对象为“任务”时支持)。 值班表:按已配置的值班表自动分发。 |
告警升级人 | 选填,最多支持添加 5 个项目内成员。若上一级未确认告警,系统将发送给下一级。 |
通知频率 | 定义告警发送次数及间隔。若配置了“告警升级人”,则仅显示“告警间隔”。 |
通知免打扰 | 按星期、时间配置多段免打扰时段,免打扰时段内不发送告警。 |
添加告警接收配置 | 同一规则内最多支持添加 10 组告警接收配置。 |
告警规则列表
告警规则列表展示当前项目下所有已配置的告警规则。
列表筛选项
筛选项 | 描述 |
规则名称 / ID | 支持按规则名称或规则 ID 模糊搜索。 |
监控对象 | 支持按监控对象类型筛选,选项包括:工作流、任务。 |
告警条件 | 支持按告警条件筛选,包括:“触发”“失败”“成功”“超时”等。 |
告警级别 | 支持按告警级别筛选,选项包括:普通、重要、紧急。 |
告警启停 | 支持按规则启停状态筛选。 |
列表字段信息
字段 | 描述 |
规则名称 | 显示规则名称与规则 ID。 |
监控对象 | 显示生效对象。 单个工作流:展示为“工作流:工作流名称”,单击工作流名称可跳转到“工作流详情页”。 多个工作流:展示为“工作流,点击查看详情”,单击查看详情展开工作流名称与负责人列表,工作流名称可跳转到“工作流详情页”。 任务:展示为“任务,点击查看详情”,单击查看详情展示按工作流配置或按项目配置的列表。 |
告警条件 | 显示规则所配置的告警条件。例如:“工作流执行触发”、“工作流执行失败”、“任务执行失败”、“任务运行耗时”等。 |
告警级别 | 显示告警级别(普通 / 重要 / 紧急)。 |
告警启停 | 显示规则启停状态,支持人为开关。停止状态下规则不生效。 |
告警方式 | 显示发送渠道。 |
接收人 | 显示告警接收人,若配置了告警升级人则一并展示。当接收人为“工作流负责人”时,展示为“工作流负责人”。 |
创建人 | 显示规则创建者。 |
告警规则操作
操作 | 描述 |
规则详情 | 单击规则详情可查看规则的全部配置参数。 |
告警信息 | 单击告警信息跳转至该规则生成的告警信息列表。 |
启动 / 停止 | 切换规则启停状态。停止状态下规则不再触发告警。 |
删除 | 删除规则。删除后该规则不再生效,已生成的告警信息保留。 |
告警信息
告警信息页面用于查看告警规则触发后生成的告警记录,并对告警进行确认操作。
告警信息列表
操作步骤
1. 进入运维中心,单击左侧菜单中的告警信息。
2. 在告警信息列表中查看所有触发的告警记录。
列表筛选项
筛选维度 | 选项 / 说明 |
告警时间 | 今天、昨天、近 7 天、近 30 天、全部、自定义日期范围。 |
告警原因 | 包括:触发、失败、成功、超时等。 |
任务名称 / ID | 支持输入搜索,多个时使用。 |
规则名称 / ID | 支持输入搜索,多个时使用。 |
列表字段信息
字段 | 描述 |
告警时间 | 告警信息的生成时间,格式为:yyyy-MM-dd HH:mm:ss。 |
告警实体 | 触发告警的实体。 工作流:展示为“工作流:工作流名称”,单击可跳转到“工作流详情页”。 任务:展示为“任务:任务名称(任务 ID)”,单击可跳转到“任务详情页”。 |
告警原因 | 被触发的具体原因(例如:工作流执行失败、任务运行耗时超时、工作流完成时间超过阈值等)。 |
告警级别 | 普通、重要、紧急。 |
规则名称 | 触发该告警的规则名称,单击可跳转到“告警规则详情”。 |
告警方式 | 实际发送的渠道。 |
接收人 | 告警信息接收人。 |
操作 | 包含“查看详情”、“确认告警” |
告警信息操作
1. 查看详情:
单击“查看详情”,弹窗展示当前告警的完整信息,包括告警对象、告警原因、发送状态。
2. 确认告警:
操作项 | 描述 |
适用范围 | 仅当告警规则配置了“告警升级人”时,操作列才出现“确认告警”入口。 |
操作流程 | 单击确认告警,告警状态变更为“已确认”,系统不再向升级人发送该告警。 |
告警信息详情
在告警信息列表单击查看详情,弹窗展示告警的完整信息。
告警对象
1. 工作流告警:
字段 | 描述 |
工作流名称 | 单击工作流名称可跳转到“工作流详情页” |
运行 ID | 工作流运行 ID |
查看日志 | 单击查看日志可跳转到“工作流运行详情页” |
2. 任务告警
字段 | 描述 |
任务名称 | 单击任务名称可跳转到“任务详情页”。 |
运行 ID | 任务运行的唯一标识。 |
查看日志 | 单击查看日志可跳转到“任务运行详情页”的执行日志。 |
告警原因
根据规则配置的告警条件展示具体原因。
发送状态
字段 | 描述 |
发送时间 | 告警发送时间,格式为:yyyy-MM-dd HH:mm:ss。 |
接收人 | 实际接收人列表。 |
发送渠道 | 使用图标显示各渠道发送是否成功。 |