运维大屏

最近更新时间:2024-08-22 20:48:11

我的收藏

进入运维大屏页面

2. 单击左侧菜单中的项目列表,找到需要查看运维大屏的目标项目。
3. 选择项目后,单击进入数据开发模块。
4. 单击左侧菜单中的运维大屏

运维大屏

运维大屏中展示了数据开发任务的总览信息,以图表的形式展示需要重点关注的运维指标,包括任务总览、实例总览、实例运行趋势、实例时长排行、调度资源使用情况、调度资源使用趋势、调度资源组实例变化趋势、任务状态趋势、任务状态分布、任务周期分布、实例状态分布。

筛选

全部/我负责的:可以切换项目下全部任务或我为责任人的任务的统计信息。
责任人:可以指定查看部分责任人的任务的统计信息。
工作流名称:可以指定查看项目下部分工作流的统计信息。




总览信息

总览信息统计了计算任务与任务实例的重要指标数据。
任务总览:统计了任务的总任务数、调度中任务数、已暂停任务数、已下线任务数、天任务数、小时任务数、分钟任务数。



实例总览:统计了任务实例的总实例数、运行中实例数、等待运行实例数、等待上游实例数、等待事件实例数、运行成功实例数、运行失败实例数。




实例运行趋势

支持查看实例数量随时间的变化趋势图,可基于特定任务类型或实例状态查看实例数量变化趋势。
说明:
若为天粒度的数据,则展示的是当天12:00的实例数量。




实例时长排行

实例时长排行可以通过时间戳筛选近12小时、近1天、近7天、近1月时间维度内的计算任务实例等待运行、运行耗时的倒序排行,支持按调度周期类型筛选排行任务。用户可以单击查看更多跳转到更详细的计算任务实例详情页面,信息展示更加全面。
运行耗时排行:通过运行时长排行榜可以定位任务实例耗时情况,从而可以针对性地优化性能,提高整体效率。可以通过排行榜定位消耗资源较多的计算任务,让运行最耗时的任务先执行或分配更多的资源,使整个系统的计算效率得到提升。排行榜还可以作为评估计算任务代码质量的一种指标,对于频繁出现耗时较长的任务可以进行重新设计和优化。
等待调度耗时:等待调度耗时表示实例在等待运行状态下的时长,即实例在上游就绪后,到下发到执行机前这段时间的耗时。实例可能因为调度资源不足或并发不足等问题处于等待状态。可根据等待调度耗时进行排序。



单击查看更多跳转到实例运维页面,实例列表自动按降序排序方便查看更多详细信息。




调度资源使用情况

展示当前项目绑定的调度资源组的状态及资源使用情况。支持查看调度资源组的状态、CPU使用率、内存使用率、并发使用率、磁盘使用率、运行中实例数、等待运行实例数、调度中任务数。点击运行中实例数、等待运行实例数、调度中任务数可查看对应任务/实例列表。




调度资源使用趋势

展示调度资源组 CPU 使用率、内存使用率、并发使用率、磁盘使用率随时间的变化趋势。




调度资源组实例变化趋势

展示调度资源组运行中实例数、等待运行实例数随时间的变化趋势。




任务状态趋势

任务状态趋势及查看不同状态的任务数随时间的变化趋势。支持按照调度周期、任务类型、任务状态、时间进行筛选。




任务状态分布

任务状态分布图通过环图显示当前计算任务处于不同状态下的数量占比。可以通过任务类型筛选。




任务周期分布

任务周期分布通过环图显示当前已发布的不同调度周期的计算任务数量占比,便于观察不同类型任务的比例关系,突出重点。




实例状态分布

实例状态分布图通过环图显示当前任务实例处于不同运行状态下的数量占比。可以通过执行资源组,筛选查看不同执行资源下任务实例的运行状态分布。通过任务类型筛选,查看不同类型计算任务的任务实例运行状态分布。便于快速了解任务运行状态,当实例处于失败或其他异常状态时,可以帮助发现问题,快速反应进行优化和调整。