操作场景
本操作为您介绍增量阶段如何查看任务指标,各种指标图形表示的含义及对应处理。
适用范围
适用于 MySQL/MariaDB/Percona/TDSQL-C MySQL/TDSQL MySQL/TDSQL TDStore/Kafka 之间的迁移、同步任务。
注意事项
如果监控视图没有数据显示,表示增量阶段还未开始,或者数据迁移的任务没有选择增量同步。
操作步骤
如下监控观测适用于对任务正常状态下的观测,任务异常状态下,请优先对报错任务进行处理。
1. 登录 DBbridge 控制台,查看增量同步任务的状态是否正常。
任务异常中断:请参考 常见错误处理。
任务状态为运行中:继续下面的步骤查看监控指标。
2. 查看增量同步的延迟时间和延迟数据量指标。
2.1 延迟时间、延迟数据量都基本为0:表示 DTS 可以及时同步源端数据到目标端,无延迟,任务运行正常。
2.2 延迟时间、延迟数据量与历史运行曲线维持在相同的水平(即曲线保持平稳,或者根据业务情况有周期性的波动):表示增量阶段的任务在正常运行中,波动情况与业务属性相关。
2.3 延迟时间、延迟数据量出现尖峰:需要确认源库是否有大量数据写入。
如果源端有大量数据写入(如写入是平常数据量的3倍),导致 DTS 在拉取数据出现短暂延迟。这种属于正常情况,待源端写入同步完成后,延迟数据会恢复正常。
如果源端没有大量数据写入,则继续排查。
3. 查看 RPS 指标。
如果 RPS 监控指标相对于之前的同步速率明显降低,则需要继续后续排查步骤4。
如果 RPS 监控指标曲线掉为0,则可能是源端、目标端异常,请进行步骤4。这种情况也会同时触发任务中断,可根据任务报错提示进行对应处理。
4. 查看源端或者目标端负载。
如果源和目标端负载较高,会导致 RPS 突然掉为0。消除源端和目标端的负载影响后,延迟时间、延迟数据量都会呈现逐渐下降的趋势。
如果源和目标端无负载过大问题,请继续步骤5。
5. 上述排查都未定位原因,则请 提交工单 处理。