内容目录
一、DataX数据同步原理二、全量同步实现三、增量同步的思考四、增量同步实现方案五、关于DataX高可用参考
一、DataX数据同步原理
DataX 是阿里云 DataWorks数据集成 的开源版本...首先Datax是单表同步,那么如果我们需要做增量同步,就需要知道增量的"量"是什么,度量规则是什么。
增量是指距离上一次同步(全量或者增量),增加的数据行数,也是本次需要同步的空间范围。...固定频率那就逃不开调度,Datax是单机同步工具,那么我们可以考虑基于linux系统自带的调度crontab来做定时触发或者使用开源的调度平台来触发。...1.crontab+shell
使用linux系统自带调度能力crontab,比如一天同步一次,由shell脚本计算时间,再通过命令透传到Datax的json配置文件where条件中,对于mysql,where...,从而实现增量同步。