前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >MySQL5.7并发复制演进

MySQL5.7并发复制演进

作者头像
MySQL轻松学
发布于 2018-03-09 07:36:51
发布于 2018-03-09 07:36:51
1.5K0
举报
文章被收录于专栏:MYSQL轻松学MYSQL轻松学

MySQL5.5及以前的复制

一般主从复制有三个线程且都是单线程:

Binlog Dump(主) --> IO Thread(从) --> SQL Thread(从)。

1、master节点的Binlog dump Thread,当slave节点与master正常连接的时候,master把更新的binlog内容推送到slave节点。

2、slave节点的I/O Thread ,该线程通过读取master节点binlog日志名称以及偏移量信息将其拷贝到本地relay log日志文件

3、slave节点的SQL Thread,该线程读取relay log日志信息,将在master节点上提交的事务在本地回放,达到与主库数据保持一致的目的。

一般复制出现延迟主要在两个方面:

1)SQL线程忙不过来(可能大事物操作数据量较大;可能和从库本身的一些操作有关,有锁和资源的冲突;主库可以并发写,SQL线程不可以;主要原因)

2)网络抖动导致IO线程复制延迟(次要原因)。

MySQL5.6的改进

MySQL 5.6版本引入并发复制(schema级别),基于schema级别的并发复制核心思想:“不同schema下的表并发提交时的数据不会相互影响,即slave节点可以用对relay log中不同的schema各分配一个类似SQL功能的线程,来重放relay log中主库已经提交的事务,保持数据与主库一致”。可见MySQL5.6版本的并发复制,一个schema分配一个类似SQL线程的功能。

在上图的红色框框部分就是实现并行复制的关键所在。在MySQL 5.6版本之前,Slave服务器上有两个线程I/O线程和SQL线程。I/O线程负责接收二进制日志(更准确的说是二进制日志的event),SQL线程进行回放二进制日志。如果在MySQL 5.6版本开启并行复制功能(slave_parallel_workers > 0),那么SQL线程就变为了coordinator线程,coordinator线程主要负责以下两部分内容:

  • 若判断可以并行执行,那么选择worker线程执行事务的二进制日志。
  • 若判断不可以并行执行,如该操作是DDL,亦或者是事务跨schema操作,则等待所有的worker线程执行完成之后,再执行当前的日志。

这意味着coordinator线程并不是仅将日志发送给worker线程,自己也可以回放日志,但是所有可以并行的操作交付由worker线程完成。

上述机制实现的基于schema的并行复制存在的问题是这样设计的并行复制效果并不高,如果用户实例仅有一个库,那么就无法实现并行回放,甚至性能会比原来的单线程更差,而单库多表是比多库多表更为常见的一种情形。

MySQL5.7的MTS(Enhanced Muti-threadedslaves)

MySQL 5.7引入了新的机制来实现并行复制,不再有基于库的并行复制限制,主要思想就是slave服务器的回放与主机是一致的,即master服务器上是怎么并行执行,slave上就怎样进行并行回放。

为了兼容MySQL 5.6基于库的并行复制,5.7引入了新的变量slave-parallel-type,其可以配置的值有:

  • DATABASE:默认值,基于库的并行复制方式(兼容MySQL5.6)
  • LOGICAL_CLOCK:基于组提交的并行复制方式

当slave配置slave_parallel_workers(=8)>0并且global.slave_parallel_type='LOGICAL_CLOCK' 时,可支持一个schema下,slave_parallel_workers个的worker线程并发执行relay log中主库提交的事务。但是要实现以上功能,需要在master机器标记binary log中提交的事务哪些事物是可以并发执行,MySQL5.7将组提交的信息存放在GTID中。

那么如果用户没有开启GTID功能,即将参数gtid_mode设置为OFF呢?

故MySQL 5.7又引入了称之为Anonymous_Gtid的二进制日志event类型,如:

在MySQL 5.7的master机器上,用命令 mysqlbinlog mysql-bin.0000006| grep last_committed 可以看到last_committed和sequence_number,last_committed和sequence_number代表的就是LOGICAL_CLOCK。

server id 15102 end_log_pos14623 CRC32 0x767a33fa GTID last_committed=18 sequence_number=26server id 15102 end_log_pos15199 CRC32 0x7dd1bf05 GTID last_committed=26 sequence_number=27server id 15102 end_log_pos15773 CRC32 0xb01dc76e GTID last_committed=26 sequence_number=28server id 15102 end_log_pos16347 CRC32 0x7a8e0ee8 GTID last_committed=26 sequence_number=29server id 15102 end_log_pos16921 CRC32 0x92516d17 GTID last_committed=26 sequence_number=30server id 15102 end_log_pos17495 CRC32 0xeb14a51e GTID last_committed=26 sequence_number=31server id 15102 end_log_pos18071 CRC32 0x750667d0 GTID last_committed=26 sequence_number=32server id 15102 end_log_pos18645 CRC32 0xcaed6159 GTID last_committed=26 sequence_number=33server id 15102 end_log_pos19219 CRC32 0x62408408 GTID last_committed=26 sequence_number=34server id 15102 end_log_pos19793 CRC32 0x5cf46239 GTID last_committed=33 sequence_number=35

在slave机器的relay log中 last_committed相同的事务(sequence_num不同)可以并发执行。一个组提交的事务(group commit)都是可以并行回放,因为这些事务都已进入到事务的prepare阶段,说明事务之间没有任何冲突(否则就不可能提交)。

从上面截取的信息可以看出last_committed=26的事务一共有8个:从sequence_number=27-34,假设当slave_parallel_workers=8时,Coordinator线程分配这一组事务到worker中排队去执行。

增加master库binary log group commit组中事务的数量可以提高slave机器并发处理事务的数量,MySQL5.7引入 binlog_group_commit_sync_delay和binlog_group_commit_sync_no_delay_count参数来提高binary log组提交并发数量。

MySQL等待binlog_group_commit_sync_delay毫秒的时间直到binlog_group_commit_sync_no_delay_count个事务数时,将进行一次组提交。

MTS配置

slave-parallel-type=LOGICAL_CLOCK

slave-parallel-workers=16

master_info_repository=TABLE (开启MTS功能后,会频繁更新master.info,设置为TABLE减小开销)

relay_log_info_repository=TABLE (开启MTS功能,要求必须置为TABLE)

relay_log_recovery=ON (slave IO线程crash,如果relay-log损坏,则自动放弃所有未执行的relay-log,重新从master上获取日志,保证relay-log的完整性)

slave_preserve_commit_order=1 (保证提交的顺序性)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-07-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MYSQL轻松学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
MySQL复制从库延迟原因深入分析
* GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。 背景介绍 近来一套业务系统,从库一直处于延迟状态,无法追上主库,导致业务风险较大。 从资源上看,从库的CPU、IO、网络使用率较低,不存在服务器压力过高导致回放慢的情况;从库开启了并行回放;在从库上执行 SHOW PROCESSLIST 看到没有回放线程阻塞,回放一直在持续;解析relay log日志文件,发现其中并没大事务回放。 过程分析 现象确认 收到运维同事的反馈,有一套从库延迟的非常厉害,提供了SHOW SLAVE STATUS延迟的截图信息
老叶茶馆
2024/05/08
1980
MySQL复制从库延迟原因深入分析
MySQL多线程复制配置
master 节点上的binlogdump 线程,在slave 与其正常连接的情况下,将binlog 发送到slave 上。slave 节点的I/O Thread ,通过读取master 节点binlog 日志名称以及偏移量信息将其拷贝到本地relay log 日志文件。slave 节点的SQL Thread,该线程读取relay log 日志信息,将在master 节点上提交的事务在本地回放,达到与主库数据保持一致的目的。
Power
2025/03/02
1300
mysql复制系列5-多线程复制
mysql复制中最常见的问题就是主从复制延迟问题,mysql从一开始不支持并行复制,到一步一步的优化改进多线程复制,下面介绍一下mysql复制单线程到多线程复制的历程
wangwei-dba
2021/05/14
1.3K0
MySQL5.7并行复制解析
在之前的文章中,我对MySQL并行复制做过一个简单的介绍,有兴趣可以翻看5月19日的文章《MySQL并行复制解析》。今天针对这个问题,补充一些知识点。
AsiaYe
2020/05/29
1.3K0
由MySQL复制延迟说起
相信 slave 延迟是MySQL dba 遇到的一个老生长谈的问题了。我们先来分析一下slave延迟带来的风险
用户1278550
2019/04/25
1.3K0
由MySQL复制延迟说起
深入理解MySQL 5.7 GTID系列(四):mysql.gtid_executed&PREVIOUS GTID EVENT
之所以把MySQL.GTID_EXECUTED表的作用和PREVIOUS GTID EVENT的改变放到一起进行描述是因为它们后面文章探讨的基础。这部分使用到了我自己使用C语言写的原生BINLOG解析工具INFOBIN。 百度云盘下载如下:http://pan.baidu.com/s/1jHIWUN0
wubx
2019/04/24
7480
Xtrabackup在线搭建备库与并行复制延迟
为了兼容 MySQL 5.6 基于库的并行复制,5.7 引入了新的变量 slave-parallel-type,其可以配置的值有:
mingjie
2022/05/12
4580
Xtrabackup在线搭建备库与并行复制延迟
Mysql并行复制实践总结
一般Mysql主从复制有三个线程参与,都是单线程:Binlog Dump(主) -> IO Thread (从) -> SQL Thread(从)。
mingjie
2022/05/12
1.4K0
Mysql并行复制实践总结
从库延迟案例分析
持续观察了一阵show slave status的变化,发现pos点位信息在不停的变化,Seconds_Behind_master也是不停的变化的,总体趋势还在不停的变大。 资源使用 观察了服务器资源使用情况,可以看到占用非常低
GreatSQL社区
2024/04/12
1140
从库延迟案例分析
MySQL集群架构[通俗易懂]
题记: 文章内容输出来源:拉勾教育Java高薪训练营。 本篇文章是 MySQL 学习课程中的一部分笔记。
全栈程序员站长
2022/09/18
1.5K0
MySQL集群架构[通俗易懂]
【云+社区年度征文】测试MySQL主从复制中主库表缺失主键会导致主从延迟的情况
2、主库会有binlog dump线程实时监测binlog的变更并将这些新的events事件推给从库(Master has sent all binlog to slave; waiting for more updates)
AiDBA宝典
2020/12/07
2.3K1
【云+社区年度征文】测试MySQL主从复制中主库表缺失主键会导致主从延迟的情况
MySQL:深入解析 Binlog复制技术
MySQL的二进制日志(Binary Log, Binlog)是MySQL数据库中非常核心的技术之一,它记录了数据库中所有的DDL和DML操作,对于数据的恢复、复制等都起着至关重要的作用。今天我们将通过实际的binlog日志内容,深入探讨MySQL的binlog复制技术,理解其背后的运作机制。
运维开发王义杰
2023/10/23
4570
MySQL:深入解析 Binlog复制技术
技术分享 | 从库 MTS 多线程并行回放(一)
这里只准备讨论基于 LOGICAL_CLOCK 的并发方式,而不会讨论老的基于 DATABASE 的方式,下面是我设置的参数:
爱可生开源社区
2020/03/13
1.6K0
mysql binlog日志事件解析
二进制日志(binary log)是mysql的一种日志记录了mysql中的数据变更操作,二进制日志主要有以下作用:
wangwei-dba
2021/06/09
2.5K0
主从延迟调优思路
* GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。 1、什么是主从延迟? 本质是从库的回放跟不上主库,回放阶段的延迟
GreatSQL社区
2024/04/18
1450
主从延迟调优思路
MySQL复制性能优化和常见问题分析
二进制日志文件并不是每次写的时候都会同步到磁盘,当发生宕机的时候,可能会有最后一部分数据没有写入到binlog中,这给恢复和复制带来了问题。当sync_binlog=1表示每写缓冲一次就同步到磁盘,表示同步写磁盘的方式来写binlog。也就是说每当向MySQL提交一次事务,MySQL将进行一次fsync之类的磁盘同步命令来将binlog_cache的数据强制刷到磁盘中sync_binlog的值默认为0,sync_binlog=0时表示采用操作系统机制进行缓冲数据同步。采用sync_binlog=1时,会增加磁盘IO的次数,会影响写入性能。sync_binlog=1时,并不是100%安全,会存在相应的问题。比如说使用Innodb引擎时,在一个事务发出commit前,会将binlog立即刷到磁盘中。如果这时候已经写入到binlog中,但是还没有提交就已经挂了,那么MySQL重启时,会将通过Redo log、Undo log将这个事务回滚掉,但是binlog已经记入了该事务信息,不能回滚掉。所以我们需要设置innodb_support_xa=1确保MySQL服务层的binlog和MySQL存储引擎层的Redo log、Undo log之间的数据一致性。
用户2032165
2018/12/07
1.2K0
MySQL复制性能优化和常见问题分析
MySQL复制从库延迟优化思路
2、主从延迟常见的原因有哪些? 1、大事务,从库回放时间较长,导致主从延迟 2、主库写入过于频繁,从库回放跟不上 3、参数配置不合理 4、主从硬件差异 5、网络延迟 6、表没有主键或者索引大量频繁的更新 7、一些读写分离的架构,从库的压力比较大 3、解决主从延迟有哪些方法 1、对于大事务,拆分成小事务 2、开启并行复制 3、升级从库硬件 4、尽量都有主键 4、什么是并行复制,参数有哪些? 先回顾MySQL并行复制的路程 a. MySQL5.6 是基于数据库级别的并行复制 slave-parallel-type=DATABASE(不同库的事务,没有锁冲突)
老叶茶馆
2024/05/09
4460
MySQL复制从库延迟优化思路
【腾讯云CDB】源码分析 · MySQL binlog组提交和Multi-Threaded-Slave
本文介绍了MySQL中的binlog组提交及其在MySQL Replication中的作用。binlog是MySQL中一种二进制日志,用于记录数据库的更改历史。在MySQL Replication中,通过binlog实现主从复制。当主库发生更改时,binlog会记录所有更改,并将更改发送到从库。从库根据binlog中的更改来更新自己的数据,从而保持与主库一致。在MySQL中,使用binlog可以实现多种功能,如灾难恢复、数据迁移、只读实例等。
腾讯云数据库 TencentDB
2017/12/28
3.3K0
【腾讯云CDB】源码分析 · MySQL binlog组提交和Multi-Threaded-Slave
MySQL 8 复制(六)——拓扑与性能
可以在任意个主从库之间建立复杂的复制拓扑结构,如普通的一主一(多)从、双(多)主复制、级联复制,MySQL 5.7.2后新增的多源复制,特殊场景下使用的Blackhole引擎与日志服务器等等。复制中的MySQL服务器须要遵循以下基本原则:
用户1148526
2019/07/11
1.8K0
MySQL 8 复制(六)——拓扑与性能
MySQL5.7并行复制中并行的真正含义
MySQL5.7并行复制初理解 我们知道MySQL5.7并行复制引入了两个值last_committed和sequence_number。last_committed表示事务提交的时候,上次事务提交的编号,在主库上同时提交的事务设置成相同的last_committed。如果事务具有相同的last_committed,表示这些事务都在一组内,可以进行并行的回放。这个机制也是Commit-Parent-Based SchemeWL#6314中的实现方式。不过之后,官方对这种模式做了改进,所以最新的并行回放机制
沃趣科技
2018/03/26
2.3K0
MySQL5.7并行复制中并行的真正含义
相关推荐
MySQL复制从库延迟原因深入分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档