最近遇到一个由于唯一性索引,导致并发插入产生死锁的场景,在分析死锁产生的原因时,发现这一块还挺有意思的,涉及到MySql中不少的知识点,特此总结记录一下。
image
谈到mysql的锁,可以说的就比较多了,比如行锁、表锁、页锁、元数据锁等,当然我们这里没打算把所有的都细列出来,我们这里主要针对行锁、gap锁进行拓展,以方便分析第二节中,为什么并发插入同样的数据会产生死锁的问题
0. 锁分类
我们最常说的锁,可以区分为共享锁(S)和排它锁(X),在mysql的innodb引擎中,为了解决幻读问题,引入了gap锁以及next key lock;除此之外,还有一种意向锁的,比如插入意向锁
本文将主要介绍的以下几种锁
上面虽然介绍了几种锁的基本定义,但是什么时候是行锁,怎样获取共享锁,排它锁又是在哪些场景下会产生呢?gap lock/next key lock又是怎样解决幻读的呢?
下面所有的都是基于mysql5.7.22 innodb引擎,rr隔离级别进行说明
1.共享锁与排它锁
下表介绍我们的实际使用的sql中,是否会使用锁,以及会产生什么锁
共享锁与排他锁区分
image
2. 行锁、表锁、gap锁、next-key锁区分
这几个的区分,主要就是看我们最终锁住的效果,比如
行锁和gap锁之间最大的区别是:
3. 实例演示
看上面的两个说明,自然就想在实际的case中操刀分析一下,不同的sql会产生什么样的锁效果
在分析上面几种case之前,我们得先有一个概念,锁是针对索引而言的,这一点非常非常重要
其次不同的索引,我们需要分别进行测试(其实就是唯一索引与普通索引)
3.1 表准备
接下来针对上面的四种场景,设计我们的测试用例,首先我们准备三张表
对应的表结构和初始化数据如下
CREATE TABLE `tn` (
`id` int(11) unsigned NOT NULL,
`uid` int(11) unsigned NOT NULL
) ENGINE=InnoDB;
CREATE TABLE `tu` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`uid` int(11) unsigned NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `u_uid` (`uid`)
) ENGINE=InnoDB;
CREATE TABLE `ti` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`uid` int(11) unsigned NOT NULL,
PRIMARY KEY (`id`),
KEY `u_uid` (`uid`)
) ENGINE=InnoDB;
INSERT INTO `tn` (`id`, `uid`) VALUES (1, 10), (5, 20), (10, 30);
INSERT INTO `tu` (`id`, `uid`) VALUES (1, 10), (5, 20), (10, 30);
INSERT INTO `ti` (`id`, `uid`) VALUES (1, 10), (5, 20), (10, 30);
3.2 精确匹配
即我们的sql可以精确命中某条记录时,锁的情况如下:
image
请注意上面的结论,无索引时锁全表好理解,但是普通索引的TI表,居然还有一个[10, 30)的gap锁就有点超乎我们的想象了;
接下来我们验证一下
image
上图基本流程如下:
image
从上面的实测也可以看出,普通索引下添加x锁,居然会加一个gap锁,而且这个gap区间是前一个记录(并包含它),到下一个记录
如 uid = 20, 前后两个记录为(1, 10), (10, 30)
3.3 精确查询未匹配
当我们锁的记录不存在时,锁情况如下:
image
实测case如下(TN省略,锁全表的没啥测试必要性)
基本流程就不画图了,上面图中已经有文字描述了
image
从上面的测试也可以看出,uid=30没有被锁住,这里只在uid=(20, 30)这一区间添加了gap锁
唯一索引与普通索引表现一致,会阻塞insert的插入意向锁(后面说这个东西)
3.4 范围查询
当我们锁一段区间时,锁的情况如下:
image
image.png
简单来说,范围查询时,添加next key lock,根据我们的查询条件,找到最左边和最右边的记录区间
如 uid > 15 and uid < 25,找到的记录是(1, 10), (10, 30)
说明:范围加x锁时,可能锁住不在这个区间的记录,一不小心可能导致死锁哦
3.5 小结
在RR隔离级别中,我们一般认为可以产生锁的语句为:
image.png
| 普通索引 | 精确匹配,且命中 | 行锁 + gap lock (上一个记录和下个记录区间,左闭右开,左边记录非行锁) | 普通索引 | 精确匹配,未命中 | gap lock | | 普通索引 | 范围查询 | next key lock |
4. 锁冲突
上面介绍了不同场景下会产生什么样的锁,但是看完之后会有一个疑问,针对行锁其他会话竞争的时候,可以按照X/S锁的规则来,但是这个GAP LOCK貌似只针对insert有效,insert除了加X锁之外是不是还有其他的特殊逻辑?
4.1 插入意向锁
插入意向锁其实是一种特殊的 gap lock,但是它不会阻塞其他锁。假设存在值为 4 和 7 的索引记录,尝试插入值 5 和 6 的两个事务在获取插入行上的排它锁之前使用插入意向锁锁定间隙,即在(4,7)上加 gap lock,但是这两个事务不会互相冲突等待;但是如果这个区间存在gap lock,则会被阻塞;如果多个事务插入相同数据导致唯一冲突,则在重复的索引记录上加读锁
简单来说,它的属性为:
其次一个重要知识点:
4.2 锁冲突矩阵
简单版矩阵
image
当我们将gap lock(间隙锁), next key lock(next-key锁), Insert Intention lock(插入意向锁)也加入矩阵时,就会复杂很多了
image.png
说明:
小结:
针对上面的矩阵,理解下面几个原则即可推导上面矩阵
上面属于基本知识点,接下来我们看一个实际导致死锁的case
0. 表准备
创建一个最简单最基础的表,用于演示
CREATE TABLE `t` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8;
INSERT INTO `t` (`id`) VALUES (1);
1. 事务回滚的死锁问题
场景复现:
step1:
-- session1:
begin; insert into t values (2);
-- session2:
begin; insert into t values (2);
-- 阻塞
-- session3:
begin; insert into t values (2);
-- 阻塞
step2:
-- session1:
rollback;
image.png
原因分析:
死锁日志查看
SHOW ENGINE INNODB STATUS;
image
step1:
step2:
2. delete导致死锁问题
和前面操作基本一致,只是第一个会话是删除记录
step1:
-- session1:
begin; delete from t where id=1;
-- session2:
begin; insert into t values (1);
-- 阻塞
-- session3:
begin; insert into t values (1);
-- 阻塞
step2:
-- session1:
commit;
image
原因分析和前面基本一致
image.png
3. insert加锁逻辑
insert中对唯一索引的加锁逻辑
根据上面这个的逻辑,那么就会有一个有意思的死锁场景
step1:
-- session1
begin; delete from t where id = 1;
-- session2
begin; delete from t where id = 1;
step2:
-- session1
insert into t values(1)
image
对应的死锁日志
image.png
关于这个场景详情博文可以参考:记录一次Mysql死锁排查过程
4. 怎么避免死锁呢?
尽信书则不如,以上内容,纯属一家之言,因个人能力有限,难免有疏漏和错误之处,如发现bug或者有更好的建议,欢迎批评指正,不吝感激。