Py学习  »  DATABASE

10人面试9个错?令人“迷惑”的 MySQL 加锁机制,到底是怎样的?

高效运维 • 5 月前 • 65 次点击  

首先来看这个面试题:

已知表t是 innodb 引擘,有主键:id(int类型),下面3条语句是否加锁?加锁的话,是什么锁?

select * from t where id=X;begin;select * from t where id=X;begin;select * from t where id=X for update;

这里其实有很多依赖条件,并不能一开始就给出一个很确定的答复。我们一层层展开来分析。

01 MySQL 有哪些锁?

首先要知道 MySQL 有哪些锁。如上图所示,至少有12类锁。

其中,自增锁是事务向包含了 AUTO_INCREMENT 列的表中新增数据时会持有, predicate locks for spatial index  为空间索引专用,本文不讨论这2类锁。
锁按粒度可分为全局、表级、行级,共3类。

1.1 全局锁

对整个数据库实例加锁。

加锁表现:数据库处于只读状态,阻塞对数据的所有 DML/DDL
加锁方式:Flush tables with read lock
释放锁:unlock tables
(发生异常时会自动释放)
作用场景:全局锁主要用于做数据库实例的逻辑备份,与设置数据库只读命令 set global readonly=true 相比,全局锁在发生异常时会自动释放

1.2 表锁

对操作的整张表加锁,锁定颗粒度大,资源消耗少。不会出现死锁,但会导致写入并发度低。具体又分为3类:

1)显式表锁
分为共享锁(S)和排他锁(X
显式加锁方式:lock tables … read/write
释放锁:unlock tables
(连接中断也会自动释放)
2) Metadata-Lock 元数据锁)
MySQL5.5版本开始引入,主要功能是并发条件下,防止 session1 的查询事务未结束的情况下,session2 对表结构进行修改,保护元数据的一致性。
在 session1 持有 metadata-lock 的情况下,session2 处于等待状态:show proces slist 可见 Waiting for table metadata lock。其具体加锁机制如下:
  • DML->先加MDL 读锁( SHARED_READ,SHARED_WRITE
  • DDL->先加MDL 写锁( EXCLUSIVE
  • 读锁之间兼容
  • 读写锁之间、写锁之间互斥
3)Intention Locks(意向锁)
意向锁为表锁(表示为IS或者IX),由存储引擎自己维护,用户无法干预。
下面举一个例子说明其功能。假设有2个事务:T1和T2
T1:锁住表中的一行,只能读不能写(行级读锁)。
T2:申请整个表地写锁(表级写锁)。
如T2申请成功,则能任意修改表中的一行,但这与T1持有的行锁是冲突的。故数据库应识别这种冲突,让T2的锁申请被阻塞,直到T1释放行锁。
有2种方法可以实现冲突检测:
  1. 判断表是否已被其他事务用表锁锁住;
  2. 判断表中的每一行是否已被行锁锁住。
其中2需要遍历整个表,效率太低。因此 innodb 使用意向锁来解决这个问题:T1需要先申请表的意向共享锁(IS),成功后再申请某一行的记录锁S。
在意向锁存在的情况下,上面的判断可以改为:T2发现表上有意向共享锁IS,因此申请表地写锁被阻塞。


1.3 行锁

InnoDB 引擘支持行级别锁,行锁粒度小,并发度高,但加锁开销大,也可能会出现死锁。
加锁机制:innodb 行锁锁住的是索引页,回表时,主键地聚簇索引也会加上锁。
行锁具体类别如上图所示,包括:Record lock/Gap Locks/Next-Key Locks,每类又可分为共享锁(S)或者排它锁(X),一共2*3=6类,最后还有1类插入意向锁:

Record lock 记录锁:最简单的行锁,仅仅锁住一行。记录锁永远都是加在索引上的,即使一个表没有索引, InnoDB 也会隐式地创建一个索引,并使用这个索引实施记录锁。

Gap Locks (间隙锁):加在两个索引值之间的锁,或者加在第一个索引值之前,或最后一个索引值之后的间隙。使用间隙锁锁住的是一个区间,而不仅仅是这个区间中的每一条数据。间隙锁只阻止其他事务插入到间隙中,不阻止其他事务在同一个间隙上获得间隙锁,所以 gap x lock 和 gap s lock  有相同的作用。它是一个左开右开区间:如(1,3)。

Next-Key Locks :记录锁和间隙锁的组合,它指的是加在某条记录以及这条记录前面间隙上的锁。它是一个左开右闭区间:如(1,3)。

Insert Intention (插入意向锁):该锁只会出现在 insert 操作执行前(并不是所有insert操作都会出现),目的是提高并发插入能力。它在插入一行记录操作之前设置一种特殊的间隙锁,多个事务在相同的索引间隙插入时,如果不是插入间隙中相同的位置就不需要互相等待。

TIPS:
1、不存在 unlock tables … read/write ,只有 unlock tables
2、If a session begins a transaction, an implicit UNLOCK TABLES is performed


02 锁的兼容情况

引入意向锁后,表锁之间的兼容性情况如下表:

总结:

  • 意向锁之间都兼容。

  • X,IX和其它都不兼容除了1

  • S,IS和其它都兼容除了1,2

03 锁信息查看方式

  • MySQL 5.6.16 版本之前,需要建立一张特殊表 innodb_lock_monitor,然后使用 show engine innodb status 查看。

CREATE TABLE innodb_lock_monitor (a INT) ENGINE=INNODB;DROP TABLE innodb_lock_monitor;
MySQL 5.6.16版本之后,修改系统参数 innodb_status_output 后,使用 show engine innodb status 查看。
set GLOBAL innodb_status_output=ON;set GLOBAL innodb_status_output_locks=ON;
每15秒输出一次INNODB运行状态信息到错误日志。
  • MySQL 5.7 版本之后

可以通过 information_schema.innodb_locks 查看事务的锁情况,但只能看到阻塞事务的锁;如果事务并未被阻塞,则在该表中看不到该事务的锁情况。

  • MySQL 8.0

删除 information_schema.innodb_locks,添加
performance_schema.data_locks ,即使事务并未被阻塞,依然可以看到事务所持有的锁,同时通过 performance_schema.table_handles 、 performance_schema.metadata_locks 可以非常方便地看到元数据锁等表锁。

04 测试环境搭建

4.1 建立测试表

该表包含一个主键,一个唯一键和一个非唯一键:

CREATE TABLE `t` (`id` int(11) NOT NULL,`a` int(11) DEFAULT NULL,`b` int(11) DEFAULT NULL,`c` varchar(10),PRIMARY KEY (`id`),


    
unique KEY `a` (`a`),key b(b))ENGINE=InnoDB;

4.2 写入测试数据

insert into t values(1,10,100,'a'),(3,30,300,'c'),(5,50,500,'e');

05 记录存在时的加锁

对于innodb引擘来说,加锁的2个决定因素:
  • 一、当前的事务隔离级别。
  • 二、当前记录是否存在。

假设 id 为3的记录存在,则在不同的4个隔离级别下3个语句的加锁情况汇总如下表( select 3表示  select * from t where id =3)

分析使用以下语句在4种隔离级别之间切换:
set global transaction_isolation='READ-UNCOMMITTED';set global transaction_isolation='READ-COMMITTED';set global transaction_isolation='REPEATABLE-READ';set global transaction_isolation='Serializable';

对于 auto commit=true , select  没有显式开启事务( begin )的语句,元数据锁和行锁都不加,是真的“读不加锁”。

对于 begin ; select … where id =3这种只读事务,会加元数据锁SHARED_READ,防止事务执行期间表结构变化,查询performance_schema.metadata_locks 表可见此锁:

对于 begin; select … where id =3这种只读事务,MySQL在RC和RR隔离级别下,使用 MVCC 快照读,不加行锁,但在Serial隔离级别下,读写互斥,会加意向共享锁表锁)和共享记录锁行锁)。
对于begin; select … where id=3 for update,会加元数据锁SHARED_WRITE
对于begin; select … where id=3 or update,4种隔离级别都会加意向排它锁(表锁)排它记录锁(行锁),查询 performance_schema.data_locks 可见此2类锁。

06 记录不存在时的加锁

分析:当记录不存在的时候,RU和RC隔离级别只有意向锁,没有行锁了。
RR,Serial 隔离级别下,记录锁变成了 Gap Locks(间隙锁),可以防止幻读,lock_data 为3的 GAP lock 锁住区间(1,3),此时ID=2的记录插入会被阻塞。
那么对于主键范围查询,唯一键查询,非唯一键查询,在不同隔离级别下又是如何加锁的呢?

07 构造测试环境

该表包含一个主键,一个唯一键和一个非唯一键,有3条测试记录:

CREATE TABLE `t` (`id` int(11) NOT NULL,`a` int(11) DEFAULT NULL,`b` int(11) DEFAULT NULL,`c` varchar(10),PRIMARY KEY (`id`),unique KEY `a` (`a`),key b(b))ENGINE=InnoDB;insert into t values(1,10,100,'a'),(3,30,300,'c'),(5,50,500,'e');

08 主键范围读取

8.1 RR隔离级别

begin;select * from t where id>1 and id<7 for update;
  • 原则1:innodb 行锁锁住的是索引页。
  • 原则2:索引查找过程中访问到的对象会加锁。
  • 原则3:RR 隔离级别为了防止幻读,存在间隙锁(GAP LOCK)
  • 原则4:加锁的基本单位是 next-key lock,next-key lock 是前开后闭区间。

所以加了3个 X 锁(锁定记录本身和之前的区间,等于间隙锁+行锁),分别锁定(1,3】,(3,5】,(5,+∞】区间。

说明:

  1. InnoDB 给每个索引加了一个不存在的最大值 supremum,代表+∞

  2. 幻读:当某个事务在读取某个范围内的记录时,另一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,会产生幻读。

09 唯一索引等值查询

9.1 RR隔离级别

begin;select * from t where a=30 for update;
  • 原则1:innodb 行锁锁住的是索引页,回表时,主键地聚簇索引也会加上锁。
  • 原则2:二级索引(非聚簇索引)的叶子节点包含了引用行的主键值。
  • 原则3:索引上的等值查询,给唯一索引加锁的时候,next-key lock 退化为行锁。
所以加了2个记录锁,记录锁30,3代表锁定唯一索引 a 上的(id=3,a=30)这条记录,记录锁3代表锁定了主键上的 id=3 这条记录。

9.2 RC隔离级别

begin;select * from t where a=30 for update;

对于该条语句,RC 隔离级别下加锁完全一样。

10 非唯一索引等值查询

10.1 RR隔离级别

begin;select * from t where b=300 for update;
原则:索引上的等值查询,向右遍历时且最后一个值不满足等值条件的时候,next-key lock 退化为间隙锁。
所以对于非唯一索引 b,锁定了((b=100,id=1),(b=300,id=3)】区间和((b=300,id=3),(b=500,id=5))区间和主键上的 id=3。
begin;select * from t where b=400 for update;

可以看到,查询得值 b=400不存在,但加锁情况和 b=300值存在的时候是一样的。

10.2 RC隔离级别

begin;select * from t where b=300 for update;

原则:读提交隔离级别 (read-committed) 只有行锁,没有间隙锁。

所以只锁定了锁引 b 上的 (b=300,id=3) 和主键上的 id=3。

begin;select * from t where b=400 for update;
因为 RC 隔离级别没有间隙锁,所以 b=400 值不存在的时候,只有IX意向排它锁。

11 非唯一索引加覆盖索引

11.1 RR隔离级别

select id from t where b=300 lock in share mode;
原则:如果一个索引包含所有需要查询的字段的值,就是覆盖索引,对于二级索引来说,可以避免对主键索引的查询(回表)
因为二级索引 b 包括 (b,id),所以主键索引上无锁。
因为是 lock in share mode 所以加的是共享锁(S)和共享意向锁(IS)。

12 无索引

begin;select * from t where c=’aa’ for update;

没有索引的时候,要全表扫描,有主键就扫主键。
所以锁定范围:(-∞,1]、(1,3]、(3,5]、(5,+supremum],可以看出来把整张表都锁住了,所以对于实时业务一定要避免非索引查询。

13 总结

以上就是我们腾讯的工程师对于 MySQL 加锁机制的见解,希望对你有帮助。有不一样看法的同学们也可以在评论进行讨论噢。

来源:本文转自公众号“腾讯云开发者”,点击查看原文


倒计时1天,GCOS 全球云原生及开源峰会 2023 · 北京站,金融、大型银行、证券、通信企业代表前来分享,互联网大厂也来分享业内最佳实践经验,点击原文,立即报名~

  点击阅读原文,了解更多精彩  

近期好文:

K8s 线上异常?9步“高招”助你排查一步到位~

“高效运维”公众号诚邀广大技术人员投稿

投稿邮箱:jiachen@greatops.net,或添加联系人微信:greatops1118。
点个“在看”,一年不宕机

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/164774
 
65 次点击