1:什么是MVCC
概念
MVCC(多版本的并发控制,英文全称:Multi Version Concurrency Control)机制主要用来解决事务中的丢失更新问题。MVCC是用于数据库提供并发访问控制的并发控制技术。与MVCC相对的是基于锁的并发控制, Lock-Based Concurrency Control (LBCC)。
MVCC最大的好处
相信也是耳熟能详:读不加锁,读写不冲突。
在读多写少的OLTP应用中,读写不冲突是非常重要的,极大的增加了系统的并发性能,这也是为什么现阶段,几乎所有的RDBMS,都支持了MVCC。
多版本并发控制
仅仅是一种技术概念,并没有统一的实现标准, 其核心理念就是数据快照,不同的事务访问不同版本的数据快照,从而实现不同的事务隔离级别。虽然字面上是说具有多个版本的数据快照,但这并不意味着数据库必须拷贝数据,保存多份数据文件,这样会浪费大量的存储空间。InnoDB通过事务的undo日志巧妙地实现了多版本的数据快照。
MVCC 在mysql 中的实现依赖的是 undo log 与 read view 。
InnoDB的MVCC是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的事务ID,一个保存了行的回滚指针。每开始一个新的事务,都会自动递增产生一个新的事务id。事务开始时刻的会把事务id放到当前事务影响的行事务id中,当查询时需要用当前事务id和每行记录的事务id进行比较。
注意:MVCC只在REPEATABLE READ和READ COMMITIED两个隔离级别下工作
2:什么是丢失更新
案例1
两个事务针对同一数据都发生修改操作时,会存在丢失更新问题。
案例2
管理者要查询所有用户的存款总额,假设除了用户A和用户B之外,其他用户的存款总额都为0,
A、B用户各有存款1000,所以所有用户的存款总额为2000。但是在查询过程中,用户A会向用户B进行转账操作。转账操作和查询总额操作的时序图如下图所示。
转账和查询的时序图
使用MVCC机制
查询总额事务先读取了用户A的账户存款,然后转账事务会修改用户A和用户B账户存款,查询总额事务读取用户B存款时不会读取转账事务修改后的数据,而是读取本事务开始时的数据副本【在REPEATABLEREAD隔离等级下】
MVCC使得数据库读不会对数据加锁,普通的SELECT请求不会加锁,提高了数据库的并发处理能力。借助MVCC,数据库可以实现READ COMMITTED,REPEATABLE READ等隔离级别,用户可以查看当前数据的前一个或者前几个历史版本,保证了ACID中的I特性(隔离性)。
3:MVCC下的读操作
在MVCC并发控制中,读操作可以分成两类:快照读 (snapshot read)与当前读 (current read)。
快照读:读取的是记录的可见版本 (有可能是历史版本),不用加锁。
当前读:读取的是记录的最新版本,并且当前读返回的记录,都会加上锁,保证其他事务不会再并发修改这条记录。
在一个支持MVCC并发控制的系统中,哪些读操作是快照读?哪些操作又是当前读呢?
快照读:简单的select操作,属于快照读,不加锁。(当然,也有例外,下面会分析) 不加读锁
读历史版本
当前读:特殊的读操作,插入/更新/删除操作,属于当前读,需要加锁。 加行写锁 读当前版本
select * from table where ? lock in share mode;
select * from table where ? for update;
insert into table values (…);
update table set ? where ?;
delete from table where ?;
-- 所有以上的语句,都属于当前读,读取记录的最新版本。并且,读取之后,还需要保证其他并发事务不能修改当前记录,对读取记录加锁。其中,除了第一条语句,对读取记录加共享锁外,其他的操作,都加的是排它锁。
4:小结
MVCC是指执行普通的 SEELCT 操作时访问记录的版本链的过程
目标是使不同事务的 读-写 、 写-读 操作并发执行,从而提升系统性能。
前提: READ COMMITTD 、 REPEATABLE READ 这两种隔离级别的事务。
如果您觉得文章好看,欢迎点赞收藏加关注,一连三击呀,感谢!!☺☻