分布式事务(ACID)


隔离级别

读未提交  (RU)  可以读取正在修改的数据

读已提交 (RC)  可以读取修改后的数据,不可读取正在修改的数据

可重复读 (RR)   多次读取 前后都一致,别的事务插入修改的数据不会读到

串化     (SR)   

事务并发带来隔离问题

1 脏读:事务A读取事务B正在更新的数据,然后B回滚操作,那么事务A读取到的数据是脏的。

2 不可重复: 事务A多次读取同一批数据,事务B在事务A多次读取过程中,对数据做了更新提交操作。
导致事务A前后读取数据不一致。

3 幻读:事务A修改数据,事务B插入一条件数据,事务A再读的时候发现还有一笔数据没有修改。

隔离级别与并发问题

读未提交  (RU)  可脏读,可幻读,不可重复读

读已提交 (RC)  不可, 可幻读,不可重复读

可重复读 (RR)   不可 , 可幻读,   可重复读

串化     (SR)      不可     不可    可

单机数据库如何解决?

单机数据库为了解决ACID问题,各家数据库厂商基本使用事务+锁+MVCC 来保证。

原子性: 事务+锁 方式去实现

一致性: 也是事务去解决

隔离级别:ORACLE通过 UNDO+事务+锁 实现RC隔离级别,同时避免幻读,不可重复读

什么是事务,事务是个概念,是保证数据修改前后一致性,不能修改100行数据,其中50行修改成功,另外50行修改失败。

也不能在业务逻辑上造成前后数据不一致,比如A帐号扣了50成功,B帐号增加50失败。

因此从上面可以得知,事务有单语句和多语句组成。

默认下单条语句自动开启事务,而多语句需要手工开启

用下面命令 把多条语句打包在一起。

begin trasction

commit;

通过事务提示,数据库把语句所修改的行,要么一起修改OK,要么一起修改失败。

假如出现部分成功,部分失败 咋办?就把修改成功的进行回滚。

从而通过事务 完成了原子性要求。

分布式事务(ACID)

那么在分布式数据库下,我们的事务,或者修改语句都下发到下面4个或多个分片上。

每个分片独立的单机数据库。

假如下发一个分片,还不错,可以充分利用下面数据库固有的机制去实现原子性

假如下方多个分片的事务呢?

比如单条修改语句,下发到4个分片上,其实默认是把1个大事务,拆成4个子事务。

把4个子事务下发到下面数据库去执行。

那么同样如单机数据库部分行修改成功,部分修改不成功的情况。

比如2个分片修改成功,另外2个分片修改失败。

失败原因可能分片数据库挂了,遇到锁等待,遇到死锁本子事务被杀了

那么要在上层登记每个事务在不同分片的执行情况,执行成功标记OK,否则就FAILE

GTID,SQL_ID,SHADING01,SHARDING02,SHAGDING03,SHADING04

00X1 S02, OK , OK FAILE FAILE

对部分修改成功,OK的分片进行回滚,

另外要对下发的事务设置个TIEM_OUT,超时后认为执行失败,对成功的下发ROLLBACK命令。

多语句的事务,我们增加个SQL_ID,要求本事务所有SQL在所有分片节点上执行要OK,任何一个FAILE都要回滚。

分布式事务(ACID)

一致性

在分布式应该不是问题,因为每个查询下发后面数据库,都是利用数据库的MVCC进行快照读,

遇到了事务锁定记录,也会去MVCC UNDO里面读旧数据。

也会遇到这样的问题,比如说T1时间读了2个分片,在T2时间读后面2个分片的数据,而这2个分片数据已被修改提交。

因为下发到后面2个分片的时间有差异,造成4个分片的数据前后不一致性。

中兴DB设计是上面搞个GTID,下面每个表有个隐藏列GTID,每个个查询也获得GTID,然后跟行的GTID对比

如果数据被更新了,则读取失败。没有利用MVCC机制,写居然阻塞了读。

这样就要修改MYSQL PG的源代码,向外提高接口,提高依据GTID值进行回滚查询,MVCC快照读。

同样 重复读和幻读 在分布式环境下 比较难做到,因为无法利用下面的数据库的MVCC机制(MYSQL,PG,ORACLE)

所以也要修改MYSQL内核,添加分布式MVCC接口,上面计算节点中间件,通过该接口下发事务或查询语句。

每个事务和查询语句携带GTID或者是SCN等时间措标志。下面数据库每行数据增加一列 存放GTID(SCN,TIMESTAMP)。

通过分布式接口的语句依据隐藏的GTID来判断是否要快照读。而非分布式接口就按原来的MYSQL的事务ID去,或者ORACLE的SCN。

上一篇:使用R画地图数据


下一篇:略谈事务ACID