高性能MYSQL笔记
1. MYSQL逻辑结构
MYSQL逻辑结构有三层,分别为
1. 连接/线程处理:实现连接处理,授权认证,安全等
2. 服务层:该层主要有缓存,解析,处理,优化以及跨存储引擎如存储过程,触发器,视图等
3. 存储引擎:主要负责数据读取和存储。根据服务器层提供的执行计划,进行语句的执行。
2. 并发控制
并发控制是当多个线程或者事务同时操作同一数据时,如何控制才能保证数据一致性。利用锁机制和事务特点保证数据一致性。
锁:
可按锁的粒度进行划分,可分为行级锁和表级锁。事务中不同隔离级别会有不同的锁策略。 不同隔离级别加锁策略
行级锁:InnoDB和XtraDB支持。行级锁是建立在索引上,不是行记录。
事务:
ACID:原子性,一致性,隔离性,持久性
原子性:事务内要么全部成功提交,只要有一个执行失败,则会全部回滚。通过undolog实现原子性。
一致性:保证事务修改前后整体数据保持一致。例子,用户A通过银行系统转账100元给用户B,这时需要确保用户B增加100元,而用户A需要保证减少了100元。
隔离性:事务之间的可见性。通过锁机制实现隔离性。隔离级别有未提交读,已提交读,可重复读,序列化读。默认是可重复读。
持久性:保证事务提交后,修改的数据会永久的保存在数据库中。通过redolog实现持久性。
两阶段锁策略:
一阶段锁策略:当事务开始前,会将所有的锁请求完,若其中一个锁不能阻塞,则所有锁将会等待。请求成功后,直到事务尾部会将所有锁释放。不会产生死锁的问题。因为锁时间相对较长,所以并发度不高。
两阶段锁策略:将事务分为加锁和解锁两个阶段。在加锁阶段,每条语句可以根据数据获取对应的锁,此时可以操作数据,但不能解锁。直到事务commit/rollback时才会解锁。加锁时间较短,所以并发度较高。但是会因为加锁的顺序不同导致产生死锁。
参考:MYSQL-两阶段加锁协议
死锁:产生的原因是因为事务中加锁顺序不同。处理办法是持有较少行级排他锁进行回滚。
MVCC多版本并发控制:通过每行记录后面保存两个列存储创建和删除时的系统版本号(时间戳)。
3.存储引擎
创建表时,MySQL会在数据库子目录下创建一个同名.frm文件保存表的定义
InnoDB: 处理大量的短期事务, 通过间隙锁锁定查询涉及的行和索引中的间隙进行锁定,防止幻影行的插入, 基于聚簇索引创建表.通过一些机制和工具支持真正的热备份.一般优先考虑InnoDB存储引擎
MyISAM: 包括全文索引,压缩,空间函数,延迟更新索引键等特性,不支持事务和行级锁,崩溃后无法安全恢复.对于只读数据,表小可以忍受修复操作可以使用该引擎.
如果要使用全文索引,建议用InnoDB加上Sphinx组合替换MyISAM
使用引擎考虑:事务,备份,崩溃恢复,特有特性
日志型应用: MyISAM 或者Archive,因为开销低插入速度快更为适合
对于大数据量需要建立数据仓库,Infobright和TokuDB是比较好的解决方案