InnoDB体系结构
后台线程
有多个 不同的后台线程,负责处理不同的任务。
1.Master Thread
核心的后台线程,负责将缓冲池中的数据异步刷新到磁盘,保持数据一致性,包括脏页的刷新、合并插入缓冲(INSERT BUFFER)、回收UNDO页。
2.IO Thread
InnoDB大量使用AIO(异步IO)来处理IO请求,性能好。IO Thread工作是负责IO请求的回调处理。
3.Purge Thread
负责回收已使用并分配的undo页(本来由Master完成,减轻Master负担)
4.Page Cleaner Thread
单独的线程来刷新脏页(本来由Master完成)
内存
缓冲池
概念:使用缓冲池技术提高数据库整体性能,InnoDB基于磁盘存储,并将其中的记录按照页的方式进行管理。磁盘速度较慢。缓冲池就是一块内存区域,缓存从磁盘读到的页。读取页时先判断是否在缓冲池中。
修改:如果要修改页,则首先修改缓冲池的页,再以一定频率刷新到磁盘。通过Checkpoint机制刷新回磁盘。
缓冲池中不止有索引页和数据页。
InnoDB1.0.x版本开始,允许多个缓冲池实例。每个页根据哈希值平均分配到不同缓冲池实例中。可以减少数据库内部的资源竞争,增加并发能力。
LRU
缓冲池中的页使用LRU算法管理,但是对LRU做了优化,新读取的页放到LRU的midpoint位置,midpoint前的列表称为new列表,midpoint后的列表称为old列表。
脏页
缓冲池中的页和磁盘上的页数据产生不一致。
重做日志缓冲
InnoDB首先将重做日志信息放入这个缓冲区,然后按一定频率将其刷新到重做日志文件。
额外的内存池
数据结构本身的内存进行分配时,需要从额外内存池申请,不够会从缓冲池申请。如缓冲池的帧缓冲和缓冲控制对象(记录LRU、锁)。
申请很大的缓冲池时,要增大额外内存池。
Checkpoint
改变页中记录时,缓冲池中的页是脏的,数据库需要将新版本的页刷新到磁盘。
Write Ahead Log
原因:如果刷新到磁盘时发生宕机,数据不能恢复。所以普遍采用Write Ahead Log。
概念:事务提交时,先写重做日志,再修改页。如果宕机数据丢失,通过重做日志来恢复数据。这也是ACID中D(持久性)的要求。
Checkpoint
概念:采用Checkpoint机制,宕机时,数据库只需对Checkpoint之后的重做日志进行恢复,Checkpoint之前的页已经刷新回磁盘。
种类:Sharp Checkpoint(数据库关闭时刷新所有脏页) Fuzzy Checkpoint(引擎调用,只刷新一部分,具体见书)
Master Thread工作方式
见书
InnoDB关键特性
插入缓冲
两次写
自适应哈希索引
异步IO
刷新邻接页