[MySQL学习] Innodb change buffer(1)之初识篇

从MySQL5.5版本开始,Insert buffer更名为change buffer,除了缓冲对二级索引的insert操作,还包括update/delete/后台purge操作,由参数innodb_change_buffering来控制。因此这里统一称为change buffer。

//////////////////////////////////////////////////////////

当更新/插入的非聚集索引的数据所对应的页不在内存中时(对非聚集索引的更新操作通常会带来随机IO),会将其放到一个insert buffer中,当随后页面被读到内存中时,会将这些变化的记录merge到页中。当服务器比较空闲时,后台线程也会做merge操作

但change buffer会占用buffer pool,并且在非聚集索引很少时,并不总是必要的,反而会降低buffer pool做data cache的能力。

change buffer只作用于二级索引的叶子节点,并且无法处理可能导致索引分裂或合并的操作。

另外和5.1有所不同的是,由于5.5引入了更多buffer的操作,因此需要在ibuf中保证对一个page的操作是有序的。

当文件页在buffer pool中时,就直接操作文件页,而不会去考虑ibuf;当文件页从磁盘读入内存时,总会去尝试做Merge。

在表空间中,有ibuf bitmap来跟踪记录每个Page空闲空间的范围,以避免Page溢出或被清空。

在FSP_HDR页随后是ibuf_bitmap页,其中FSP_HDR在表空间的第一个Page上。每个FSP_HDR只能管理256 个extent的信息(也就是16384个Page),因此每隔16384个page,会有一个类似FSP_HDR的Page来描述随后的extend信息,相应的每个ibuf_bitmap也可以管理16384个page,每个page的空闲空间用一个字节来表示。

从Jeremy Cole大神博客上扣的图:

[MySQL学习] Innodb change buffer(1)之初识篇

另外,change buffer的数据实际上是在系统表空间ibdata中,对应的内部系统表名为SYS_IBUF_TABLE。因此change buffer也会存储到磁盘。

[MySQL学习] Innodb change buffer(1)之初识篇

其中,ibdata的第4个page(FSP_IBUF_HEADER_PAGE_NO)存储了ibuf数的SEGEMENT信息。

第5个page(FSP_IBUF_TREE_ROOT_PAGE_NO)是ibuf树的根节点。

在Percona版本的5.5中,有几个参数来控制change buffer的行为:

innodb_change_buffering

取值包括all/none/inserts/deletes/changes/purges

其中deletes包括了delete和update操作(二级索引的update是

标记删除旧记录,再插入新记录).

innodb_ibuf_accel_rate

默认值为100,用于控制做change buffer merge的page数量

一般作为ibuf_contract_for_n_pages函数的第二个参数

是宏PCT_IBUF_IO,定义如下:

#define PCT_IBUF_IO(pct) ((ulint) (srv_io_capacity 

                * srv_ibuf_accel_rate * ((double) pct / 10000.0)))

如果想加快ibuf merge,可以调大这个参数

innodb_ibuf_active_contract

BOOL类型,默认值为0;

如果在执行ibuf_insert_low时,写入ibuf记录导致ibuf tree分裂,

会去调用ibuf_contract_after_insert对Ibuf进行Merge。

默认值为0表示,如果当前ibuf的大小没有超过最大值,则不做Merge

设置为1则表示,每次出现ibuf tree分裂,都要去merge ibuf.

innodb_ibuf_max_size

change buffer的占buffer pool内存的最大值,默认为二分之一的

buffer pool大小。这是只读变量;如果使用change buffer,一定要

考虑这个值是否合适;


有一些变量可以来监控change buffer的运行状态(内部变量见函数ibuf_export_ibuf_status):

Innodb_ibuf_discarded_delete_marks

对应ibuf->n_discarded_ops[IBUF_OP_DELETE_MARK]

抛弃的delete mark操作次数

Innodb_ibuf_discarded_deletes

ibuf->n_discarded_ops[IBUF_OP_DELETE]

抛弃的purge delete记录次数

Innodb_ibuf_discarded_inserts

ibuf->n_discarded_ops[IBUF_OP_INSERT]

抛弃的insert操作次数

Innodb_ibuf_free_list

对应ibuf->free_list_len,表示ibuf树的空闲链表长度,

Innodb_ibuf_merged_delete_marks

ibuf->n_merged_ops[IBUF_OP_DELETE_MARK] 

合并delete mark操作的次数

Innodb_ibuf_merged_deletes

ibuf->n_merged_ops[IBUF_OP_DELETE]

合并Purge操作的次数

Innodb_ibuf_merged_inserts

ibuf->n_merged_ops[IBUF_OP_INSERT]

合并INSERT操作的次数

Innodb_ibuf_merges

ibuf->n_merges

总的合并次数

Innodb_ibuf_segment_size

ibuf->seg_size 包含ibuf header页和ibuf tree的segment的Page数

Innodb_ibuf_size

ibuf->size  表示Ibuf 索引树的page数

其中

ibuf->size = ibuf->seg_size – (1 + ibuf->free_list_len)

ibuf->free_list_len = flst_get_len(root + PAGE_HEADER+ PAGE_BTR_IBUF_FREE_LIST, mtr);  //root为ibuf树的根页面

ibuf是一个全局变量,也是change buffer的控制结构体,其对应的结构体类型为ibuf_struct,可以看到其中大部分记录的都是计数,用于追踪ibuf树

当前的状态,以内内存changebuffer操作的计数,除了上面提到的几个结构体成员外,还有:

ibook empty;   //当为TRUE时,表示ibuf树为空,该变量由ibuf根页面的page latch保护。

ulint height;     //ibuf树的高度

dict_index_t* index;  //ibuf数上的索引结构体。


另外show engine innodb status也会打印一些相关信息:

————————————-

INSERT BUFFER AND ADAPTIVE HASH INDEX

————————————-

Ibuf: size 1, free list len 1886, seg size 1888, 7176 merges

merged operations:

 insert 9747, delete mark 18295, delete 13183

discarded operations:

 insert 0, delete mark 0, delete 0

这些值和上面提到的几个status值也是对应的。


上一篇:创建二叉树并遍历二叉树


下一篇:HDU 1237 简单计算器