从MySQL5.5版本开始,Insert buffer更名为change buffer,除了缓冲对二级索引的insert操作,还包括update/delete/后台purge操作,由参数innodb_change_buffering来控制。因此这里统一称为change buffer。
//////////////////////////////////////////////////////////
当更新/插入的非聚集索引的数据所对应的页不在内存中时(对非聚集索引的更新操作通常会带来随机IO),会将其放到一个insert buffer中,当随后页面被读到内存中时,会将这些变化的记录merge到页中。当服务器比较空闲时,后台线程也会做merge操作
但change buffer会占用buffer pool,并且在非聚集索引很少时,并不总是必要的,反而会降低buffer pool做data cache的能力。
change buffer只作用于二级索引的叶子节点,并且无法处理可能导致索引分裂或合并的操作。
另外和5.1有所不同的是,由于5.5引入了更多buffer的操作,因此需要在ibuf中保证对一个page的操作是有序的。
当文件页在buffer pool中时,就直接操作文件页,而不会去考虑ibuf;当文件页从磁盘读入内存时,总会去尝试做Merge。
在表空间中,有ibuf bitmap来跟踪记录每个Page空闲空间的范围,以避免Page溢出或被清空。
在FSP_HDR页随后是ibuf_bitmap页,其中FSP_HDR在表空间的第一个Page上。每个FSP_HDR只能管理256 个extent的信息(也就是16384个Page),因此每隔16384个page,会有一个类似FSP_HDR的Page来描述随后的extend信息,相应的每个ibuf_bitmap也可以管理16384个page,每个page的空闲空间用一个字节来表示。
从Jeremy Cole大神博客上扣的图:
另外,change buffer的数据实际上是在系统表空间ibdata中,对应的内部系统表名为SYS_IBUF_TABLE。因此change buffer也会存储到磁盘。
其中,ibdata的第4个page(FSP_IBUF_HEADER_PAGE_NO)存储了ibuf数的SEGEMENT信息。
第5个page(FSP_IBUF_TREE_ROOT_PAGE_NO)是ibuf树的根节点。
在Percona版本的5.5中,有几个参数来控制change buffer的行为:
innodb_change_buffering |
取值包括all/none/inserts/deletes/changes/purges 其中deletes包括了delete和update操作(二级索引的update是 标记删除旧记录,再插入新记录). |
innodb_ibuf_accel_rate |
默认值为100,用于控制做change buffer merge的page数量 一般作为ibuf_contract_for_n_pages函数的第二个参数 是宏PCT_IBUF_IO,定义如下: #define PCT_IBUF_IO(pct) ((ulint) (srv_io_capacity * srv_ibuf_accel_rate * ((double) pct / 10000.0))) 如果想加快ibuf merge,可以调大这个参数 |
innodb_ibuf_active_contract |
BOOL类型,默认值为0; 如果在执行ibuf_insert_low时,写入ibuf记录导致ibuf tree分裂, 会去调用ibuf_contract_after_insert对Ibuf进行Merge。 默认值为0表示,如果当前ibuf的大小没有超过最大值,则不做Merge 设置为1则表示,每次出现ibuf tree分裂,都要去merge ibuf. |
innodb_ibuf_max_size |
change buffer的占buffer pool内存的最大值,默认为二分之一的 buffer pool大小。这是只读变量;如果使用change buffer,一定要 考虑这个值是否合适; |
有一些变量可以来监控change buffer的运行状态(内部变量见函数ibuf_export_ibuf_status):
Innodb_ibuf_discarded_delete_marks |
对应ibuf->n_discarded_ops[IBUF_OP_DELETE_MARK] 抛弃的delete mark操作次数 |
Innodb_ibuf_discarded_deletes |
ibuf->n_discarded_ops[IBUF_OP_DELETE] 抛弃的purge delete记录次数 |
Innodb_ibuf_discarded_inserts |
ibuf->n_discarded_ops[IBUF_OP_INSERT] 抛弃的insert操作次数 |
Innodb_ibuf_free_list |
对应ibuf->free_list_len,表示ibuf树的空闲链表长度, |
Innodb_ibuf_merged_delete_marks |
ibuf->n_merged_ops[IBUF_OP_DELETE_MARK] 合并delete mark操作的次数 |
Innodb_ibuf_merged_deletes |
ibuf->n_merged_ops[IBUF_OP_DELETE] 合并Purge操作的次数 |
Innodb_ibuf_merged_inserts |
ibuf->n_merged_ops[IBUF_OP_INSERT] 合并INSERT操作的次数 |
Innodb_ibuf_merges |
ibuf->n_merges 总的合并次数 |
Innodb_ibuf_segment_size |
ibuf->seg_size 包含ibuf header页和ibuf tree的segment的Page数 |
Innodb_ibuf_size |
ibuf->size 表示Ibuf 索引树的page数 |
其中
ibuf->size = ibuf->seg_size – (1 + ibuf->free_list_len)
ibuf->free_list_len = flst_get_len(root + PAGE_HEADER+ PAGE_BTR_IBUF_FREE_LIST, mtr); //root为ibuf树的根页面
ibuf是一个全局变量,也是change buffer的控制结构体,其对应的结构体类型为ibuf_struct,可以看到其中大部分记录的都是计数,用于追踪ibuf树
当前的状态,以内内存changebuffer操作的计数,除了上面提到的几个结构体成员外,还有:
ibook empty; //当为TRUE时,表示ibuf树为空,该变量由ibuf根页面的page latch保护。
ulint height; //ibuf树的高度
dict_index_t* index; //ibuf数上的索引结构体。
另外show engine innodb status也会打印一些相关信息:
————————————-
INSERT BUFFER AND ADAPTIVE HASH INDEX
————————————-
Ibuf: size 1, free list len 1886, seg size 1888, 7176 merges
merged operations:
insert 9747, delete mark 18295, delete 13183
discarded operations:
insert 0, delete mark 0, delete 0
这些值和上面提到的几个status值也是对应的。