深耕MySQL - 解析如何使用联合索引执行查询

文章目录

1. 什么是联合索引

同时以多个列作为排序规则,也就是同时为多个列建立索引。比如,我们想让B+树按照c2列和c3列的大小进行排序,这两包含两层含义:

  • 先把各个记录和页按照c2列进行排序;
  • 在记录的c2列相同的情况下,再采用c3列进行排序;

为c2列和c3列建立索引,示意图为:
深耕MySQL - 解析如何使用联合索引执行查询
在上图的B+树中需要注意以下两点:

  • 每条目录项记录都由c2例、c3列、页号这3部分组成。各条记录先按照c2列的值进行排序,如果记录的c2列相同,则按照c3列的值进行排序。

  • B+树叶子节点处的用户记录由c2列、c3列和主键c1列组成。

注意:以c2列和c3列的大小为排序规则建立的B+树索引为联合索引,也称为复合索引或多列索引。它本质上也是一个二级索引,它的索引列包括c2列和c3列。

以c2和c3列的大小为排序规则建立联合索引和分别为c2和c3列建立索引的表述是不同的,不同点如下:

(1) 建立联合索引只会建立上面的一颗B+树;
(2) 为c2和c3列分别建立索引时,则会分别以c2和c3列的大小为排序规则建立两颗B+树;

如果是联合索引,则页面和记录先按照索引列中前面的列排序:如果该列的值相同,再按照索引列中后面的列的值排序。

2. 使用联合索引执行查询(索引列是否生效)

首先建立一张表,并未表中的列建立索引:

create table single_table(
	id int not auto_increment, 
	key1 varchar(100),         
	key2 int,
	kay3 varchar(100),
	key_part1 varchar(100),
	key_part2 varchar(100),
	key_part3 varchar(100),
	primary key(id),          # 聚簇索引
	key idx_key1(key1),       # 二级索引
	unique key uk_key2(key2), # 二级索引,而且该索引是唯一二级索引
	key idx_key3(key3),       # 二级索引
	key idx_key_part(key_part1,key_part2,key_part3) # 二级索引,也是联合索引
) Engine=InnoDB CHARSET=utf8;

联合索引的索引列包含多个列,B+树中的每一层页面以及每个页面中的记录采用的排序规则较为复杂。以single_table表中的idx_key_part为例,它采用的排序规则如下:

(1) 先按照key_part1列的值进行排序;

(2) 在key_part1列的值相同的情况下,再按照key_part2列的值进行排序;

(3) 在key_part1key_part2列的值都相同的情况下,再按照key_part3列的值进行排序;

如下为idx_key_part索引的简化示意图,省去目录项记录和单双向链表:
深耕MySQL - 解析如何使用联合索引执行查询
例1、对于查询语句Q1来说:

select * from single_table where key_part1='a';

由于二级索引记录idx_key_part是先按照key_part1列的值排序的,所以符合key_part1='a'条件的所有记录肯定是相邻的,我们可以定位到符合key_part1='a’条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1='a’的条件为止。(如果本页面中的记录扫描完了,就根据叶子节点的双向链表继续向下扫描)。

由于我们的查询列表是*,也就是需要读取完整的用户记录,所以从上述扫描区间中每获取一条二级索引记录,就需要根据二级索引记录的id列的值执行回表操作,也就是到聚簇索引中找到相应的聚簇索引记录。
深耕MySQL - 解析如何使用联合索引执行查询

例2、对于查询语句Q2来说:

select * from single_table where key_part1='a' and key_part2='b';

由于二级索引记录是按照key_part1列的值排序的,在key_part1列的值相等的情况下再按照key_part2列进行排序,所以符合key_part1='a'key_part2='b'条件的二级索引记录肯定是相邻的。我们可以定位到符合key_part1='a' and key_part2='b'条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1='a'key_part2='b'条件为止。
深耕MySQL - 解析如何使用联合索引执行查询
例3、对于查询语句Q3来说:

select * from single_table where key_part1='a' and key_part2='b' and key_part3='c';

由于二级索引记录是先按照key_part1列的值排序的,在key_part1列的值相等的情况下再按照key_part2列进行排序,在key_part1和key_part2列的值都相等的情况,再按照key_part3列进行排序,所以符合条件key_part1='a' and key_part2='b' and key_part3='c'条件的二级索引记录肯定是相邻的。我们可以定位到符合key_part1='a' and key_part2='b' and key_part3='c'条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1='a'key_part2='bkey_part3='c'条件为止,当然,每一条二级索引记录都需要进行回表操作。
深耕MySQL - 解析如何使用联合索引执行查询
例4、对于查询语句Q4来说:

select * from single_table where key_part1<'a';

由于二级索引记录idx_key_part是先按照key_part1列的值排序的,所以符合key_part1<'a'条件的所有记录肯定是相邻的,我们可以定位到符合key_part1<'a’条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1<'a’的条件为止
深耕MySQL - 解析如何使用联合索引执行查询

例5、对于查询语句Q5来说:

seelct * from single_table where key_part2='a'

由于二级索引记录不是直接按照key_part2列的值排序的,所以符合key_part2='a’的二级索引记录可能并不相邻,也就是说我们不能通过这个key_part2='a’搜索条件来减少需要扫描的记录数量。在这种情况下,我们是不会使用idx_key_part索引执行查询的。

例6、对于查询语句Q6来说:

select * from single_table where key_part1='a' and key_part3='c';

由于二级索引记录idx_key_part是先按照key_part1列的值排序的,所以符合key_part1='a'条件的所有记录肯定是相邻的,但是对于符合key_part1='a'条件的二级索引记录来说,并不是直接按照key_part3列进行排序的,也就是说我们不能根据根据搜索条件key_part3='c'来进一步减少需要扫描的数量。

如果使用idx_key_part索引执行查询,可以定位到符合key_part1='a’条件的第一条记录,然后沿着记录所在的单向链表向后扫描,知道某条记录不符合key_part1='a’条件为止,与key_part3='c’无关,即只有key_part1列走了索引。

上一篇:《R数据可视化手册》一第2章 快速探索数据2.1 绘制散点图


下一篇:Java反序列化漏洞执行命令回显实现及Exploit下载