文章目录
1. 什么是联合索引
同时以多个列作为排序规则,也就是同时为多个列建立索引。比如,我们想让B+树按照c2列和c3列的大小进行排序,这两包含两层含义:
- 先把各个记录和页按照c2列进行排序;
- 在记录的c2列相同的情况下,再采用c3列进行排序;
为c2列和c3列建立索引,示意图为:
在上图的B+树中需要注意以下两点:
-
每条目录项记录都由c2例、c3列、页号这3部分组成。各条记录先按照c2列的值进行排序,如果记录的c2列相同,则按照c3列的值进行排序。
-
B+树叶子节点处的用户记录由c2列、c3列和主键c1列组成。
注意:以c2列和c3列的大小为排序规则建立的B+树索引为联合索引,也称为复合索引或多列索引。它本质上也是一个二级索引,它的索引列包括c2列和c3列。
以c2和c3列的大小为排序规则建立联合索引和分别为c2和c3列建立索引的表述是不同的,不同点如下:
(1) 建立联合索引只会建立上面的一颗B+树;
(2) 为c2和c3列分别建立索引时,则会分别以c2和c3列的大小为排序规则建立两颗B+树;
如果是联合索引,则页面和记录先按照索引列中前面的列排序:如果该列的值相同,再按照索引列中后面的列的值排序。
2. 使用联合索引执行查询(索引列是否生效)
首先建立一张表,并未表中的列建立索引:
create table single_table(
id int not auto_increment,
key1 varchar(100),
key2 int,
kay3 varchar(100),
key_part1 varchar(100),
key_part2 varchar(100),
key_part3 varchar(100),
primary key(id), # 聚簇索引
key idx_key1(key1), # 二级索引
unique key uk_key2(key2), # 二级索引,而且该索引是唯一二级索引
key idx_key3(key3), # 二级索引
key idx_key_part(key_part1,key_part2,key_part3) # 二级索引,也是联合索引
) Engine=InnoDB CHARSET=utf8;
联合索引的索引列包含多个列,B+树中的每一层页面以及每个页面中的记录采用的排序规则较为复杂。以single_table表中的idx_key_part
为例,它采用的排序规则如下:
(1) 先按照key_part1
列的值进行排序;
(2) 在key_part1
列的值相同的情况下,再按照key_part2
列的值进行排序;
(3) 在key_part1
和key_part2
列的值都相同的情况下,再按照key_part3
列的值进行排序;
如下为idx_key_part
索引的简化示意图,省去目录项记录和单双向链表:
例1、对于查询语句Q1来说:
select * from single_table where key_part1='a';
由于二级索引记录idx_key_part
是先按照key_part1
列的值排序的,所以符合key_part1='a'
条件的所有记录肯定是相邻的,我们可以定位到符合key_part1='a’条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1='a’的条件为止。(如果本页面中的记录扫描完了,就根据叶子节点的双向链表继续向下扫描)。
由于我们的查询列表是*
,也就是需要读取完整的用户记录,所以从上述扫描区间中每获取一条二级索引记录,就需要根据二级索引记录的id列的值执行回表操作,也就是到聚簇索引中找到相应的聚簇索引记录。
例2、对于查询语句Q2来说:
select * from single_table where key_part1='a' and key_part2='b';
由于二级索引记录是按照key_part1
列的值排序的,在key_part1
列的值相等的情况下再按照key_part2
列进行排序,所以符合key_part1='a'
和key_part2='b'
条件的二级索引记录肯定是相邻的。我们可以定位到符合key_part1='a' and key_part2='b'
条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1='a'
或key_part2='b'
条件为止。
例3、对于查询语句Q3来说:
select * from single_table where key_part1='a' and key_part2='b' and key_part3='c';
由于二级索引记录是先按照key_part1
列的值排序的,在key_part1
列的值相等的情况下再按照key_part2
列进行排序,在key_part1和key_part2列的值都相等的情况,再按照key_part3列进行排序,所以符合条件key_part1='a' and key_part2='b' and key_part3='c'
条件的二级索引记录肯定是相邻的。我们可以定位到符合key_part1='a' and key_part2='b' and key_part3='c'
条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1='a'
或 key_part2='b
或key_part3='c'
条件为止,当然,每一条二级索引记录都需要进行回表操作。
例4、对于查询语句Q4来说:
select * from single_table where key_part1<'a';
由于二级索引记录idx_key_part
是先按照key_part1
列的值排序的,所以符合key_part1<'a'
条件的所有记录肯定是相邻的,我们可以定位到符合key_part1<'a’条件的第一条记录,然后沿着记录所在的单向链表向后扫描,直到某条记录不符合key_part1<'a’的条件为止
例5、对于查询语句Q5来说:
seelct * from single_table where key_part2='a'
由于二级索引记录不是直接按照key_part2列的值排序的,所以符合key_part2='a’的二级索引记录可能并不相邻,也就是说我们不能通过这个key_part2='a’搜索条件来减少需要扫描的记录数量。在这种情况下,我们是不会使用idx_key_part索引执行查询的。
例6、对于查询语句Q6来说:
select * from single_table where key_part1='a' and key_part3='c';
由于二级索引记录idx_key_part
是先按照key_part1
列的值排序的,所以符合key_part1='a'
条件的所有记录肯定是相邻的,但是对于符合key_part1='a'
条件的二级索引记录来说,并不是直接按照key_part3列进行排序的,也就是说我们不能根据根据搜索条件key_part3='c'
来进一步减少需要扫描的数量。
如果使用idx_key_part
索引执行查询,可以定位到符合key_part1='a’条件的第一条记录,然后沿着记录所在的单向链表向后扫描,知道某条记录不符合key_part1='a’条件为止,与key_part3='c’无关,即只有key_part1列走了索引。