MySQL学习笔记,数据库索引

参考资料:

https://www.2cto.com/database/201801/715205.html

一、 概念

表1 MySQL概念
MySQL 表示
数据库 数据库是表的集合,具有相关数据
表是用数据矩阵。在一个数据库中的表看起来就像一个简单的电子表格
一列(数据元素)包含一个的数据和相同种类,例如,列邮政编码。行一行(元组,条目或记录)是一组相关的数据,例如一个订阅的数据。
冗余
 
存储数据两次,冗余使系统更快。
 
主键 主键是唯一的。不能在一个表中出现的一个键两次。使用键可以快速找到一行。
 
复合键 复合键是由多个列,因为有时一个列是不够唯一标识键的。
 
外键 外键是两个表之间的连接值。
 
索引 在数据库中的索引类似于索引在一本书(书的目录)。
参照完整性 参照完整性可以确保外键值总是指向现有的行。

其他都很容易理解,索引理解参考这篇文章 深入浅出数据库索引原理https://www.cnblogs.com/aspwebchh/p/6652855.html

1.聚集索引

大意是,如果给表上了主键,那么表在磁盘上的存储结构就由整齐排列的结构转变成了树状结构,也就是「平衡树」结构,换句话说,就是整个表就变成了一个索引。也就是所谓的「聚集索引」。 这就是为什么一个表只能有一个主键, 一个表只能有一个「聚集索引」,因为主键的作用就是把「表」的数据格式转换成「索引(平衡树)」的格式放置。

MySQL学习笔记,数据库索引
图 数据库索引查找 

如运行下面代码时:

select * from table where id = 1256;
MySQL学习笔记,数据库索引

首先根据索引定位到1256这个值所在的叶结点,然后再通过叶结点取到id等于1256的数据行。从上图能看出,树一共有三层, 从根节点至叶节点只需要经过三次查找就能得到结果。

索引能让数据库查询数据的速度上升, 但会使写入数据的速度下降, 因为平衡树这个结构必须一直维持在一个正确的状态, 增删改数据都会改变平衡树各节点中的索引数据内容,破坏树结构, 因此,在每次数据改变时, DBMS(数据库管理系统)必须去重新梳理树(索引)的结构以确保它的正确,这会带来不小的性能开销,也就是为什么索引会给查询以外的操作带来副作用的原因。

2.非聚集索引

非聚集所以就是我们平时经常提起和使用的常规索引,非聚集索引和聚集索引一样, 同样是采用平衡树作为索引的数据结构。索引树结构中各节点的值来自于表中的索引字段, 假如给user表的name字段加上索引 , 那么索引就是由name字段中的值构成,在数据改变时, DBMS需要一直维护索引结构的正确性。如果给表中多个字段加上索引 , 那么就会出现多个独立的索引结构,每个索引(非聚集索引)互相之间不存在关联。

MySQL学习笔记,数据库索引
图 带有主键和三个非聚集索引的表的存储结构

每次给字段建一个新索引, 字段中的数据就会被复制一份出来, 用于生成索引。 因此,给表添加索引,会增加表的体积,占用磁盘存储空间。

非聚集索引和聚集索引的区别在于,通过聚集索引可以查到需要查找的数据,而通过非聚集索引可以查到记录对应的主键值 ,再使用主键的值通过聚集索引查找到需要的数据,如下图。

MySQL学习笔记,数据库索引
图 从非聚集索引开始查找

不管以任何方式查询表, 最终都会利用主键通过聚集索引来定位到数据, 聚集索引(主键)是通往真实数据所在的唯一路径。

然而, 有一种例外可以不使用聚集索引就能查询出所需要的数据, 这种非主流的方法 称之为「覆盖索引」查询, 也就是平时所说的复合索引或者多字段索引查询。 文章上面的内容已经指出, 当为字段建立索引以后, 字段中的内容会被同步到索引之中, 如果为一个索引指定两个字段, 那么这个两个字段的内容都会被同步至索引之中。

先看下面这个SQL语句

//建立索引

create index index_birthday on user_info(birthday);

//查询生日在1991年11月1日出生用户的用户名

select user_name from user_info where birthday = '1991-11-1'

这句SQL语句的执行过程如下

  • 通过非聚集索引index_birthday查找birthday等于1991-11-1的所有记录的主键ID值
  • 通过得到的主键ID值执行聚集索引查找,找到主键ID值对就的真实数据(数据行)存储的位置
  • 最后, 从得到的真实数据中取得user_name字段的值返回, 也就是取得最终的结果

我们把birthday字段上的索引改成双字段的覆盖索引

create index index_birthday_and_user_name on user_info(birthday, user_name);

这句SQL语句的执行过程就会变为

  • 通过非聚集索引index_birthday_and_user_name查找birthday等于1991-11-1的叶节点的内容,
  •  叶节点中除了有user_name表主键ID的值以外, user_name字段的值也在里面, 不需要通过主键ID值的查找数据行的真实所在 
  • 直接取得叶节点中user_name的值返回

通过这种覆盖索引直接查找的方式, 可以省略不使用覆盖索引查找的后面两个步骤, 提高了查询性能。

MySQL学习笔记,数据库索引
图 覆盖索引查找

 

 

上一篇:项目总结55:Java前端Date日期前端年月日展示问题


下一篇:Linux下汇编语言学习笔记4 ---