MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。如下面的示意图所示。
左边是数据表,一共有两开七条记录,最左边的是数据记录的物理地址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找快速度获取到相应数据
二叉树查找法规则
二叉树每个节点最多只有两个分支
左边第一列为ID号,1..7
左边第二列为数据:34..3
第一行数据:顶部根部为34
第二行数据: 数据为77,大于根部数据34的放在右边,小于在左边,所以77放在第二行的右边
第三行数据:数据为5,由于5小于三十四所以放在第二行的左边
第四行数据:数据为91,由于二叉树结构是只有两个分叉,所以34下面第二行不能再放数据,需放在第三行,那91还是大于34,所以放在右边,而91又大于77,所以又放在77的右边,也就是第三行的最右边
第五行数据:数据为22,小于34,所以放在34的左边,而22又大于5,所以又放在第三行5的右边
第六行数据:数据库59,大于34,小于77,所以放在77的左边
第七行数据:数据库3,小于34又小于5所以放在第三的最左边
一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件形式存储在磁盘上。索引是在数据库中用来提高性能的最常用工具。
索引优势劣势
优势
1)类似于书籍中的目录索引,提高数据检索的效率,降低数据库的IO成本
2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
劣势
1)实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的
2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的健变化的索引信息
索引结构
索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同。也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引:
- BTREE索引:最常见的索引类型 ,大部分索引都支持B树索引。
- HASH索引”只有Memory引擎支持,使用场景简单
- R-tree索引(空间索引):空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。
- Full-text(全文索引):全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从MySQL5.6版本开始支持全文索引。
我们平常说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。其中聚集索引,复合索引,前辍索引,唯一索引默认都是使用B+tree树索引,统称为索引