基本法则:索引应该构建在被用作查询条件的字段上;
索引类型:
B+ Tree索引:顺序存储,每一个叶子节点到根节点的距离是相同的;左前缀索引,适合查询范围类的数据; 可以使用B-TREE索引的查询类型:全键值、键值范围或键前缀查找 全值匹配:精确某个值,“Jinjiao King”; 匹配最左前缀: 只精确匹配起头部分:“Jin%” 匹配范围值: 精确匹配某一列并范围匹配另一列 只访问索引的查询 不适合使用B-Tree索引的场景: 如果不从最左列开始,索引无效:(Name,Age) 不能跳过索引中的列:(StuID,Name,Age) 如果查询中某个列是为范围查询,那么其右侧的列都无法再使用索引优化查询:(StuID,Name,Age)
Hash索引:基于哈希表实现的索引,特别适用于精确匹配索引中的所有列 注意:只有Memory存储引擎支持显式hash索引; 使用场景: 只支持等值比较查询,包括=,IN(),<=>; 不适合使用hash索引的场景: 存储的非为值的顺序,因此,不适用于顺序查询; 不支持模糊匹配;
空间索引(R-TREE): MyISAM支持空间索引:
全文索引(FULLTEXT): 在文本中查找关键词:
索引优点:
索引可以降低服务器需要扫描的数据量,因此减少了IO次数; 索引可以帮助服务器避免排序和使用临时表; 索引可以帮助将随机I/O转为顺序I/O;
高性能索引策略:
独立使用列,尽量避免字段运算; 左前缀索引:索引构建于字段的左侧的多少个字符,要通过索引选择性来评估: 索引选择性:不重复的索引值和数据表的记录总数的比值; 多列索引: AND操作时更适合使用多列索引 选择合适的索引列次序:将选择性最高的放左侧
通过EXPLAIN来分析索引的有效性:
EXPLAIN SELECT clause 获取查询执行计划信息,用来查看查询优化器如何进行查询;
输出: id: 1 select_type: SIMPLE table: students type: range possible_keys: PRIMARY key: PRIMARY key_len: 4 ref: NULL rows: 24 Extra: Using where
id: 当前查询语句中,每个SELECT语句的编号 复杂类型的查询有三种: 简单子查询; 用于FROM中的子查询; 联合查询:UNION; 注意:UNION查询的分析结果会出现额外的匿名临时表
select_type: 查询类型; 简单查询为SIMPLE 复杂查询: SUBQUERY:子查询 DERIVED: 用于FROM中的子查询 UNION: UNION语句的第一个之后的SELECT语句 UNION RESULT:匿名临时表
table: SELECT语句关联到的表
type: 关联类型;或访问类型,即MySQL决定如何去查询表中的行的方式 ALL:全表扫描; index: 根据索引的次序进行全表扫描;如果在Extra列出现“Using Index”表示使用覆盖索引,而非全表扫描; range: 有范围限制的根据索引实现范围扫描;扫描位置始于索引中的某一点,结束于另一点; ref: 根据索引返回表中所有匹配某单个值的所有行; eq_ref: 仅返回一个行,但需要与某个参考值做比较 const, system: 直接返回单个行
possible_keys: 查询可能会用到的索引;
key: 查询中使用了的索引;
key_len: 在索引中使用的字节数;
ref: 在利用key字段所表示的索引完成查询时所用的列或某常量值;
rows: mysql估计为找所有的目标而需要读取的行数;
Extra: 额外信息 Using index: mysql将会使用覆盖索引,以避免访问表; Using where: mysql将会在存储引擎检索后,再进行一次过滤 Using temporary: mysql对结果排序时会使用临时表 Using filesort: 对结果使用一个外部索引排序;