一文必懂-MySQL调优之Explain工具(一）

2022-11-19 18:33:02

MySQL调优之Explain

Expalin介绍

Expalin介绍

使用Explain关键字可以模拟优化器执行SQL语句，分析查询语句或者结构的性能瓶颈；
用法：在Select语句前增加explain关键字，MySQL会在查询上设置一个标记，执行查询会返回执行计划的信息，而不是这条SQL

Explain分析实例

官方文档：
https://dev.mysql.com/doc/refman/5.7/en/explain-output.html

表1：

CREATE TABLE `actor` (
  `id` int(11) NOT NULL,
  `name` varchar(45) DEFAULT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

表2：

CREATE TABLE `film` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8;

表3：

CREATE TABLE `film_actor` (
  `id` int(11) NOT NULL,
  `film_id` int(11) NOT NULL,
  `actor_id` int(11) NOT NULL,
  `remark` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

使用：

1 mysql> explain select * from actor;

结果：

有多少张表参与查询，就会显示多少行数据；
例如双表join，嵌套子查询，就会显示两条；

explain 两个变种

explain extended：会在explain的基础额外提供一些查询优化的信息。紧随其后通过 show warnings 命令可以得到优化后的查询语句，从而看出优化器优化了什么。
额外还有 filtered 列，是一个半分比的值，rows * filtered/100 可以估算出将要和 explain 中前一个表进行连接的行数（前一个表指 explain 中的id值比当前表id值小的表）。

测试：

 explain extended select * from film where id = 1;
 show warnings;

运行结果：

在MySQL5.7（可能是5.6），extended就已经过时了。

explain partitions
相比 explain 多了个 partitions 字段，如果查询是基于分区表的话，会显示查询将访问的分区。

explain中的列

接下来我们将展示 explain 中每个列的信息。

id列
id为select的序列号，有几个select就有多少个id,并且id的顺序是按照select出现的顺序增长的。
三种情况：

id相同：那么执行表的顺序是从上到下；
id不同：那么执行表的顺序是从达到小；

EXPLAIN
SELECT name , (SELECT actor_id from film_actor) as tid 
from actor

id相同不同：先从大到小执行，再到id相同的时候就从上到下；

EXPLAIN
SELECT name , (SELECT actor_id from film_actor) as tid 
from actor where id IN (SELECT actor_id from film_actor)

select_type
表示对应行是简单查询还是复杂的查询；
1）simple：简单查询。查询不包含子查询和union

explain select * from film where id = 2;

2）primary:复杂查询中最外层的select
3) subquery ：包含在select中的子查询（不在from子句中）；
4）derived:包含在from子句中的查询。MySQL将结果放在一个临时表里，也称为派生表

用这个例子来了解 primary、subquery 和 derived 类型

#关闭mysql5.7新特性对衍生表的合并优化
 set session optimizer_switch='derived_merge=off';
 explain select (select 1 from actor where id = 1)
 from (select * from film where id = 1) der;

5）union:在union中的第二个和随后的select;

explain select 1 union all select 1;

3. table列
这一列表示explain的一行正在访问那个表；
当from子句中由子查询时，table列式格式，表示当前查询依赖id=N的查询，该表的是由id=N查询生成的，于是先执行id=N的查询；

当有union时，UNION RESULT的table列的值为<union 1,2>，1和2表示union的select行ID；

type列
这一列表示关联类型或者访问类型，即MySQL决定如何查找表中的行，查找数据行记录的大概范围；

依次从最优到最差为：System>const>eq_ref>ref>range>index>all
一般来说：保证type达到range级别，最好达到ref级别；

NULL:mysql能够在优化阶段分解查询语句，在执行阶段用不着再访问表或者索引。
例如：在索引中选取最小值，可以单独查找索引完成，不需要执行时访问表；

explain select min(id) from film;

const：mysql能对查询的某部分进行优化并将其转化为一个常量。用于primary key或者unique key的所有列表与常数比较。所以表最多只有一行匹配记录，读取1次，速度快。
system:const的特例，表中只有一条记录，匹配就查找到了，通常是系统表。

 set session optimizer_switch='derived_merge=off'; # 
explain select * from (select * from film where id = 1) as tmp;

eq_ref:primary key或unique key索引的所有部分被连接使用，最多只会返回一条符合记录条件的记录。这可能是在const之外最好的连接类型了，简单的select查询不会出现这种type;

EXPLAIN select * from actor left JOIN film_actor on actor.id=film_actor.actor_id where actor.id=1

ref : 相比eq_ref,不使用唯一索引，而是使用普通索引或者唯一性索引的部分前缀，索引要和某个值进行比较，可能会找到多个符合条件的行；
1）简单 select 查询，name是普通索引（非唯一索引）

explain select * from film where name = 'film1';

2）关联表查询，idx_film_actor_id是film_id和actor_id的联合索引，这里使用到了film_actor的左边前缀film_id部分。

explain select film_id from film left join film_actor on film.id = film_actor.film_id;

range: 范围扫描通常出现在in,between，>,<,>=等范围查询操作中。使用一个索引来检索给定范围的行；

 explain select * from actor where id > 1;

index:扫描全索引就能拿到结果，一般是扫描某个二级索引，这种扫描不会从索引根节点开始快速查找，而直接对二级索引的叶子结点遍历和扫描，速度还是比较慢的，这种查询一般为使用覆盖所有，二级索引一般比较小，这种通常比ALL快一些；

explain select * from film;

ALL :全表扫描，对于主键聚簇索引的叶子结点中的头结点开始遍历和扫描，速度最慢；

possible_key
这一列显示查询可能使用哪些索引来查找数据。
explain 时可能出现 possible_keys 有列，而 key 显示 NULL 的情况，这种情况是因为表中数据不多，mysql认为索引对此查询帮助不大，选择了全表查询。
如果该列是NULL，则可能没有相关的索引，在这种情况下，可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能，然后用 explain 查看效果；
如果该列是NULL，可以不为null，则可能是覆盖索引，select 列刚好是二级索引的表数据。直接从二级索引中获取就可以了
key列
这一列显示mysql查询时实际使用了哪个索引来优化对该表的访问；
如果没有使用索引，则该列为NULL。如果强制MySQL使用或者忽略possible_keys列中的索引，查询时可以使用force index,ignore index;
key_len列
这一列显示了mysql在索引里使用的字节数，通过这个值可以算出具体使用了索引中的哪些列。
举例来说，film_actor的联合索引 idx_film_actor_id 由 film_id 和 actor_id 两个int列组成，并且每个int是4字节。通过结果中的key_len=4可推断出查询使用了第一个列：film_id列来执行索引查找

key_len计算规则如下：
- 字符串，char(n)和varchar(n)，5.0.3以后版本中，n均代表字符数，而不是字节数，如果是utf-8，一个数字或字母占1个字节，一个汉字占3个字节
- char(n)：如果存汉字长度就是 3n 字节 varchar(n)：如果存汉字则长度是 3n + 2 字节，加的2字节用来存储字符串长度，因为 varchar是变长字符串
- 数值类型tinyint：1字节 smallint：2字节 int：4字节 bigint：8字节
- 时间类型date：3字节
  timestamp：4字节 datetime：8字节
- 如果字段允许为 NULL，需要1字节记录是否为 NULL 索引最大长度是768字节，当字符串过长时，mysql会做一个类似左前缀索引的处理，将前半部分的字符提取出来做索引

 explain select * from film_actor where film_id = 2;

ref列
这一列显示了在key列记录的索引中，表查找值所用到的列或常量，常见的有：const（常量），字段名（例：film.id）
rows列这一列是mysql估计要读取并检测的行数，注意这个不是结果集里的行数。
Extra列
这一列展示的是额外信息。常见的重要值如下：

覆盖索引定义：mysql执行计划explain结果里的key有使用索引，如果select后面查询的字段都可以从这个索引的树中获取，这种情况一般可以说是用到了覆盖索引，extra里一般都有using index；覆盖索引一般针对的是辅助索引，整个查询结果只通过辅助索引就能拿到结果，不需要通过辅助索引树找到主键，再通过主键去主键索引树里获取其它字段值

explain select film_id from film_actor where film_id = 1;

Using where
使用 where 语句过滤结果，并且查询的列未被索引覆盖。

 explain select * from actor where name = 'a';

Using temporary
mysql需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的，首先是想到用索引来优化
- actor.name没有索引，此时创建了张临时表来distinct
film.name建立了idx_name索引，此时查询时extra是using index,没有用临时表

explain select distinct name from actor;

 explain select distinct name from film;

Using filesort
将用外部排序而不是索引排序，数据较小时从内存排序，否则需要在磁盘完成排序。这种情况下一般也是要考虑使用索引来优化的,常见于order by,group by。

1)actor.name未创建索引，会浏览actor整个表，保存排序关键字name和对应的id，然后排序name并检索行记录

 explain select * from actor order by name;

2)film.name建立了idx_name索引,此时查询时extra是using index

explain select * from film order by name;

Select tables optimized away
使用某些聚合函数（比如 max、min）来访问存在索引的某个字段

explain select min(id) from film;

一文必懂-MySQL调优之Explain工具最佳实践(二）

码农公寓

MySQL调优之Explain

Expalin介绍

Explain分析实例

explain 两个变种

explain中的列

相关文章