深入讲解MySQL的ORDER BY及优化过程

#1024程序员节 | 征文#

一、引言

在MySQL中,索引的最左匹配原则是指在使用索引进行查询时,会优先匹配索引的最左侧列,然后再匹配后续列。这种匹配方式有助于提高查询效率,但在某些情况下,例如在进行排序查询(ORDER BY)时,可能会导致性能问题。本文将基于InnoDB引擎,详细分析如何优化MySQL索引最左匹配下的ORDER BY语句。

二、关键点验证

为了验证MySQL索引最左匹配对ORDER BY的影响,我们首先需要准备一些实际数据。我们将创建一个名为student的表,并插入1万条数据。表结构如下:

CREATE TABLE `student` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(11) DEFAULT '',
  `age` int(11) DEFAULT '0',
  `classId` int(11) DEFAULT '0',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10000 DEFAULT CHARSET=utf8;

接下来,我们编写一个存储过程,用于向表中插入1万条数据:

DELIMITER //  
CREATE PROCEDURE InsertStudentData()  
BEGIN  
    DECLARE i INT DEFAULT 1;  
    WHILE i <= 10000 DO  
        INSERT INTO student (name, age, classId) VALUES (CONCAT('Student', i), RAND() * 20 + 1, RAND() * 10 + 1);  
        SET i = i + 1;  
    END WHILE;  
END //  
DELIMITER ;

CALL InsertStudentData();

数据准备完成后,我们可以开始验证ORDER BY在不同情况下的执行情况。

1. ORDER BY无索引,导致filesort

通过EXPLAIN查看执行计划,发现type为ALL(全表扫描),并且出现了filesort。这说明在没有索引的情况下,MySQL会进行全表扫描并进行内部排序,这是非常耗时的。
select * from student ORDER BY `name`, age, classId

2. 创建联合索引并优化查询

接下来,我们创建一个联合索引:

CREATE INDEX idx_auc ON student(`name`, `age`, `classId`);

再次执行相同的查询语句,通过EXPLAIN发现,扫描的行数仍然较多,type类型变为index。这表明虽然遍历了索引树,但仍未达到最优级别。

3. 增加过滤条件以避免全表扫描

SELECT * FROM student WHERE `name` = 'Student968' ORDER BY `name`, age, classId;

此时,EXPLAIN结果显示type为ref,说明在使用ORDER BY时,增加过滤条件可以有效避免全表扫描。

4. ORDER BY非最左字段,导致filesort

结果出现filesort,说明当ORDER BY不遵循最左匹配原则时,无法完全匹配索引,导致需要进行重排序。

select *
from student
WHERE `name` = 'Student968'
ORDER BY age, classId

5. ORDER BY顺序错误,导致filesort

EXPLAIN
select *
from student
ORDER BY age,`name`,  classId

结果出现filesort,说明当ORDER BY字段顺序与索引顺序不一致时,也会导致filesort。

6. ORDER BY排序方向不一致,导致filesort

EXPLAIN
select *
from student
ORDER BY `name`, age,  classId desc

结果出现filesort,说明当排序方向与索引排序方向不一致时,也会导致filesort。

三、总结与回答

在使用ORDER BY时,应遵循以下原则:使用WHERE子句,按照索引顺序,保持字段排序方向一致。针对面试中的问题,可以这样回答:

  1. 首先对SQL进行分析,检查必要的查询字段、过滤字段和排序字段是否按顺序创建了索引,并使用EXPLAIN进行检查。
  2. 如果查询字段不在索引中,可能会导致回表操作,从而产生filesort,降低性能。
  3. 必须有过滤字段,否则无法使用索引。
  4. 排序字段和索引顺序不一致会导致filesort,降低性能。
  5. 多个字段排序时,如果方向不一致也会导致filesort,降低性能。
  6. 使用EXPLAIN观察查询类型和索引利用情况,以便进行优化。

通过以上分析和总结,我们可以更好地理解和优化MySQL索引最左匹配下的ORDER BY语句。

上一篇:PyCharm虚拟环境解释器问题:Python packaging tools not found.Install packaging tools


下一篇:【MySQL实战45讲9】普通索引和唯一索引怎么选择