sql执行顺序整理

  sql的执行顺序,是优化sql语句执行效率必须要掌握的。各个数据库可能有细小的差别,但大体顺序是相同的,这里只做大致说明。

一、总体执行顺序

  在sql语句执行之前,还有SQL语句准备执行阶段,这里不做描述,只介绍sql语句执行顺序。

  这是一个完整的查询语句的执行顺序,可见sql语句并不是顺序执行的。每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者不可用,只在最后一步生成的表才会返回给调用者。

(7)     SELECT
(8) DISTINCT <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) HAVING <having_condition>
(9) ORDER BY <order_by_condition>
(10) LIMIT <limit_number>

二、每个步骤的执行顺序

  知道总体上的执行顺序并不能帮助优化sql语句,因为这些子句的执行顺序你是不能改的,所以必须要知道在每个子句中的执行顺序。

1)执行from子句

  对FROM子句中的前两个表执行笛卡尔积,生成虚拟表VT1。

2)执行on子句

  对VT1应用ON筛选器,按join_condition条件过滤,去掉那些不符合条件的数据,得到VT2表。

3)OUTER(JOIN)添加外部行 

  这一步只有在连接类型为OUTER JOIN时才发生,如LEFT OUTER JOINRIGHT OUTER JOIN和FULL OUTER JOIN。大多数时候我们都是会省略掉OUTER关键字的,但OUTER表示的就是外部行。

  LEFT OUTER JOIN把左表记为保留表;RIGHT OUTER JOIN把右表记为保留表;FULL OUTER JOIN把左右表都作为保留表。

  如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。

  添加外部行的工作就是在VT2表的基础上添加保留表中被过滤条件过滤掉的数据,非保留表中的数据被赋予NULL值,最后生成虚拟表VT3。

4)执行WHERE过滤

  对添加外部行得到的VT3进行WHERE过滤,只有符合<where_condition>的记录才会输出到虚拟表VT4中。

  采用自下而上从右到左的顺序解析Where 子句,根据这个原理,表之间的连接必须写在其他Where 条件之前, 可以过滤掉最大数量记录的条件最好写在Where 子句的末尾。

5)执行GROUP BY分组

  对使用where子句得到的虚拟表进行分组操作,得到的内容会存入虚拟表VT5中。

  要提高GROUP BY 语句的效率, 可以将不需要的记录在GROUP BY 之前过滤掉。即在GROUP BY前使用WHERE来过虑,尽量避免GROUP BY后再HAVING过滤。

6)执行HAVING过滤

  HAVING子句主要和GROUP BY子句配合使用,对分组得到的VT5虚拟表进行条件过滤,得到VT6。应该避免使用HAVING 子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作。

7)SELECT列表

  从虚拟表VT6中选择出我们需要的内容,得到VT7。

  注意少用*号,尽量取字段名称,因为ORACLE 在解析的过程中, 会依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 使用列名意味着将减少消耗时间。

8)执行DISTINCT子句

  创建一张内存临时表(如果内存放不下,就需要存放在硬盘了)。这张临时表的表结构和上一步产生的虚拟表VT7是一样的,不同的是对进行DISTINCT操作的列增加了一个唯一索引,以此来除重复数据。

9)执行ORDER BY子句

  对虚拟表中的内容按照指定的列进行排序,然后返回一个新的虚拟表。结果存储在VT8中。

  执行顺序为从左到右排序,很耗资源。

10)执行LIMIT子句

  LIMIT子句从上一步得到的VT8虚拟表中选出从指定位置开始的指定行数据。对于没有应用ORDER BY的LIMIT子句,得到的结果同样是无序的,所以很多时候都会看到LIMIT子句会和ORDER BY子句一起使用。

上一篇:【转】Codeforces Round #406 (Div. 1) B. Legacy 线段树建图&&最短路


下一篇:Codeforces Round #530 (Div. 2) F - Cookies