sql的执行顺序,是优化sql语句执行效率必须要掌握的。各个数据库可能有细小的差别,但大体顺序是相同的,这里只做大致说明。
一、总体执行顺序
在sql语句执行之前,还有SQL语句准备执行阶段,这里不做描述,只介绍sql语句执行顺序。
这是一个完整的查询语句的执行顺序,可见sql语句并不是顺序执行的。每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者不可用,只在最后一步生成的表才会返回给调用者。
(7) SELECT
(8) DISTINCT <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) HAVING <having_condition>
(9) ORDER BY <order_by_condition>
(10) LIMIT <limit_number>
二、每个步骤的执行顺序
知道总体上的执行顺序并不能帮助优化sql语句,因为这些子句的执行顺序你是不能改的,所以必须要知道在每个子句中的执行顺序。
1)执行from子句
对FROM子句中的前两个表执行笛卡尔积,生成虚拟表VT1。
2)执行on子句
对VT1应用ON筛选器,按join_condition条件过滤,去掉那些不符合条件的数据,得到VT2表。
3)OUTER(JOIN)添加外部行
这一步只有在连接类型为OUTER JOIN
时才发生,如LEFT OUTER JOIN
、RIGHT OUTER JOIN和
FULL OUTER JOIN
。大多数时候我们都是会省略掉OUTER
关键字的,但OUTER
表示的就是外部行。
LEFT OUTER JOIN
把左表记为保留表;RIGHT OUTER JOIN
把右表记为保留表;FULL OUTER JOIN
把左右表都作为保留表。
如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。
添加外部行的工作就是在VT2表的基础上添加保留表中被过滤条件过滤掉的数据,非保留表中的数据被赋予NULL值,最后生成虚拟表VT3。
4)执行WHERE过滤
对添加外部行得到的VT3进行WHERE过滤,只有符合<where_condition>的记录才会输出到虚拟表VT4中。
采用自下而上从右到左的顺序解析Where 子句,根据这个原理,表之间的连接必须写在其他Where 条件之前, 可以过滤掉最大数量记录的条件最好写在Where 子句的末尾。
5)执行GROUP BY分组
对使用where
子句得到的虚拟表进行分组操作,得到的内容会存入虚拟表VT5中。
要提高GROUP BY 语句的效率, 可以将不需要的记录在GROUP BY 之前过滤掉。即在GROUP BY前使用WHERE来过虑,尽量避免GROUP BY后再HAVING过滤。
6)执行HAVING过滤
HAVING
子句主要和GROUP BY
子句配合使用,对分组得到的VT5虚拟表进行条件过滤,得到VT6。应该避免使用HAVING 子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作。
7)SELECT列表
从虚拟表VT6中选择出我们需要的内容,得到VT7。
注意少用*号,尽量取字段名称,因为ORACLE 在解析的过程中, 会依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 使用列名意味着将减少消耗时间。
8)执行DISTINCT子句
创建一张内存临时表(如果内存放不下,就需要存放在硬盘了)。这张临时表的表结构和上一步产生的虚拟表VT7是一样的,不同的是对进行DISTINCT操作的列增加了一个唯一索引,以此来除重复数据。
9)执行ORDER BY子句
对虚拟表中的内容按照指定的列进行排序,然后返回一个新的虚拟表。结果存储在VT8中。
执行顺序为从左到右排序,很耗资源。
10)执行LIMIT子句
LIMIT
子句从上一步得到的VT8虚拟表中选出从指定位置开始的指定行数据。对于没有应用ORDER BY的LIMIT子句,得到的结果同样是无序的,所以很多时候都会看到LIMIT子句会和ORDER BY子句一起使用。