SELECT语句的完整语法:
SELECT DISTINCT <select_list> FROM <left_table> <join_type> JOIN <right_table> ON <join_condition> WHERE <where_condition> GROUP BY <group_by_list> HAVING <having_condition> ORDER BY <order_by_condition> LIMIT <limit_number>
执行顺序:
FROM
<表名> # 笛卡尔积
ON
<筛选条件> # 对笛卡尔积的虚表进行筛选
JOIN <join, left join, right join...>
<join表> # 指定join,用于添加数据到on之后的虚表中,例如left join会将左表的剩余数据添加到虚表中
WHERE
<where条件> # 对上述虚表进行筛选
GROUP BY
<分组条件> # 分组
<SUM()等聚合函数> # 用于having子句进行判断,在书写上这类聚合函数是写在having判断里面的
HAVING
<分组筛选> # 对分组后的结果进行聚合筛选
SELECT
<返回数据列表> # 返回的单列必须在group by子句中,聚合函数除外
DISTINCT
# 数据除重
ORDER BY
<排序条件> # 排序
LIMIT
<行数限制>
引擎在执行上述每一步时,都会在内存中形成一张虚拟表,然后对虚拟表进行后续操作,并释放没用的虚拟表的内存,以此类推。
具体解释:(注:下面“VT”表示 → 虚拟表 virtual )
- from:select * from table_1, table_2; 与 select * from table_1 join table_2; 的结果一致,都是表示求笛卡尔积;用于直接计算两个表笛卡尔积,得到虚拟表VT1,这是所有select语句最先执行的操作,其他操作时在这个表上进行的,也就是from操作所完成的内容
- on: 从VT1表中筛选符合条件的数据,形成VT2表;
- join: 将该 join 类型的数据补充到VT2表中,例如 left join 会将左表的剩余数据添加到虚表VT2中,形成VT3表;若表的数量大于2,则会重复1-3步;
- where: 执行筛选,(不能使用聚合函数)得到VT4表;
- group by: 对VT4表进行分组,得到VT5表;其后处理的语句,如select,having,所用到的列必须包含在group by条件中,没有出现的需要用聚合函数;
- having: 筛选分组后的数据,得到VT6表;
- select: 返回列得到VT7表;
- distinct: 用于去重得到VT8表;
- order by: 用于排序得到VT9表;
- limit: 返回需要的行数,得到VT10;
-
需要注意的是:
- group by条件中,每个列必须是有效列,不能是聚合函数;
- null值也会作为一个分组返回;
- 除了聚合函数,select子句中的列必须在group by条件中;
原博文链接:https://blog.csdn.net/qq_39390545/article/details/105893049
路漫漫其修远今,吾将上下而求索。--屈原。