SQLServer 2008 技术内幕——T-SQL 查询笔记

2023-11-18 23:18:40

原文: SQLServer 2008 技术内幕——T-SQL 查询笔记

1、SQL编程有许多独特之处，如：面向集合的思维方式、查询元素的逻辑处理顺序、三值逻辑。如果不掌握这些知识就开始用SQL编程，得到的将是冗余的、性能低下的代码，而且难以维护。

2、在SQLServer中负责生成实际工作计划（执行计划）的组件是：查询优化器（query optimizer）。只有在确保结果集正确的前提下，优化器才会走捷径。明确区分查询的逻辑处理和物理处理是非常重要的。

3、逻辑查询的各个阶段：

(5) SELECT (5-2) DISTINCT (5-3) TOP (<top_specification>) (5-1) <select_list>
(1) FROM (1-J) <left_table> <join_type> JOIN <right_table> ON <on_predicate>
     |(1-A) <left_table> <apply_type> APPLY <right_table_expression> AS <alias>
     |(1-P) <left_table> PIVOT (<pivot_specification>) AS <alias>
     |(1-U) <left_table> UNPIVOT (<unpivot_specification>) AS <alias>
(2) WHERE <where_predicate>
(3) GROUP BY <group_by_specification>
(4) HAVING <having_predicate>
(6) ORDER BY <order_by_list>;

第一步：FROM ：表示出查询的来源表，在联结运算中涉及的阶段是（1-J1）笛卡儿积、（1-J2）ON筛选器和（1-J3）添加外部行。并生成虚拟表VT1。

1.1、笛卡儿积：两表执行笛卡儿积，生成虚拟表VT1-J1。

1.2、ON筛选器：针对VT1-J1中满足ON为true的行，插入VT1-J2。

1.3、添加外部行：如果指定了OUTER JOIN （相对于CROSS JOIN或INNER JOIN ），则将保留表中没有匹配的行，作为外部行添加，生成VT1-J3。

第二步：WHERE：根据WHERE 子句中的谓词对VT1中的数据进行行筛选，只对结果为TRUE的行，插入VT2。

第三步：GROUP BY ：根据group by中的列表，将VT2进行分组，每一组只有一个结果行，生成VT3。

第四步：HAVING：根据HAVING出现的谓词对VT3金信筛选，只让结果为TRUE的组才插入VT4。

第五步：SELECT：处理SELECT 子句中的元素，产生VT5。

5.1、计算表达式：根据SELECT 列表中的表达式，生成VT5-1。

5.2、DISTINCT：删除VT5-1中重复的行，生成VT5-2。

5.3、TOP：根据ORDER BY 子句定义逻辑排序，从VT5-2中选择前面指定数量或百分比的行，生产VT5-3。

第六步：ORDER BY ：根据ORDER BY 子句中指定的列名，对VT5-3进行排序。生成游标VC6。

对于三值逻辑：

a、所有的查询筛选器（ON、WHERE 和HAVING ）都把null当作FALSE来处理。

b、check约束中的null值被当作TRUE来对待。

c、UNIQUE约束、集合运算（UNION 和EXCEPT）、及排序和分组操作，认为两个null是相等的。

注意：

1、如果FROM 子句中有多个表运算符，则按从左到右的顺序进行处理。每个表运算符的结果作为下一个表运算符的左输入，最后生成虚拟表作为下一阶段的输入。

2、因为在WHERE之前还没对数据分组，所以WHERE 子句不能使用聚合。在筛选器中，ON对保留表中部分行的删除并不是最终的，而WHERE是最终的。只有使用外联结的时候，ON和WHERE才有逻辑区别。

3、如果在查询中指定了GROUP BY ，后续所有步骤都只能在指定的分组上操作。

4、HAVING是唯一可用于分组数据的筛选器。

5、由于SQL具有多个运算同时计算（all-at-once operation），所以SELECT 语句中的逻辑顺序是无关的。

6、ORDER BY 是唯一可以使用SELECT 中别名的步骤。

码农公寓

相关文章