SQL Server学习之路(十三)

之前在公司查询员工的时候,每个员工都会有个上级主管,然后要把这些员工和他的上级主管分两列罗列出来。当时真的有点头大,不知道怎么下手,翻阅资料之后才发现有个递归可以使用。今天就说说这个递归查询~

SQL Server提供CTE(Common Table Expression),只需要编写少量的代码,就能实现递归查询,这里详细介绍CTE递归调用的特性和使用示例,递归查询主要用于层次结构的查询,从叶级(Leaf Level)向顶层(Root Level)查询,或从顶层向叶级查询,或递归的路径(Path)。

一,递归查询原理

CTE的递归查询必须满足三个条件:初始条件,递归调用表达式,终止条件,CTE 递归查询的伪代码如下:

WITH cte_name ( column_name [,...n] )AS(
--Anchor member is defined
CTE_query_definition 

UNION ALL
--Recursive member is defined referencing cte_name
CTE_query_definition 

)
-- Statement using the CTE
SELECT *FROM cte_name

1,递归查询至少包含两个子查询:

  • 第一个子查询称作定点(Anchor)子查询:定点查询只是一个返回有效表的查询,用于设置递归的初始值;
  • 第二个子查询称作递归子查询:该子查询调用CTE名称,触发递归查询,实际上是递归子查询调用递归子查询;
  • 两个子查询使用union all,求并集;

2,CTE的递归终止条件

递归查询没有显式的递归终止条件,只有当递归子查询返回空结果集(没有数据行返回)或是超出了递归次数的最大限制时,才停止递归。

默认的递归查询次数是100,可以使用查询提示(hint):MAXRECURSION 控制递归的最大次数:OPTION( MAXRECURSION 16);如果允许无限制的递归次数,使用查询提示:option(maxrecursion 0);当递归查询达到指定或默认的 MAXRECURSION 数量限制时,SQL Server将结束查询并返回错误,如下:

The statement terminated. The maximum recursion 10 has been exhausted before statement completion.

事务执行失败,该事务包含的所有操作都被回滚。在产品环境中,慎用maxrecursion 查询提示,推荐通过 where 条件限制递归的次数。

3,递归步骤

step1:定点子查询设置CTE的初始值,即CTE的初始值Set0;

递归调用的子查询过程:递归子查询调用递归子查询;

step2:递归子查询第一次调用CTE名称,CTE名称是指CTE的初始值Set0,第一次执行递归子查询之后,CTE名称是指结果集Set1;

step3:递归子查询第二次调用CTE名称,CTE名称是指Set1,第二次执行递归子查询之后,CTE名称是指结果集Set2;

step4:在第N次执行递归子查询时,CTE名称是指Set(N-1),递归子查询都引用前一个递归子查询的结果集;

Step5:如果递归子查询返回空数据行,或超出递归次数的最大限制,停止递归;

二,递归查询示例(员工职称)SQL Server学习之路(十三)SQL Server学习之路(十三)

1,创建测试数据

ManagerID是UserID的父节点,这是一个非常简单的层次结构模型。

use tempdbgo create table dbo.dt_user

(

    UserID int,

    ManagerID int,

    Name Nvarchar(10)

)
insert into dbo.dt_user
select 1,-1,N'Boss'
union all
select 11,1,N'A1'
union all
select 12,1,N'A2'
union all
select 13,1,N'A3'
union all
select 111,11,N'B1'
union all
select 112,11,N'B2'
union all
select 121,12,N'C1'

2,查询每个User的的直接上级Manager

with cte as(

select UserID,ManagerID,name,name as ManagerName

from dbo.dt_user

where ManagerID=-1

union all

select c.UserID,c.ManagerID,c.Name,p.name as ManagerName

from cte P

inner join dbo.dt_user c    on p.UserID=c.ManagerID

)

select UserID,ManagerID,Name,ManagerName
from cte
order by UserID

1:查询ManagerID=-1,作为root node,这是递归查询的起始点。

2:迭代公式是 union all 下面的查询语句。在查询语句中调用中cte,而查询语句就是cte的组成部分,即 “自己调用自己”,这就是递归的真谛所在。

所谓迭代,是指每一次递归都要调用上一次查询的结果集,Union ALL是指每次都把结果集并在一起。

3-N,迭代公式利用上一次查询返回的结果集执行特定的查询,直到CTE返回null 或达到最大的迭代次数,默认值是32。最终的结果集是迭代公式返回的各个结果集的并集,求并集是由Union All 子句定义的,并且只能使用Union ALL。

SQL Server学习之路(十三)3,查询路径,在层次结构中查询子节点到父节点的path


with cte as(
select UserID,ManagerID,name,cast(name as nvarchar(max)) as ReportPathfrom
dbo.dt_user
where ManagerID=-1
union all
select c.UserID,c.ManagerID,c.Name,c.name+'->'+p.ReportPath as ReportPath
from cte P
inner join dbo.dt_user c on p.UserID=c.ManagerID

)
select UserID,ManagerID,Name,ReportPath
from cte
order by UserID


询结果如下截图:


SQL Server学习之路(十三)

以上就是递归查询的一些知识介绍了,自己可以动手实验一下,这个一般在面试中也经常
会考察面试者,希望能帮助到大家~

上一篇:SQL Server学习之路(十四)


下一篇:AI开发者福音!国内首个基于NGC的GPU优化容器已在阿里云正式推出