sql连接查询中，where关键字的位置

2021-09-06 23:36:25

最近一直在忙，也没有太多时间停留下来写博客。晚上遇到一个觉得很有趣的sql题，可能对初学者和我这种菜鸟会有帮助，所以决定分享给大家。

由于笔者天生笨拙，且思维不严谨，也实在不擅长写sql语句，高手请勿见笑，就请直接跳过本文吧。

背景就不多介绍了，先建表，插入测试数据吧。字段那些都有注释

--医生表
CREATE TABLE doctor
    (
      id INT IDENTITY(1, 1) , --ID 自增长
      docNumber NVARCHAR(50) NOT NULL , --医生编码
      NAME NVARCHAR(50) NOT NULL   --医生姓名
    )
go

--插入测试数据
INSERT  INTO doctor
VALUES  ( '007', 'Tom' )
INSERT  INTO doctor
VALUES  ( '008', 'John' )
INSERT  INTO doctor
VALUES  ( '009', 'Jim' )


--号源表（挂号表）
CREATE TABLE Nosource
    (
      id INT IDENTITY(1, 1) ,
      docNumber NVARCHAR(50) NOT NULL , --和医生表中的医生编码对应
      workTime DATETIME NOT NULL
    )

go
--插入测试数据
INSERT  INTO Nosource
VALUES  ( '007', '20120819' )
INSERT  INTO Nosource
VALUES  ( '007', '20120820' )
INSERT  INTO Nosource
VALUES  ( '007', '20120821' )
INSERT  INTO Nosource
VALUES  ( '008', '20120821' )

表建好之后，测试数据也OK。下面开始说需求啦。

1.查出每位医生的相关信息，以及该医生所拥有的号源数量。

这简直太简单了，可能连刚学会helloWorld和一点点数据库基础的朋友都会严重真心BS。不过代码还是写出来。

--简单的分组查询即可搞定
SELECT  COUNT(nos.id) AS PersonNumSounceCOUNT , --总数
        dct.ID AS docID ,
        dct.NAME ,
        dct.docNumber ,
        nos.workTime
FROM    doctor AS dct
        LEFT JOIN Nosource AS nos ON dct.docNumber = nos.docNumber
GROUP BY dct.ID ,
        dct.NAME ,
        dct.docNumber ,
        nos.workTime

确实简单啊。一个小小的分组就能搞定的。还卖什么关子呢。

那现在需求改变，需要按条件去匹配：要求号源表的workTime大于当前日期才算有效的，否则就不匹配。
如果workTime条件不匹配的医生,对应的PersonNumSounceCOUNT字段的值应为0 ；例如:Jim医生没有匹配和符合条件的号源，其PersonNumSounceCOUNT字段值应为0。抬头仰望天空40度，想想能够用where关键字过滤，然后一次性查询出来吗？试试吧。

SELECT  COUNT(nos.id) AS PersonNumSounceCOUNT , --总数
        dct.ID ,
        dct.NAME ,
        dct.docNumber ,
        nos.workTime
FROM    doctor AS dct
        LEFT JOIN Nosource AS nos ON dct.docNumber = nos.docNumber
WHERE   DATEDIFF(day, GETDATE(), nos.workTime) > 0
GROUP BY dct.ID ,
        dct.NAME ,
        dct.docNumber ,
        nos.workTime

相信有人会写出上面的代码来。可是执行查询后，发现完全不符合要求啊。连Jim医生的基本信息和表记录也都被过滤掉了，不见了。咋回事啊？

原因很简单嘛。在连接查询的后面使用"where"关键字，会过滤连接查询的结果集中的数据。由于右表（号源表）的条件不匹配，也会导致左表（医生表）的数据被过滤掉。

所以，会出现以上的现象（Jim医生的信息和记录都不见了）。要想一次性查出来可能吗？到底该如何去实现呢？

其实，正确的写法应该是这样的：

SELECT  COUNT(nos.id) AS PersonNumSounceCOUNT , --总数
        dct.ID ,
        dct.NAME ,
        dct.docNumber ,
        nos.workTime
FROM    doctor AS dct
        LEFT JOIN ( SELECT  *
                    FROM    Nosource
                    WHERE   DATEDIFF(day, GETDATE(), workTime) > 0
                  ) AS nos ON dct.docNumber = nos.docNumber
GROUP BY dct.ID ,
        dct.NAME ,
        dct.docNumber ,
        nos.workTime

再执行一下，果然OK，是满足要求的结果。思路就是：只需要过滤右表，就将（使用子查询）过滤后的结果集作为连接查询的右表，然后再去连接，分组......

其实编写简洁而高性能的sql语句，是需要很强的逻辑思维能力（和数学分不开）和经验的。还有种更简单的写法：

SELECT  sum(case when nos.workTime>getdate then 1 else 0 end) AS PersonNumSounceCOUNT , --总数
dct.ID AS docID ,
dct.NAME ,
dct.docNumber 
FROM    doctor AS dct
LEFT JOIN Nosource AS nos ON dct.docNumber = nos.docNumber
GROUP BY dct.ID ,
dct.NAME ,
dct.docNumber

这样去解释，不知道大家是否能够理解，反正大致意思就是这样的。笔者的表达能力和水平确实有限，难免有偏差，望读者谅解！

本文出自http://blog.****.net/dinglang_2009，转载请注明出处。

码农公寓

相关文章