最近一直在忙,也没有太多时间停留下来写博客。晚上遇到一个觉得很有趣的sql题,可能对初学者和我这种菜鸟会有帮助,所以决定分享给大家。
由于笔者天生笨拙,且思维不严谨,也实在不擅长写sql语句,高手请勿见笑,就请直接跳过本文吧。
背景就不多介绍了,先建表,插入测试数据吧。字段那些都有注释
--医生表 CREATE TABLE doctor ( id INT IDENTITY(1, 1) , --ID 自增长 docNumber NVARCHAR(50) NOT NULL , --医生编码 NAME NVARCHAR(50) NOT NULL --医生姓名 ) go --插入测试数据 INSERT INTO doctor VALUES ( '007', 'Tom' ) INSERT INTO doctor VALUES ( '008', 'John' ) INSERT INTO doctor VALUES ( '009', 'Jim' ) --号源表(挂号表) CREATE TABLE Nosource ( id INT IDENTITY(1, 1) , docNumber NVARCHAR(50) NOT NULL , --和医生表中的医生编码对应 workTime DATETIME NOT NULL ) go --插入测试数据 INSERT INTO Nosource VALUES ( '007', '20120819' ) INSERT INTO Nosource VALUES ( '007', '20120820' ) INSERT INTO Nosource VALUES ( '007', '20120821' ) INSERT INTO Nosource VALUES ( '008', '20120821' )
表建好之后,测试数据也OK。下面开始说需求啦。
1.查出每位医生的相关信息,以及该医生所拥有的号源数量。
这简直太简单了,可能连刚学会helloWorld和一点点数据库基础的朋友都会严重真心BS。不过代码还是写出来。
--简单的分组查询即可搞定 SELECT COUNT(nos.id) AS PersonNumSounceCOUNT , --总数 dct.ID AS docID , dct.NAME , dct.docNumber , nos.workTime FROM doctor AS dct LEFT JOIN Nosource AS nos ON dct.docNumber = nos.docNumber GROUP BY dct.ID , dct.NAME , dct.docNumber , nos.workTime
确实简单啊。一个小小的分组就能搞定的。还卖什么关子呢。
那现在需求改变,需要按条件去匹配:要求号源表的workTime大于当前日期才算有效的,否则就不匹配。
如果workTime条件不匹配的医生,对应的PersonNumSounceCOUNT字段的值应为0 ;例如:Jim医生没有匹配和符合条件的号源,其PersonNumSounceCOUNT字段值应为0。抬头仰望天空40度,想想能够用where关键字过滤,然后一次性查询出来吗?试试吧。
SELECT COUNT(nos.id) AS PersonNumSounceCOUNT , --总数 dct.ID , dct.NAME , dct.docNumber , nos.workTime FROM doctor AS dct LEFT JOIN Nosource AS nos ON dct.docNumber = nos.docNumber WHERE DATEDIFF(day, GETDATE(), nos.workTime) > 0 GROUP BY dct.ID , dct.NAME , dct.docNumber , nos.workTime
相信有人会写出上面的代码来。可是执行查询后,发现完全不符合要求啊。连Jim医生的基本信息和表记录也都被过滤掉了,不见了。咋回事啊?
原因很简单嘛。在连接查询的后面使用"where"关键字,会过滤连接查询的结果集中的数据。由于右表(号源表)的条件不匹配,也会导致左表(医生表)的数据被过滤掉。
所以,会出现以上的现象(Jim医生的信息和记录都不见了)。要想一次性查出来可能吗?到底该如何去实现呢?
其实,正确的写法应该是这样的:
SELECT COUNT(nos.id) AS PersonNumSounceCOUNT , --总数 dct.ID , dct.NAME , dct.docNumber , nos.workTime FROM doctor AS dct LEFT JOIN ( SELECT * FROM Nosource WHERE DATEDIFF(day, GETDATE(), workTime) > 0 ) AS nos ON dct.docNumber = nos.docNumber GROUP BY dct.ID , dct.NAME , dct.docNumber , nos.workTime
再执行一下,果然OK,是满足要求的结果。思路就是:只需要过滤右表,就将(使用子查询)过滤后的结果集作为连接查询的右表,然后再去连接,分组......
其实编写简洁而高性能的sql语句,是需要很强的逻辑思维能力(和数学分不开)和经验的。还有种更简单的写法:
SELECT sum(case when nos.workTime>getdate then 1 else 0 end) AS PersonNumSounceCOUNT , --总数 dct.ID AS docID , dct.NAME , dct.docNumber FROM doctor AS dct LEFT JOIN Nosource AS nos ON dct.docNumber = nos.docNumber GROUP BY dct.ID , dct.NAME , dct.docNumber
这样去解释,不知道大家是否能够理解,反正大致意思就是这样的。笔者的表达能力和水平确实有限,难免有偏差,望读者谅解!
本文出自http://blog.****.net/dinglang_2009,转载请注明出处。