有一个体育馆,每日人流量信息被记录在这三列信息中:序号 (id)、日期 (date)、 人流量 (people)。请编写一个查询语句,找出高峰期时段,要求连续三天及以上,并且每天人流量均不少于100。例如,表 stadium:
对于上面的示例数据,输出为:
题目和想要的结果都已经知晓了,该如何求解呢?下面提供两种解题思路
测试环境
SQL Server 2017
思路一:求日期差
通过求解某一日期前后日期差分别为1和-1可以得知这个日期的前后三条记录都是连续的。说的通俗一点就是今天减去前一天的差为1,今天减去明天的差为-1,那么昨天今天明天的日期就是连续三天都连续。具体解法如下:
SELECT DISTINCT d.* FROM stadium d,stadium a WHERE ABS(DATEDIFF(DAY,d.date,a.date))<2 --求解时间差绝对值为1或0的日期 AND a.date IN ( SELECT a.date FROM stadium a,stadium b,stadium c WHERE DATEDIFF(DAY,a.date ,b.date)=1 --今天减去昨天 AND DATEDIFF(DAY,a.date,c.date)=-1 --今天前去明天 AND a.people >99 AND b.people > 99 AND c.people >99 )
思路二:排列组合
按id的连续性,这里要分三种情况:分成三个表s1,s2,s3的组合判断, (1)s1.id-s2.id=1,s2.id-s3.id=1,相当于s3 s2 s1 的顺序三个连续的 (2)s2.id-s1.id=1,s1.id-s3.id=1,相当于s3 s1 s2 的顺序三个连续的 (3)s3.id-s2.id=1,s2.id-s1.id=1,相当于s1 s2 s3 的顺序三个连续的具体解法如下:
select DISTINCT s1.* from stadium s1, stadium s2, stadium s3 where s1.people >= 100 and s2.people>= 100 and s3.people >= 100 and ( (s1.id - s2.id = 1 and s2.id - s3.id =1) or (s2.id - s1.id = 1 and s1.id - s3.id =1) or (s3.id - s2.id = 1 and s2.id - s1.id = 1) ) order by s1.id;
但这种方法对适合的场景有限,如果超过3天,连续的排列组合就会增多,效果不是很好。
以上两种思路均可求出结果,小伙伴们部分自己动手试一下。