在我们日常统计过程中,像这种要统计连续N天都出现的问题比较普遍。比如统计连续三天销售额大于10万的是哪几天,连续一周客流量大于100的是哪几天等等。
今天我们用一个示例,来告诉大家该如何求解类似的问题。
有一个体育馆,每日人流量信息被记录在这三列信息中:序号 (id)、日期 (date)、 人流量 (people)。请编写一个查询语句,找出高峰期时段,要求连续三天及以上,并且每天人流量均不少于100。例如,表 stadium:
对于上面的示例数据,输出为:
题目和想要的结果都已经知晓了,该如何求解呢?下面提供两种解题思路
测试环境
SQL Server 2017
思路一:求日期差
通过求解某一日期前后日期差分别为1和-1可以得知这个日期的前后三条记录都是连续的。说的通俗一点就是今天减去前一天的差为1,今天减去明天的差为-1,那么昨天今天明天的日期就是连续三天都连续。
具体解法如下:
SELECT DISTINCT d.*
FROM stadium d,stadium a
WHERE ABS(DATEDIFF(DAY,d.date,a.date))<2 --求解时间差绝对值为1或0的日期
AND a.date IN
(
SELECT a.date
FROM stadium a,stadium b,stadium c
WHERE
DATEDIFF(DAY,a.date ,b.date)=1 --今天减去昨天
AND DATEDIFF(DAY,a.date,c.date)=-1 --今天前去明天
AND a.people >99
AND b.people > 99
AND c.people >99
)
(提示:可以左右滑动代码)
思路二:排列组合
按id的连续性,这里要分三种情况:分成三个表s1,s2,s3的组合判断, (1)s1.id-s2.id=1,s2.id-s3.id=1,相当于s3 s2 s1 的顺序三个连续的 (2)s2.id-s1.id=1,s1.id-s3.id=1,相当于s3 s1 s2 的顺序三个连续的 (3)s3.id-s2.id=1,s2.id-s1.id=1,相当于s1 s2 s3 的顺序三个连续的
具体解法如下:
select DISTINCT s1.*
from stadium s1, stadium s2, stadium s3
where s1.people >= 100 and s2.people>= 100 and s3.people >= 100
and
(
(s1.id - s2.id = 1 and s2.id - s3.id =1)
or
(s2.id - s1.id = 1 and s1.id - s3.id =1)
or
(s3.id - s2.id = 1 and s2.id - s1.id = 1)
) order by s1.id;
但这种方法对适合的场景有限,如果超过3天,连续的排列组合就会增多,效果不是很好。
以上两种思路均可求出结果,小伙伴们部分自己动手试一下。