微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

按日期时间进行SQL分组,最大差异为x分钟

我在MS sql Server中对数据集进行分组时遇到问题.

我的桌子看起来像

# | CustomerID | SalesDate           | Turnover
---| ---------- | ------------------- | ---------
 1 | 1          | 2016-08-09 12:15:00 |  22.50
 2 | 1          | 2016-08-09 12:17:00 |  10.00
 3 | 1          | 2016-08-09 12:58:00 |  12.00
 4 | 1          | 2016-08-09 13:01:00 |  55.00
 5 | 1          | 2016-08-09 23:59:00 |  10.00
 6 | 1          | 2016-08-10 00:02:00 |   5.00

现在,我想将SalesDate差异与下一行的行分组,最多为5分钟.
所以第1行和第1行2,3& 4和5& 6个是一组.

我的方法是使用DATEPART()函数获取分钟并将结果除以5:

(DATEPART(MINUTE,SalesDate) / 5)

对于第1行和第2行,结果将为3,并且此处的分组将完美地工作.
但对于SalesDate的小时或甚至当天部分发生变化的其他行,结果不能用于分组.

所以这就是我被困住的地方.如果有人能指出我正确的方向,我真的很感激.

解决方法

您希望根据它们之间的时间对相邻事务进行分组.我们的想法是分配某种分组标识符,然后将其用于聚合.

这是一种方法

>识别组开始使用滞后()和日期算法.
>该组的累计总和是否开始识别每个组.
>聚合

查询如下所示:

select customerid,min(salesdate),max(saledate),sum(turnover)
from (select t.*,sum(case when salesdate > dateadd(minute,5,prev_salesdate)
                      then 1 else 0
                 end) over (partition by customerid order by salesdate) as grp
      from (select t.*,lag(salesdate) over (partition by customerid order by salesdate) as prev_salesdate
            from t
           ) t
     ) t
group by customerid,grp;

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐