我在MS sql Server中对数据集进行分组时遇到问题.
我的桌子看起来像
# | CustomerID | SalesDate | Turnover ---| ---------- | ------------------- | --------- 1 | 1 | 2016-08-09 12:15:00 | 22.50 2 | 1 | 2016-08-09 12:17:00 | 10.00 3 | 1 | 2016-08-09 12:58:00 | 12.00 4 | 1 | 2016-08-09 13:01:00 | 55.00 5 | 1 | 2016-08-09 23:59:00 | 10.00 6 | 1 | 2016-08-10 00:02:00 | 5.00
现在,我想将SalesDate差异与下一行的行分组,最多为5分钟.
所以第1行和第1行2,3& 4和5& 6个是一组.
我的方法是使用DATEPART()函数获取分钟并将结果除以5:
(DATEPART(MINUTE,SalesDate) / 5)
对于第1行和第2行,结果将为3,并且此处的分组将完美地工作.
但对于SalesDate的小时或甚至当天部分发生变化的其他行,结果不能用于分组.
所以这就是我被困住的地方.如果有人能指出我正确的方向,我真的很感激.
解决方法
您希望根据它们之间的时间对相邻事务进行分组.我们的想法是分配某种分组标识符,然后将其用于聚合.
这是一种方法:
>识别组开始使用滞后()和日期算法.
>该组的累计总和是否开始识别每个组.
>聚合
查询如下所示:
select customerid,min(salesdate),max(saledate),sum(turnover) from (select t.*,sum(case when salesdate > dateadd(minute,5,prev_salesdate) then 1 else 0 end) over (partition by customerid order by salesdate) as grp from (select t.*,lag(salesdate) over (partition by customerid order by salesdate) as prev_salesdate from t ) t ) t group by customerid,grp;
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。