如何解决熊猫 - 如何重新采样到一组已知的时期
我有发票数据,其中有一个日期时间列存储它的创建时间 - 我想将数据重新采样到周视图中以执行一些分析。
使用以下示例对数据重新采样会获得此信息,但它会在列的最小时间启动窗口,因此索引是任意的。
example = invoiceDF.resample("1W",on='created_on')['cost_value'].mean()
我想强制将数据聚合到哪个星期。我有涵盖这些发票所属年份的合同,所以我知道几周的开始和结束日期。可以通过下面的代码给出。
datetimeIndex = pd.date_range(contract.start,contract.end,freq='W')
必须有一种方法可以使用这些日期时间来重新采样数据,而不是让它自行解决。
我真的不想自己遍历数据并过滤每周的发票数据来执行此操作。在重新采样之前,我为某些列调用了 groupyby
,因为我多次需要此视图,因此如果结果确实如此,这将是一个非常令人头疼的问题。
目前我正在考虑在我的新索引中添加一个带有日期的列,该行应该被聚合到该列中,然后简单地按此列分组以获得答案。再次,这感觉就像一个黑客。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。