如何解决闰年和石斑鱼功能
我正在尝试重新采样我的 df,但是使用 grouper 函数在重新采样过程中遗漏了几个值: 我有一些从 2003 年到 2020 年的分层数据,它们最终变成了如下所示的时间序列数据:
polar_temp
Station_Number Date Value
417 CA002100805 20030101 -296
423 CA002202570 20030101 -269
425 CA002203058 20030101 -268
427 CA002300551 20030101 -23
428 CA002300902 20030101 -200
我在 Station_Number 和 Date 上设置了多索引:
polar_temp['Date'] = pd.to_datetime(polar_temp['Date'],format='%Y%m%d')#.dt.strftime("%Y-%m-%d")
polar_temp = polar_temp.set_index(['Station_Number',"Date"])
Value
Station_Number Date
CA002100805 2003-01-01 -296
CA002202570 2003-01-01 -269
CA002203058 2003-01-01 -268
CA002300551 2003-01-01 -23
CA002300902 2003-01-01 -200
现在我想通过使用以下方法计算每 8 天的 Value 平均值来对数据进行重新采样:
polar_temp8d = polar_temp.groupby([pd.Grouper(level='Station_Number'),pd.Grouper(level='Date',freq='8D')]).mean()
Value
Station_Number Date
CA002100805 2003-01-01 -300.285714
2003-01-09 -328.750000
2003-01-17 -325.500000
2003-01-25 -385.833333
2003-02-02 -194.428571
... ...
USW00027515 2005-06-23 76.625000
2005-07-01 42.375000
2005-07-09 94.500000
2005-07-17 66.500000
2005-07-25 56.285714
问题是只有大约。大约返回 60.000 个值,但是输入 df 大约有 100 万个值。我仅在 2003 年至 2011 年期间尝试了相同的程序,但再次仅获得了大约 60 美元的回报。 60.000。因此我的问题:
- 我是不是用错了石斑鱼功能?
- 问题可能是由于闰年吗?
- 或者有其他方法可以重新采样数据吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。