如何解决时间序列重采样错误和没有频率
目前我正在做一个时间序列项目。 我有超过 5 年时间跨度的每日数据点。在这之间,有几天值为 0,也有几天不见了。 例如:
2015-01-10 343
2015-03-10 128
10 月 2 日不见了。 为了建立一个好的时间序列模型,我想将数据重新采样为每月:
df.individuals.resample("M").sum()
但我得到以下输出:
2015-01-31 343.000000
2015-02-28 NaN
2015-03-31 64.500000
不知何故,月份完全错误。
预期的输出如下所示:
2015-31-10 Sum of all days
2015-30-11 Sum of all days
2015-31-12 Sum of all days
解决方法
Pandas 将您的日期解释为 %Y-%m-%d。 在进行重新采样之前,您应该明确指定您的日期格式。 试试这个:
df.index = pd.to_datetime(df.index,format="%Y-%d-%m")
>>> df.resample("M").sum()
2015-10-31 471
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。