微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

填充缺少日期的数据集以小时为单位

如何解决填充缺少日期的数据集以小时为单位

我有一个每小时收集一次股票期权数据的数据集。不幸的是,由于某些维护等原因,缺少某些日期和时间。

这里有一个带有数据框(日期_,价格)的示例,您可以看到“ 2018-02-08”这一天,我们只有2小时,而不是24小时。

enter image description here

是否可以找到丢失的日期?并用缺少的日期填充数据集(在其他列中添加NA)?

我尝试了这种方法来查找缺少的日期

pd.date_range(df.Date_.min(),df.Date_.max()).difference(df.Date_)

但是这在小时数方面效果不佳,因为它今天凌晨6点只返回了1个小时。

enter image description here

解决方法

使用重采样有效

apply(lambda x:x.set_index('Date _')。resample('H')

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。