如何解决Python/Dask:如何在 dask 中复制“.groupby('Asset').resample('2D').pad()”的使用?
如何获得与在 DASK 上的 pandas 相同的结果?
目标是为每个组设置统一的时间间隔,复制最后一个值,直到我们有了新的值。
import pandas as pd import numpy as np import datetime
data=pd.DataFrame([["AAAA","2020-01-15",2],["AAAA","2020-02-15",9],"2020-02-20","2020-02-25","2020-04-18",["BBBB","2020-01-01",5],4],"2020-04-15",["CCCC","2020-03-20",7],"2020-04-25","2020-05-15",2]])
data.columns=['Asset','Date','P']
data['Date']=pd.to_datetime(data['Date'])
data.index=data['Date'].values
temp=data.groupby('Asset').resample('2D').pad()
temp
** 这只是一个例子,实际应用真的很大。
谢谢!
解决方法
.resample()
功能未在当前版本的 dask 中完全复制。我的建议是研究 xarray
(如果您想要类似网格的结构)或使用 dask.delayed
包裹 pandas
。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。