如何解决PandasMultiIndex DataFrame.rolling偏移量
为了使用像“
30D”这样的偏移量,您需要一个简单的日期索引。在这种情况下,最简单的实现方法是使用,将“名称”移出索引reset_index(level='Name')
,而只将“日期”作为索引:
df['Avg'] = df.reset_index(level='Name').groupby(['Name'])['Vals'].rolling('30D').mean()
解决方法
为什么在rolling
多索引DataFrame时不能使用偏移量? 例如,使用:
rng = pd.date_range('2017-01-03',periods=20,freq='8D')
i = pd.MultiIndex.from_product([['A','B','C'],rng],names=['Name','Date'])
df = pd.DataFrame(np.random.randn(60),i,columns=['Vals'])
如果我尝试使用偏移量进行分组和滚动,则会显示“ ValueError:窗口必须为整数 ”:
df['Avg'] = df.groupby(['Name'])['Vals'].rolling('30D').mean() # << Why doesn't this work?
并不是说以下这些变体可以满足我的需求,但是请注意对int
作品进行分组和滚动:
df['Avg'] = df.groupby(['Name'])['Vals'].rolling(4).mean()
我可以在DataFrame的单索引子集上使用偏移量滚动:
d = df.loc['A']
d['Avg'] = d['Vals'].rolling('30D').mean()
如果确实不可能在多索引DataFrame上进行偏移滚动,那么将零应用于每个0级索引项的最有效的解决方法是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。