如何解决groupby 后的未知 dask 数据帧索引应用元参数
将元参数传递给 groupby.apply
时,我无法重置索引并删除与索引对应的列之一。
这是一个最小的例子:
import pandas as pd
import dask.dataframe as dd
df = pd.DataFrame({'c0': ['a','b','a','b'],'c1': [1,1,2,5],'c2': [0,})
ddf = dd.from_pandas(df,3)
op = lambda x: x.groupby("c1").mean().reset_index()
以下行有效:
ddf.groupby("c0").apply(op).reset_index().drop(columns="level_1")
但这个没有:
ddf.groupby("c0").apply(op,Meta={"c1": float,"c2": float}).reset_index().drop(columns="level_1")
出现以下错误:
...
5590 if errors != "ignore":
-> 5591 raise KeyError(f"{labels[mask]} not found in axis")
5592 indexer = indexer[~mask]
KeyError: "['level_1'] not found in axis"
The above exception was the direct cause of the following exception:
ValueError Traceback (most recent call last)
<ipython-input-52-abd5cec1fdbf> in <module>
----> 1 ddf.groupby("c0").apply(op,"c2": float}).reset_index().drop(columns="level_1")
...
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。