微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 按Sum分组为新列名

我正在执行功能,我按ID分组,并使用此代码python汇总与这些ID相关联的$值:

df = df.groupby([' Id'],as_index=False,sort=False)[["Amount"]].sum();

但它没有重命名列.因此,我尝试这样做:

`df = df.groupby([' Id'],sort=False)`[["Amount"]].sum();.reset_index(name ='Total Amount')

但它给了我错误,TypeError:reset_index()得到了一个意外的关键字参数’name’

所以我最后在这文章后尝试这样做:Python Pandas Create New Column with Groupby().Sum()

df = df.groupby(['Id'])[["Amount"]].transform('sum');

但它仍然没有奏效.

我究竟做错了什么?

解决方法

我认为您需要删除参数as_index = False并使用 Series.reset_index,因为此参数返回df,然后 DataFrame.reset_index参数名称失败:

df = df.groupby('Id',sort=False)["Amount"].sum().reset_index(name ='Total Amount')

或者首先重命名列:

d = {'Amount':'Total Amount'}
df = df.rename(columns=d).groupby('Id',sort=False,as_index=False)["Total Amount"].sum()

样品:

df = pd.DataFrame({'Id':[1,2,2],'Amount':[10,30,50]})
print (df)
   Amount  Id
0      10   1
1      30   2
2      50   2

df1 = df.groupby('Id',sort=False)["Amount"].sum().reset_index(name ='Total Amount')
print (df1)
   Id  Total Amount
0   1            10
1   2            80

d = {'Amount':'Total Amount'}
df1 = df.rename(columns=d).groupby('Id',as_index=False)["Total Amount"].sum()
print (df1)
   Id  Total Amount
0   1            10
1   2            80

但是如果需要在原始df中使用sum的新列使用transform并将输出分配给新列:

df['Total Amount'] = df.groupby('Id',sort=False)["Amount"].transform('sum')
print (df)
   Amount  Id  Total Amount
0      10   1            10
1      30   2            80
2      50   2            80

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐