微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – Pandas DataFrame计算重复行并填充列

我创建了一个DataFrame,现在需要计算每个重复的行(例如df [‘Gender’].假设性别’男性’出现两次而女性出现三次,我需要这个列:

Gender   Occurrence
Male     1
Male     2
Female   1
Female   2
Female   3

有没有办法与熊猫一起做到这一点?

解决方法:

按性别分组后使用cumcount方法

df = pd.DataFrame({'Gender':['Male','Male','Female','Female','Female']})   
df['Occurrence'] = df.groupby('Gender').cumcount() + 1
print(df)

   Gender  Occurrence
0    Male           1
1    Male           2
2  Female           1
3  Female           2
4  Female           3

计数从0开始,所以我在那里添加了1.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐