微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – pandas – 检查dataframe groupby中的非唯一值

我有这个简单的数据帧df:

a,b
1,2
1,3
1,4
1,2
2,1
2,2
2,3
2,5
2,5

我想检查b中是否有关于每个组的重复项.到目前为止,我做了以下事情:

g = df.groupby('a')['b'].unique()

返回:

a
1       [2, 3, 4]
2    [1, 2, 3, 5]

但我想要的是一个列表,对于a中的每个组,在b中出现多次.在这种情况下的预期输出将是:

a
1    [2]
2    [5]

解决方法:

g=df.groupby('a')['b'].value_counts()
g.where(g>1).dropna()

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐