微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 如何一次比较四列pandas数据帧?

我有一个数据帧.

数据帧:

   Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       0
3         CPC    2  CPC       1
4         CPC    2  CPC       2

我想将Symbol1与Symbol2和BB与CC进行比较,如果它们相同,那么我希望只有其他行必须从数据帧中删除.

预期结果 :

Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       2

如果比较两行,那么我正在使用:

df = df[df['BB'] == '2'].copy()

它会工作正常.

df = df[df['BB'] == df['offset'] and df['Symbol1'] == df['Symbol2']].copy()

它给了我错误.

错误

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我如何比较并得到预期的结果?

解决方法:

您可以使用boolean indexing并与&进行比较而是and

print ((df.Symbol1 == df.Symbol2) & (df.BB == df.CC))
0     True
1     True
2    False
3    False
4     True
dtype: bool

print (df[(df.Symbol1 == df.Symbol2) & (df.BB == df.CC)])
  Symbol1  BB Symbol2  CC
0     ABC   1     ABC   1
1     PQR   1     PQR   1
4     CPC   2     CPC   2

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐