技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

python – 删除一行中的值等于另一列中的值的行

时间：2022-09-06分类：pandas作者：编程之家原文地址

我正在努力弄清楚如何从pandas数据框中删除行,其中两个指定的列在一行中具有相同的值.

例如,在下面的示例中,我想删除第2列和第4列中具有重复值的行.

例如：

Column1 Column2 Column3 Column4
  Pat     123     John    456
  Pat     123     John    345 
  Jimmy   678     Mary    678 
  Larry   678     James   983

会变成：

Column1 Column2 Column3 Column4
  Pat     123     John    456 
  Pat     123     John    345
  Larry   678     James   983

任何帮助表示赞赏,谢谢！

Series.ne(！=)

df[df['Column2'] != df['Column4']]

  Column1  Column2 Column3  Column4
0     Pat      123    John      456
1     Pat      123    John      345
3   Larry      678   James      983

或者,使用operator.ne：

df[operator.ne(df['Column2'], df['Column4'])]

  Column1  Column2 Column3  Column4
0     Pat      123    John      456
1     Pat      123    John      345
3   Larry      678   James      983

比较两者;得到一个面具,然后过滤.

使用loc,我们还可以提供回调(由@ W-B建议！).

df.loc[lambda x : x['Column2'] != x['Column4']]

  Column1  Column2 Column3  Column4
0     Pat      123    John      456
1     Pat      123    John      345
3   Larry      678   James      983

询问

df.query('Column2 != Column4')

  Column1  Column2 Column3  Column4
0     Pat      123    John      456
1     Pat      123    John      345
3   Larry      678   James      983

np.vectorize

import operator
f = pd.np.vectorize(lambda x, y: x != y)
df[f(df['Column2'], df['Column4'])]

  Column1  Column2 Column3  Column4
0     Pat      123    John      456
1     Pat      123    John      345
3   Larry      678   James      983

…纯娱乐.

列表理解

df[[x != y for x, y in zip(df['Column2'], df['Column4'])]]

  Column1  Column2 Column3  Column4
0     Pat      123    John      456
1     Pat      123    John      345
3   Larry      678   James      983

比你想象的更快！

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：如何从同一个文件连接多个Excel工作下一篇：python – 如何在Pandas中获取数据

相关推荐

一文讲述Pandas库的数据读取、数据获取、数据拼接、数据写出！

转载：一文讲述Pandas库的数据读取、数据获取、数据拼接、数据写出！(qq.com)1.pandas介绍Pandas是一个强大的数据分析库，它的Series和DataFrame数据结构，使得处理起二维表格数据变得非常简单。基于后面需要对Excel表格数据进行处理，有时候使用Pandas库处理表格数据，会更容易、更简单，

作者：编程之家时间：2022-11-23

1.Pandas是什么

Pandas是一个开源的第三方Python库，从Numpy和Matplotlib的基础上构建而来，享有数据分析“三剑客之一”的盛名（NumPy、Matplotlib、Pandas）。Pandas已经成为Python数据分析的必备高级工具，它的目标是成为强大、灵活、可以支持任何编程语言的数据分析工具。图1：PandasLogoPa

作者：编程之家时间：2022-11-23

Python 筛选 Excel 数据练习

整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件登录天池在线编程环境网址：tianchi.aliyun.com登陆后选择天池实验室-天池notebook天池实验室新手入门教程：https:/ianchi.aliyun.comotebook-ai/detail?&postId=198826注意：编辑完后将代码保存回

作者：编程之家时间：2022-11-23

Python - numpy 和 pandas

一、numpy小结二、pandas2.1为什么要学习pandans

作者：编程之家时间：2022-11-23

Pandas：时序数据下

1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta，但它使用日历中时间日期的规则，而不是直接进行时间性质的算术计算，让时间更符合实际生活。比如，有些地区使用夏令时时，每日偏移时间有可能是23或24小时，甚至25个小时。移动偏移应用偏移偏移参数上

作者：编程之家时间：2022-11-23

1、pandas内置样式空值高亮highlight_null最大最小值高亮背景渐变background_gradient根据数值的大小背景颜色呈现梯度渐变，越深表示越大，越浅表示越小，类似于Excel的中的色阶样式。条形图bar2、pandas格式显示我们在最终输出数据查看时，需要对数据进行相应

作者：编程之家时间：2022-11-23

ML第15周学习小结

本周收获总结一下本周学习内容：1、《深入浅出Pandas》的第14章：Pandas时序数据14.4时间偏移~14.6时间操作

作者：编程之家时间：2022-11-23

ML第16周小结

本周收获总结一下本周学习内容：1、《深入浅出Pandas》的第15章：Pandas样式15.1内置样式~15.3样式高级操作

作者：编程之家时间：2022-11-23

pandas快速入门

安装pip3installpandaspandas快速入门1pandas擅长处理哪些数据在处理表格数据时，例如存储在电子表格或数据库中的数据，pandas是适合您的工具。pandas将帮助您探索、清理和处理数据。在pandas中，数据表称为DataFrame。要加载pandas包并开始使用它，请导入该包。社区一致使用的p

作者：编程之家时间：2022-11-23

数据分析之Pandas

一、Pandas介绍1、介绍pandas是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而

作者：编程之家时间：2022-09-06

小编推荐

苹果市值2025年有望达4万亿美元