迭代每个 Pandas df 行并确定行值是否在列表中,如果是,则将该值拉入 df

如何解决迭代每个 Pandas df 行并确定行值是否在列表中,如果是,则将该值拉入 df

我有一个 Pandas df,其中包含为世界各地的州手动输入的值。我有一个正确格式化并包含正确语法的状态值列表。我想遍历 pandas df 中的每一行,并将每行的值与状态列表中的所有值进行比较,以确定该行中的值是否包含在任何字符串值中。如果是这样,将该值从字符串中提取到名为“match”的新 df 列中。如果包含 Pandas 行的字符串值不止一个,则引入这两个值并让它创建一个列表。下面是我的意思的一个例子。

注意:我已经可以使用 difflib get_close_matches 函数来做到这一点。发布下面的代码并为此输出,想要一种方法来复制它,但是对于熊猫中的 str.contains() 能力。

state_df

states_list = ['俄勒冈州'、'德克萨斯州'、'科罗拉多州'、夏威夷州、'索诺拉州'、'阿拉斯加州'、'阿拉巴马州'、'阿克拉'等]

结果

enter image description here

我如何使用获取接近匹配来选择与下面输入的状态值最接近的匹配。想要添加另一列,其中包含行值字符串所在的状态列表中的值

enter image description here

解决方法

尝试以下操作:

s = set([i.lower() for i in states_list])

df['match'] = df['state_name'].apply(lambda x: list(set([i.strip().lower() for i in x.split(',')]).intersection(
s)))

df['match']=df['match'].apply(lambda x: [i[0].upper() + i[1:] for i in x])

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?