如何解决如何在理解列表中迭代数据框的索引和列?
如果我需要在理解列表中迭代 df
,我会这样做:
df['new_col'] = [x if y == 1 and z == 2 for x,y in df[['col_1','col_2']].values]
如果不是迭代 col_1
和 col_2
,我需要迭代 df.index
和 df_col_2
值?
在这个 for
条件示例中的理解列表中的语法是什么?
解决方法
pandas 数据框和系列具有迭代方法。因此,要迭代索引和给定的列,您可以使用 iteritems:
df['new_col'] = [x if y == '1' and z =='2' for x,y in df['col_2'].iteritems()]
在这种情况下,x 是 index
,y 是 col2
列的值
更一般地说,iterrows
使您可以在一次迭代中访问索引和所有列:
for idx,row in df.iterrows():
print("Index",idx)
print("col1",row.col1)
print("col2",row.col2)
...
,
让我们以数据帧为例。然后看看你可以用 df.loc 和 df.index 做的各种事情。
我将举一个简单的例子,其中包括 5 个 1 到 4 岁的孩子,以及他们迄今为止获得的积分。通常,我更喜欢唯一索引,但在本例中,我们希望您希望按索引进行搜索。所以我让它变得不独特。
import pandas as pd
df = pd.DataFrame({'Points': [2,4,8,3,2,5,6],'Age': [2,1,3]},index=['Bob','Mike','Steve','Kate','Jane','Jill','Jane'])
print (df)
DataFrame 将如下所示:
Points Age
Bob 2 2
Mike 4 3
Steve 8 4
Kate 3 1
Jane 2 2
Jill 5 4
Jane 6 3
如果我们想找到所有年龄 = 2 且姓名 = Jane 的孩子,你可以给:
x = df.loc[(df.Age == 2) & (df.index == 'Jane'),'Points'].tolist() #or .values
print (x)
输出将是:
[2]
如果你想找出所有年龄= 2 并且得了2分的孩子,你可以给:
y = df.index[(df.Age == 2) & (df.Points == 2)].tolist() #or .values
print (y)
输出将是:
['Bob','Jane']
如果你想找到所有年龄 = 3 的孩子,你可以给:
z = df.index[(df.Age == 3)].tolist() #or .values
print (z)
输出将是:
['Mike','Jane']
假设您想缩小范围并使用 Found in New_col
更新 2 岁的 Jane,然后您可以给出:
df.loc[(df.Age == 2) & (df.index == 'Jane'),'New_col'] = 'Found'
print (df)
输出将是:
Points Age New_col
Bob 2 2 NaN
Mike 4 3 NaN
Steve 8 4 NaN
Kate 3 1 NaN
Jane 2 2 Found
Jill 5 4 NaN
Jane 6 3 NaN
这些都不需要我们使用 df.iterrows() 遍历数据帧。我们可以在不使用 df.iterrows() 的情况下进行很多这些数据操作。如果您有特定的用例,让我们对其进行审查并提出一个不涉及迭代的解决方案。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。