如何解决获取 Julia 数据帧中一行的索引类似 iterrows?
在 Julia 中遍历 df 时,有什么方法可以获取行的索引和行对象?如果没有,即使找到一行索引的方法也会很棒,因为我可以简单地使用 eachrow()
然后找到迭代行的索引,尽管我认为这不太可能考虑到命名 df 的索引是Julia 确实支持。
对于上下文,我需要索引以便在 df 的每一列中找到 0 的第一次出现,以便我可以用另一个值(例如 99)替换它。为此,我想遍历 df 中每列的所有行。例如对于 df = DataFrame(a = [1,2],b = [0,1,0],c = [0,4]) 代码:
for col_index in ["a","b","c"]
for row in eachrow(select(df,:i))
if row[1] == 0
df[row.index,:i] = 99
break
end
end
end
会将 df 变成
1 99 99
99 1 0
2 0 4
很抱歉,如果这是一个愚蠢的问题,尽管我在网上找不到任何与我的任何一个目标相关的内容。
解决方法
- 您可以使用
rownumber
函数获取数据框中的行号,DataFrameRow
取自该数据框中。 - 由于
DataFrameRow
是可变的,您可以像这样编写循环:
for col_index in ["a","b","c"]
for row in eachrow(df)
if row[col_index] == 0
row[col_index] = 99
break
end
end
end
- 最后,像这样做你想做的事情会更快:
for col_index in ["a","c"]
col = df[!,col_index]
loc = findfirst(==(0),col)
isnothing(loc) || (col[loc] = 99)
end
,
通过使用 enumerate(eachrow(df))
h/t @Antonello,您可以获得足够好的东西。
从我在问题中写的玩具代码来看,这看起来像:
for col_index in ["a","c"]
for (row_index,row) in enumerate(eachrow(select(df,:col_index)))
if row[1] == 0
df[row_index,:col_index] = 99
break
end
end
end
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。