微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Julia GroupedDataFrame

如何解决Julia GroupedDataFrame

我在 Julia 1.4 (DataFrames 0.22.1) 中有一个 GroupedDataFrame。我想遍历行组以计算一些统计信息。因为组多,计算慢,所以想做多线程。

代码

grouped_rows = groupby(data,by_index)
for group in grouped_rows
    # do something with `group`
end

有效,但是

grouped_rows = groupby(data,by_index)
Threads.@threads for group in grouped_rows
    # do something with `group`
end

结果为 MethodError: no method matching firstindex(::GroupedDataFrame{DataFrame})。有没有办法在 DataFrame 行组上并行化迭代?

解决方法

您需要有一个 AbstractVector 才能使 Threads.@threads 工作。

因此收集您的grouped_rows

Threads.@threads for group in collect(SubDataFrame,grouped_rows)
    # do something with `group`
end

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。