如何解决澄清 Pandas 中的迭代
我使用 Pandas 将近 6 个月了,在我看来,最大的争论之一是关于迭代数据帧,通过 .iterrows()
.apply()
或 list-comprehension
来计算新数据.
我多次(总是在可能的情况下)使用 .loc
或类似的访问器来写入数据。问题是,当我有很多条件时,我曾经在一行代码中解决的问题,我需要创建多行 .iloc
来完成数据。
简而言之:即使数据帧并不大,始终避免迭代并拥有更长的代码行是否有回报?
有人推荐一些解释这种效率权衡的文章吗?
解决方法
有一篇很棒的文章介绍了遍历数据帧的不同方法,以及每种方法需要多长时间。我个人觉得非常有帮助。看看:https://towardsdatascience.com/apply-function-to-pandas-dataframe-rows-76df74165ee4
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。