微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python-Sklearn的不当v / s df.fillnan用列的平均值替换nan值

我找到了两种方法来替换python中的nan值,
一个使用sklearn的imputer类,另一个使用df.fillnan()
后者似乎用更少的代码很容易.
但是效率方面更好.
谁能解释每个的用例?

解决方法:

我觉得不熟练的班级有其自身的好处,因为您可以简单地提到均值或中位数来执行某些操作,这与Fillna中需要提供值的情况不同.但是在不完美的情况下,您需要调整和转换数据集,这意味着需要更多的代码行.但这可能会比fillna的速度更快,但除非有非常大的数据集,否则无关紧要.

但是fillna的确很酷.您甚至可以使用有时可能需要的自定义值来填充na.即使fillna性能较慢,这也可以使fillna更好地恕我直言.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐