微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在这种情况下我应该如何处理丢失的数据?

如何解决在这种情况下我应该如何处理丢失的数据?

我正在对这个关于学校毕业结果的非常凌乱的数据集进行数据清理,我在这里附上了一些快照:

enter image description here

enter image description here

有很多没有统计数据的队列,他们似乎完全随机丢失了,MCAR。但是,由于它似乎也遵循时间序列(从 2001 年到 2006 年每年,加上 2016 年 8 月),我不知道删除这些缺少数据的行是否是个好主意。如果我们将它们全部删除,我认为当我们进行汇总以按年份计算某些统计数据时,这将是有问题的。 (注意:删除所有这些缺失的行仍然会留下大量数据)。请给我一些关于如何处理这种情况的建议,谢谢!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。