微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何填充r

如何解决如何填充r

我有一个R数据帧,需要将其拆分为训练和测试数据集。但是,原始数据帧包含某些列的一些NA值。

如果我用一个例子解释一下, 数据框包含一组人员的反馈,一个变量用于存储他们获得第一份工作的年份或开始在工程团队工作的年份,并存储在numeric变量中,例如YearOfFirstJob或{{ 1}}。因此,对于尚未找到工作的人或从未在工程团队中工作的人来说,这些值将是YearJoinedEngineeringTeam

由于无法删除这些观察值,因此我考虑将变量中的数据表示形式更改为NAYeaRSSinceFirstJob之类的东西,因此可以将所有YearSinceJoiningEngineeringTeam值替换为零。但是,数据框中还有其他NA种变量,并且没有适当的时间点来计算值。其次,我想将它们转换为NumberOfYears,以便可以用factors之类的字符串替换NA值。

我的问题是

处理此类变量的标准方法是什么?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。