微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

替换因子中的未知值

如何解决替换因子中的未知值

我正在搜索如何替换我的数据集中丢失的值被分类为“未知”的内容 所有未知值都在因子列中.. 例如,我的婚姻状况有已婚、单身离异和未知。我正在寻找如何替换“未知”而不是删除方法。其他因素只有是、否、未知。

bank$marital <- factor(c('married','divorced','married','unkNown','single'))

我只想用例如“单身”替换“未知”

bank$marital = bank$marital.fillna(bank$marital.mode[yes],inplace = True)

bank$marital[is.na(bank$marital)]<-mean(bank$marital,na.rm=TRUE)

我不能使用mean,因为它的因素...... 但我找不到如何替换因子中的“未知”值的正确方法

解决方法

你的意思是像下面这样吗?

f <- type.convert(f,as.is = TRUE)
replace(f,is.na(f),mean(f,na.rm = TRUE))
# [1] 1.000 2.775 4.000 3.000 3.100 2.775

虚拟数据

f <- factor(c(1,NA,4,3,3.1,NA))
,

这个?

here

bank <- data.frame(marital = as.factor(c('married','divorced','married','unknown','single')))

levels(bank$marital) <- c(levels(bank$marital),"x")    # add new level

bank$marital[ bank$marital == "unknown" ] <- "x"

bank$marital
#> [1] married  divorced married  x        single  
#> Levels: divorced married single unknown x

reprex package (v0.3.0) 于 2021 年 1 月 29 日创建

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。