如何解决如何使用dplyr进行R中的Excel vlookup缺失值插补?
我正在使用住房数据集,其中total_bedrooms
字段缺少一些值。我正在尝试根据grouped_by ocean_proximity
(不尝试使用软件包进行插补),根据其中间值替换这些缺失值。
房屋
longitude latitude housing_median_age total_rooms total_bedrooms population households ocean_proximity
-122.16 37.77 47 1256 NA 570 218 NEAR BAY
-122.17 37.75 38 992 NA 732 259 INLAND
-122.28 37.78 29 5154 NA 3741 1273 NEAR OCEAN
-122.24 37.75 45 891 NA 384 146 ISLAND
我已经根据total_bedrooms
ocean_proximity
的中值
grouped_median_vals <- housing %>% select(ocean_proximity,total_bedrooms) %>%
group_by(ocean_proximity) %>%
summarise(median_vals = median(total_bedrooms,na.rm = T))
grouped_median_vals
ocean_proximity median_vals
<chr> <dbl>
<1H OCEAN 438
INLAND 423
ISLAND 512
NEAR BAY 423
NEAR OCEAN 464
在excel中,我们可以使用行,列查找匹配字段的值。如何在R中实现相同的功能?
我已经测试过which function
给我行索引which(grouped_median_vals$ocean_proximity == "NEAR BAY")
,但是如何使用它来替换{{1}}下的缺失值?
我尝试了以下语句,但无法正确执行。
mutate
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。