微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用R可视化诊断矩阵

如何解决使用R可视化诊断矩阵

我有一个包含大量变量的数据框,我想相互绘制数字变量并分析散点图。

可以如下读取数据集

library(readr)

big_epa_cars <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2019/2019-10-15/big_epa_cars.csv")

然后我按照以下步骤绘制我感兴趣的变量

library(tidyverse)
library(Ggally)

big_epa_cars %>%
  filter(year == 2019) %>%
  select(barrels08,cylinders,city08,highway08,fescore,fuelCost08,co2TailpipeGpm,youSaveSpend) %>%
  ggpairs()

我还想在相似的矩阵中可视化每个组合分布的隐喻。 我能够计算和可视化单个变量对的诊断,并且在计算和可视化所选变量的所有组合(桶08,汽缸,city08,Highway08,fescore,fuelCost08,co2TailpipeGpm,youSaveSpend)方面需要帮助。

以下是我如何在一对变量上做到这一点

library(binostics)

s <- binostics::scagnostics(big_epa_cars_2019$city08,big_epa_cars_2019$highway08)$s
df_s <- tibble(scag = names(s),value = s) %>%
  mutate(scag = fct_reorder(scag,value))

ggplot(df_s,aes(x=value,y=scag)) + 
  geom_point(size=3,colour="blue") +
  geom_segment(aes(x=value,xend=0,y=as.numeric(scag),yend=as.numeric(scag)),colour="blue") +
  ylab("") + xlab("scagnostic value")

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。