如何解决使用R可视化诊断矩阵
我有一个包含大量变量的数据框,我想相互绘制数字变量并分析散点图。
可以如下读取数据集
library(readr)
big_epa_cars <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2019/2019-10-15/big_epa_cars.csv")
然后我按照以下步骤绘制我感兴趣的变量
library(tidyverse)
library(Ggally)
big_epa_cars %>%
filter(year == 2019) %>%
select(barrels08,cylinders,city08,highway08,fescore,fuelCost08,co2TailpipeGpm,youSaveSpend) %>%
ggpairs()
我还想在相似的矩阵中可视化每个组合分布的隐喻。 我能够计算和可视化单个变量对的诊断,并且在计算和可视化所选变量的所有组合(桶08,汽缸,city08,Highway08,fescore,fuelCost08,co2TailpipeGpm,youSaveSpend)方面需要帮助。
以下是我如何在一对变量上做到这一点
library(binostics)
s <- binostics::scagnostics(big_epa_cars_2019$city08,big_epa_cars_2019$highway08)$s
df_s <- tibble(scag = names(s),value = s) %>%
mutate(scag = fct_reorder(scag,value))
ggplot(df_s,aes(x=value,y=scag)) +
geom_point(size=3,colour="blue") +
geom_segment(aes(x=value,xend=0,y=as.numeric(scag),yend=as.numeric(scag)),colour="blue") +
ylab("") + xlab("scagnostic value")
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。