如何解决形状奇特的小提琴情节
我想用小提琴图比较技术化的几个维度的分布(这些维度是通过1到5的指数来衡量的)。 6个小提琴图中有5个看起来像您期望的那样,但是其中一个的形状确实很奇怪,没有反映在数据中。所以我想知道是否对此有任何解释。我将向您显示变量表,用于创建绘图的代码以及绘图本身。如果您需要更多信息,请随时询问。
表格:
> table(dat$cps_an,useNA="ifany") # cps-Anlagen
0 0.625 0.833333333333333 1.25 1.66666666666667 1.875 2.5 3.125 3.75 4.375
22 21 3 20 4 18 19 15 5 1
5 <NA>
2 5
> table(dat$cps_prod,useNA="ifany") # cps-Produkte
0 0.625 0.833333333333333 1.25 1.66666666666667 1.875 2.5 3.125 3.33333333333333 3.75
3 8 1 28 3 33 38 13 3 3
4.375
2
> table(dat$cpps,useNA="ifany") # Produktionssysteme
0 0.333333333333333 1 1.16666666666667 1.5 1.75 2 2.5 2.66666666666667 2.83333333333333
2 1 2 2 1 1 11 3 2 9
3 3.16666666666667 3.33333333333333 3.5 3.66666666666667 3.75 3.83333333333333 4.16666666666667 4.33333333333333 4.66666666666667
9 2 22 1 3 2 9 28 1 6
5 <NA>
13 5
> table(dat$mobile,useNA="ifany") # Mobile Devices
0 1.66666666666667 2.5 3.33333333333333 3.75 4.16666666666667 5
3 29 4 2 3 34 60
> table(dat$strat,useNA="ifany") # Strategie und Organisation
0 0.625 1.25 1.66666666666667 1.875 2.5 3.125 3.33333333333333 3.75 4.375 5
1 3 3 2 11 34 38 3 11 8 5
<NA>
16
> table(dat$index,useNA="ifany") # Gesamt-Index
0.485416666666667 0.975 1.25104166666667 1.30625 1.31979166666667 1.33958333333333 1.82604166666667 1.86041666666667 1.93854166666667 2.00416666666667
1 1 1 1 1 1 1 1 1 1
2.04791666666667 2.06354166666667 2.15104166666667 2.16666666666667 2.1875 2.203125 2.23541666666667 2.26041666666667 2.30104166666667 2.303125
1 1 1 2 1 1 1 1 1 1
2.31666666666667 2.33854166666667 2.353125 2.36041666666667 2.38541666666667 2.390625 2.39479166666667 2.415625 2.43854166666667 2.453125
2 1 1 1 1 1 1 1 1 1
2.47916666666667 2.54479166666667 2.5625 2.56875 2.584375 2.58854166666667 2.60416666666667 2.62604166666667 2.65625 2.671875
1 1 1 1 1 1 1 1 1 2
2.6875 2.69166666666667 2.70416666666667 2.728125 2.75 2.75625 2.78541666666667 2.81354166666667 2.828125 2.84375
1 1 1 1 1 1 1 1 1 1
2.86875 2.86979166666667 2.875 2.88541666666667 2.9125 2.91666666666667 2.94270833333333 2.953125 2.95833333333333 2.959375
1 1 1 1 1 1 1 1 1 1
2.96354166666667 2.96875 2.984375 2.99791666666667 3.015625 3.03125 3.03541666666667 3.046875 3.05104166666667 3.05729166666667
1 1 1 1 1 3 1 2 1 1
3.078125 3.07916666666667 3.08854166666667 3.09375 3.11666666666667 3.125 3.140625 3.16979166666667 3.17604166666667 3.1875
1 1 1 1 1 2 1 1 1 1
3.209375 3.2125 3.228125 3.25 3.26041666666667 3.290625 3.296875 3.30625 3.32291666666667 3.328125
1 1 1 1 1 1 1 1 1 1
3.375 3.43229166666667 3.44791666666667 3.47916666666667 3.58854166666667 3.64166666666667 3.72291666666667 3.80104166666667 3.859375 3.96354166666667
2 2 1 1 1 1 1 1 1 1
3.984375 4.15833333333333 4.1875 4.30625 <NA>
1 1 1 1 22
小提琴图的代码:
technologie_df <- data.frame(group=c(rep("cps: Anlagen",nrow(dat)),rep("cps: Produkte",rep("Produktionssysteme",rep("Mobile Devices",rep("Strategie und Organisation",rep("Gesamt-Index",nrow(dat))),value=c(dat$cps_an,dat$cps_prod,dat$cpps,dat$mobile,dat$strat,dat$index))
technologie_df <- na.omit(technologie_df)
technologie_plot <- ggplot(technologie_df,aes(x=group,y=value,fill=group)) +
geom_violin() +
labs(y="Index-Wert") +
scale_x_discrete(limits=c("cps: Anlagen","cps: Produkte","Produktionssysteme","Mobile Devices","Strategie und Organisation","Gesamt-Index")) +
scale_fill_manual(values=c("#003560","#8DAE10","#003560","#003560")) +
theme(axis.title.x = element_blank(),panel.background = element_blank(),axis.line = element_line(colour="black"),legend.position = "none")
ggsave(file.path(path_out,"ViolinPlot_Technologie.png"),plot=technologie_plot,type="cairo-png")
情节本身:
使我烦恼的情节当然是“战略与组织”之一,因为其形状不适合数据。如果您查看表格,有34个人的评分为2.5,而38个人的评分为3.125。两者之间没有任何价值,因为只有很少的人可以解释情节中2.5和3.125之间的差距。其他大多数差距也是如此。其他地块没有这些差距。对此有解释吗?
解决方法
如果您希望小提琴图突出显示数据的离散性质,则可以将adjust
中的geom_violin()
设置为较小的值:
ggplot(dat) +
geom_violin(aes(x = "Strategie und Organisation",y = strat),adjust = 0.1)
如果您希望绘图隐藏数据的离散特性,请将adjust
设置为更大的值。
ggplot(dat) +
geom_violin(aes(x = "Strategie und Organisation",adjust = 1.5)
以下是基于OP帖子的数据。
dat <- data.frame(strat = c(0,rep(0.625,3),rep(1.25,rep(5/3,2),rep(1.875,11),rep(2.5,34),rep(10/3,rep(3.75,rep(4.375,8),rep(5,5)))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。