如何解决ggtree:彩色树枝和尖端
尊敬的堆栈溢出社区,
我想问您有关我的问题的帮助。我正在使用ggtree软件包绘制系统发育树,我想在这些图中显示更多信息,如论文中通常所见。我对拥有彩色树枝(混合渐变)的树特别感兴趣,该树枝显示出连续特征中的某些变化,并且分支末端的一些点以颜色(或形状)指示了离散特征。虽然我可以分别做这两种事情,但我完全无法尝试将这两种事情都绘制在一个图中。你能帮忙吗?
在这里,我为您提供了可复制的示例。让我们使用具有9个物种和一些随机分支长度的随机树(tree.1),以及有关这些物种的数据randon表(data1):
###STACK EXAMPLE
source("https://bioconductor.org/biocLite.R")
biocLite("ggtree")
library(ggtree)
tree.1<-read.tree(text="(spec1:2.2,((spec2:1.8,(spec9:1.4,(spec3:1.3,spec5:1.3):0.1):0.4):0.2,(spec8:1.7,(spec6:1.5,(spec7:1,spec4:1):0.5):0.2):0.3):0.2);")
data1<-data.frame(row.names = c("spec1","spec2","spec3","spec4","spec5","spec6","spec7","spec8","spec9"),"tip" = c("spec1","colour" = c("red","red","blue","blue"),"fylo.signal" = c(0.1,1.0,0.3,0.6,0.2,0.8,0.7,0.6))
如果查看数据,则有color列是我的离散变量,而fylo.signal是随机连续变量。
要制作这些图,我遵循了两个示例(this one表示分支的渐变颜色and my old question表示分支末端的点的颜色)。
我可以从颜色渐变分支开始。在绘制数据之前,我有点黑匣子,但我想我至少了解一点。首先,我只提取连续变量(b)并为树计算(a)“节点”,然后为树中所有“非尖端”节点(即不仅是末端)计算连续变量。然后,我将数据合并在一起。
b <- as.matrix(data1)[,3]
a <- data.frame(node = nodeid(tree.1,names(b)),signal = b)
fit2 <- phytools::fastAnc(tree.1,b,vars=TRUE,CI=TRUE)
c <- data.frame(node = names(fit2$ace),signal = fit2$ace)
d.1 <- rbind(a,c)
d.1$node <- as.numeric(d.1$node)
d.1$signal <- as.numeric(d.1$signal)
之后,我还插入了离散变量(并使内部节点的“颜色”具有“ NA”):
colour.vector <- c(data1$colour,rep(NA,nrow(d.1)-nrow(data1)))
d.2 <- cbind(d.1,colour.vector)
d.2
...然后将这些数据插入系统发育树本身:
tree.2 <- dplyr::full_join(tree.1,d.2,by = 'node')
现在进行绘图。我可以使分支的渐变颜色代表我的连续变量。以下代码产生this plot:
## example1 (SEPARATE TREES)
t1 <- ggtree(tree.2,aes(color=signal),layout = 'circular',ladderize = FALSE,continuous = TRUE,size=2) +
ggplot2::scale_color_gradientn(colours=c('red','orange','green','cyan','blue')) +
geom_tiplab(hjust = -.1,offset=.1) +
theme(legend.position = c(.05,.85))
t1
...和this image,当我尝试将离散变量绘制为分支末尾的不同颜色的点时(请注意,即使颜色是反转的,它实际上也会遵循我使用的数据集):
t2 <- ggtree(tree.2,layout = 'circular') + geom_tiplab(hjust = -.1,offset=.1)
t2 <- t2 %<+% data1 + geom_tippoint(pch=16,size=4,aes(col=colour))
t2
但是当我尝试将两者结合时,会产生错误:
## example 1.5 (ERROR)
t3 <- t1 %<+% data1 + geom_tippoint(pch=16,aes(col=colour))
t3 ## Error: Discrete value supplied to continuous scale
我猜想在制作树时使用函数“ aes”时,它不能被绘图的子部分覆盖吗?我不明白我最好的镜头是以下代码:
## example 2 (WRONG ORDER OF COLOURS)
t4 <- ggtree(tree.2,.85)) +
geom_tippoint(pch=16,color=as.factor(colour.vector[1:9]))
t4
...实际上是this WRONG picture。分支末端的点是彩色的,但与原始数据集中的颜色不同。它们遵循数据集中的顺序,但未分配给正确的“种类”。根据逆时针“ spec1”中数据集的顺序对物种进行着色。我无法使ggtree真正遵循“物种”,就像上面第二幅图一样,使用相同的代码。
任何人都可以帮忙吗?
解决方法
所以我想我找到了解决方案。我只是丢弃了软件包 ggtree ,而是使用了 phytools 。更少的代码,更多的优雅。如果有人感兴趣,这里就是(我只是将原始数据集的“颜色”交换为“ breeding.range”和适当的值,顺序是相同的):
library(phytools)
tree.1<-read.tree(text="(spec1:2.2,((spec2:1.8,(spec9:1.4,(spec3:1.3,spec5:1.3):0.1):0.4):0.2,(spec8:1.7,(spec6:1.5,(spec7:1,spec4:1):0.5):0.2):0.3):0.2);")
data1<-data.frame(row.names = c("spec1","spec2","spec3","spec4","spec5","spec6","spec7","spec8","spec9"),"breeding.range" = c("tropical","tropical","temperate","temperate"),"fylo.signal" = c(0.1,1.0,0.3,0.6,0.2,0.8,0.7,0.6))
var.cont<-setNames(data1[,2],rownames(data1))
var.disc<-setNames(data1[,1],rownames(data1))
var.disc<-as.factor(var.disc)
matrix.disc<-to.matrix(var.disc,levels(var.disc))
matrix.disc<-matrix.disc[tree.1$tip.label,]
obj<-contMap(tree.1,var.cont,plot=FALSE)
plotTree(tree.1,type="fan",ftype="i",offset=2,fsize=0.9)
plot(obj$tree,colors=obj$cols,add=TRUE,ftype="off",lwd=3,xlim=get("last_plot.phylo",envir=.PlotPhyloEnv)$x.lim,ylim=get("last_plot.phylo",envir=.PlotPhyloEnv)$y.lim)
tiplabels(pie=matrix.disc,piecol=palette()[c(4,2)],cex=0.4)
,
(我以前给出的答案现在已经删除了,实际上不是您要求的。)
首先,快速修复以产生d.1
而没有NA:
d.1 <- rbind(
mutate(a,signal = as.numeric(signal)),c
)
...这样可以确保尖端标签的正确顺序。
cols <- sapply( # colour.vector,but with names of colours
colour.vector,function(val)
if (is.na(val)) NA
else if (val == 1) 'blue'
else 'red'
)
tiplabel_order <- as.numeric(gsub('spec','',tree.2@phylo$tip.label))
t4 <- ggtree(tree.2,aes(color = signal),layout = 'circular',ladderize = FALSE,continuous = TRUE,size = 2) +
ggplot2::scale_color_gradientn(colours=c('red','orange','green','cyan','blue')) +
geom_tiplab(hjust = -.1,offset=.1) +
theme(legend.position = c(.05,.85)) +
geom_tippoint(pch=16,size=4,color=as.factor(cols[tiplabel_order]))
t4
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。