ggtree:彩色树枝和尖端

如何解决ggtree:彩色树枝和尖端

尊敬的堆栈溢出社区,

我想问您有关我的问题的帮助。我正在使用ggtree软件包绘制系统发育树,我想在这些图中显示更多信息,如论文中通常所见。我对拥有彩色树枝(混合渐变)的树特别感兴趣,该树枝显示出连续特征中的某些变化,并且分支末端的一些点以颜色(或形状)指示了离散特征。虽然我可以分别做这两种事情,但我完全无法尝试将这两种事情都绘制在一个图中。你能帮忙吗?

在这里,我为您提供了可复制的示例。让我们使用具有9个物种和一些随机分支长度的随机树(tree.1),以及有关这些物种的数据randon表(data1):

###STACK EXAMPLE

source("https://bioconductor.org/biocLite.R")
biocLite("ggtree")
library(ggtree)

tree.1<-read.tree(text="(spec1:2.2,((spec2:1.8,(spec9:1.4,(spec3:1.3,spec5:1.3):0.1):0.4):0.2,(spec8:1.7,(spec6:1.5,(spec7:1,spec4:1):0.5):0.2):0.3):0.2);")

data1<-data.frame(row.names = c("spec1","spec2","spec3","spec4","spec5","spec6","spec7","spec8","spec9"),"tip" = c("spec1","colour" = c("red","red","blue","blue"),"fylo.signal" = c(0.1,1.0,0.3,0.6,0.2,0.8,0.7,0.6))

如果查看数据,则有color列是我的离散变量,而fylo.signal是随机连续变量。

要制作这些图,我遵循了两个示例(this one表示分支的渐变颜色and my old question表示分支末端的点的颜色)。

我可以从颜色渐变分支开始。在绘制数据之前,我有点黑匣子,但我想我至少了解一点。首先,我只提取连续变量(b)并为树计算(a)“节点”,然后为树中所有“非尖端”节点(即不仅是末端)计算连续变量。然后,我将数据合并在一起。

b <- as.matrix(data1)[,3]
a <- data.frame(node = nodeid(tree.1,names(b)),signal = b)
fit2 <- phytools::fastAnc(tree.1,b,vars=TRUE,CI=TRUE)
c <- data.frame(node = names(fit2$ace),signal = fit2$ace)
d.1 <- rbind(a,c)
d.1$node <- as.numeric(d.1$node)
d.1$signal <- as.numeric(d.1$signal)

之后,我还插入了离散变量(并使内部节点的“颜色”具有“ NA”):

colour.vector <- c(data1$colour,rep(NA,nrow(d.1)-nrow(data1)))
d.2 <- cbind(d.1,colour.vector)
d.2

...然后将这些数据插入系统发育树本身:

tree.2 <- dplyr::full_join(tree.1,d.2,by = 'node')

现在进行绘图。我可以使分支的渐变颜色代表我的连续变量。以下代码产生this plot

## example1 (SEPARATE TREES)

t1 <- ggtree(tree.2,aes(color=signal),layout = 'circular',ladderize = FALSE,continuous = TRUE,size=2) +
  ggplot2::scale_color_gradientn(colours=c('red','orange','green','cyan','blue')) +
  geom_tiplab(hjust = -.1,offset=.1) + 
  theme(legend.position = c(.05,.85))
t1

...和this image,当我尝试将离散变量绘制为分支末尾的不同颜色的点时(请注意,即使颜色是反转的,它实际上也会遵循我使用的数据集):

t2 <- ggtree(tree.2,layout = 'circular') + geom_tiplab(hjust = -.1,offset=.1) 
t2 <- t2 %<+% data1 + geom_tippoint(pch=16,size=4,aes(col=colour))
t2

但是当我尝试将两者结合时,会产生错误:

## example 1.5 (ERROR)

t3 <- t1 %<+% data1 + geom_tippoint(pch=16,aes(col=colour))
t3 ## Error: Discrete value supplied to continuous scale

我猜想在制作树时使用函数“ aes”时,它不能被绘图的子部分覆盖吗?我不明白我最好的镜头是以下代码:

## example 2 (WRONG ORDER OF COLOURS)
t4 <- ggtree(tree.2,.85)) +
  geom_tippoint(pch=16,color=as.factor(colour.vector[1:9]))
t4

...实际上是this WRONG picture。分支末端的点是彩色的,但与原始数据集中的颜色不同。它们遵循数据集中的顺序,但未分配给正确的“种类”。根据逆时针“ spec1”中数据集的顺序对物种进行着色。我无法使ggtree真正遵循“物种”,就像上面第二幅图一样,使用相同的代码。

任何人都可以帮忙吗?

解决方法

所以我想我找到了解决方案。我只是丢弃了软件包 ggtree ,而是使用了 phytools 。更少的代码,更多的优雅。如果有人感兴趣,这里就是(我只是将原始数据集的“颜色”交换为“ breeding.range”和适当的值,顺序是相同的):

library(phytools)

tree.1<-read.tree(text="(spec1:2.2,((spec2:1.8,(spec9:1.4,(spec3:1.3,spec5:1.3):0.1):0.4):0.2,(spec8:1.7,(spec6:1.5,(spec7:1,spec4:1):0.5):0.2):0.3):0.2);")

data1<-data.frame(row.names = c("spec1","spec2","spec3","spec4","spec5","spec6","spec7","spec8","spec9"),"breeding.range" = c("tropical","tropical","temperate","temperate"),"fylo.signal" = c(0.1,1.0,0.3,0.6,0.2,0.8,0.7,0.6))

var.cont<-setNames(data1[,2],rownames(data1))
var.disc<-setNames(data1[,1],rownames(data1))
var.disc<-as.factor(var.disc)
matrix.disc<-to.matrix(var.disc,levels(var.disc))
matrix.disc<-matrix.disc[tree.1$tip.label,]

obj<-contMap(tree.1,var.cont,plot=FALSE)

plotTree(tree.1,type="fan",ftype="i",offset=2,fsize=0.9)

plot(obj$tree,colors=obj$cols,add=TRUE,ftype="off",lwd=3,xlim=get("last_plot.phylo",envir=.PlotPhyloEnv)$x.lim,ylim=get("last_plot.phylo",envir=.PlotPhyloEnv)$y.lim)

tiplabels(pie=matrix.disc,piecol=palette()[c(4,2)],cex=0.4)
,

(我以前给出的答案现在已经删除了,实际上不是您要求的。)

首先,快速修复以产生d.1而没有NA:

d.1 <- rbind(
    mutate(a,signal = as.numeric(signal)),c
)

...这样可以确保尖端标签的正确顺序。

cols <- sapply( # colour.vector,but with names of colours
    colour.vector,function(val)
        if (is.na(val))    NA
        else if (val == 1) 'blue'
        else               'red'
)
tiplabel_order <- as.numeric(gsub('spec','',tree.2@phylo$tip.label))

t4 <- ggtree(tree.2,aes(color = signal),layout = 'circular',ladderize = FALSE,continuous = TRUE,size = 2) +
  ggplot2::scale_color_gradientn(colours=c('red','orange','green','cyan','blue')) +
  geom_tiplab(hjust = -.1,offset=.1) + 
  theme(legend.position = c(.05,.85)) +
  geom_tippoint(pch=16,size=4,color=as.factor(cols[tiplabel_order]))
t4

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)&gt; insert overwrite table dwd_trade_cart_add_inc &gt; select data.id, &gt; data.user_id, &gt; data.course_id, &gt; date_format(
错误1 hive (edu)&gt; insert into huanhuan values(1,&#39;haoge&#39;); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive&gt; show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 &lt;configuration&gt; &lt;property&gt; &lt;name&gt;yarn.nodemanager.res