微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何分析breakdancer检测结构变异

这篇文章将为大家详细讲解有关如何分析breakdancer检测结构变异,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

breakdancer 是一款结构变异检测软件, 专门针对双端测序数据进行开发,github地址如下

https://github.com/genome/breakdancer

分析原理图如下

如何分析breakdancer检测结构变异

从原理图可以看出,breakdancer 会根据双端reads的比对情况,检测以下5种类型的结构变异

  1. insertions

  2. deletions

  3. inversions

  4. inter-chromosomal translocations

  5. intra-chromosomal translocations

软件的安装过程如下

git clone --recursive https://github.com/genome/breakdancer.git
cd breakdancer
mkdir build
cd build
cmake .. -DCMAKE_BUILD_TYPE=release -DCMAKE_INSTALL_PREFIX=/usr/local
make

最终会生成一个可执行的二进制文件breakdancer-max。软件的使用也比较简单,共两个步骤。

1. 生成配置文件

输入文件为比对基因组产生的bam文件, 用法如下

bam2cfg.pl tumor.bam normal.bam > config.txt

配置文件中,每个样本对应一行记录,包含以下特征值

readgroup:tumor
platform:illumina
map:tumor.bam
readlen:144.84
lib:YL
num:10000
lower:0.00
upper:519.05
mean:210.24
std:65.87
SWnormality:-40.54
exe:samtools view
2. 鉴定结构变异

用法如下

breakdancer_max -t -q 10 -d sv.reads config.txt > sv.out

结构变异的检测计算量较大,所以需要的时间也很久。输出文件的列数很多,共有14列。

每一列的含义如下

  1. Chromosome 1

  2. Position 1

  3. Orientation 1

  4. Chromosome 2

  5. Position 2

  6. Orientation 2

  7. Type of a SV

  8. Size of a SV

  9. Confidence score

  10. Total number of supporting read pairs

  11. Total number of supporting read pairs from each map file

  12. Estimated allele frequency

  13. Software version

  14. The run parameters

1到6列描述的是断裂点的位置信息;第7列描述结构变异的类型,DEL代表缺失,INS代表插入,INV代表倒位,ITX代表同一染色体上的易位,CTX代表不同染色体之间的易位;第8列代表结构变异的长度,对于染色体间的易位,这个数值没有含义;第9列代表该结构变异可信度的打分值,数值越大,可靠性越高。

关于如何分析breakdancer检测结构变异就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐