这篇文章将为大家详细讲解有关如何分析breakdancer检测结构变异,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
breakdancer 是一款结构变异检测软件, 专门针对双端测序数据进行开发,github地址如下
https://github.com/genome/breakdancer
分析原理图如下
从原理图可以看出,breakdancer 会根据双端reads的比对情况,检测以下5种类型的结构变异
insertions
deletions
inversions
inter-chromosomal translocations
-
intra-chromosomal translocations
软件的安装过程如下
git clone --recursive https://github.com/genome/breakdancer.git cd breakdancer mkdir build cd build cmake .. -DCMAKE_BUILD_TYPE=release -DCMAKE_INSTALL_PREFIX=/usr/local make
最终会生成一个可执行的二进制文件,breakdancer-max
。软件的使用也比较简单,共两个步骤。
1. 生成配置文件
bam2cfg.pl tumor.bam normal.bam > config.txt
配置文件中,每个样本对应一行记录,包含以下特征值
readgroup:tumor platform:illumina map:tumor.bam readlen:144.84 lib:YL num:10000 lower:0.00 upper:519.05 mean:210.24 std:65.87 SWnormality:-40.54 exe:samtools view
2. 鉴定结构变异
用法如下
breakdancer_max -t -q 10 -d sv.reads config.txt > sv.out
结构变异的检测计算量较大,所以需要的时间也很久。输出文件的列数很多,共有14列。
每一列的含义如下
Chromosome 1
Position 1
Orientation 1
Chromosome 2
Position 2
Orientation 2
Type of a SV
Size of a SV
Confidence score
Total number of supporting read pairs
Total number of supporting read pairs from each map file
Estimated allele frequency
Software version
-
The run parameters
1到6列描述的是断裂点的位置信息;第7列描述结构变异的类型,DEL
代表缺失,INS
代表插入,INV
代表倒位,ITX
代表同一染色体上的易位,CTX
代表不同染色体之间的易位;第8列代表结构变异的长度,对于染色体间的易位,这个数值没有含义;第9列代表该结构变异可信度的打分值,数值越大,可靠性越高。
关于如何分析breakdancer检测结构变异就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。