如何解决更高的差距惩罚会增加 bwa 中的读取总数
我正在使用 BWA MEM 将双端 fastq 文件与两个参考序列(50bp 和 80bp)对齐:
参考1 TCGTAACGCAAGTTGGATACTCTCGA********************************GGATGTTGCCGTCCTCCTTGAAGT
参考文献2 TCGTAACGCAAGTTGGATACTCTCGATTGCAAGTAGTCGATTGCATTGTCAATCTAGGATGTTGCCGTCCTCCTTGAAGT
这两个序列除了中间位是相同的。然后我使用 samtools 根据标识符从每个序列中过滤出正确配对的读数,但令人惊讶的是,它显示绝大多数读数具有对应于 ref2 的匹配数量和 ref1 的 0 个正确配对读数
我通过对每个序列分别重复这个过程来验证这个结果并得到相同的输出:
$ samtools flagstat mysam.sam
1055596 + 0 in total (QC-passed reads + QC-Failed reads)
0 + 0 secondary
0 + 0 supplementary
0 + 0 duplicates
20960 + 0 mapped (1.99% : N/A)
1055596 + 0 paired in sequencing
527798 + 0 read1
527798 + 0 read2
0 + 0 properly paired (0.00% : N/A)
20934 + 0 with itself and mate mapped
26 + 0 singletons (0.00% : N/A)
0 + 0 with mate mapped to a different chr
0 + 0 with mate mapped to a different chr (mapQ>=5)
然后,我尝试为间隙打开和扩展惩罚设置高值,以限制 ref1 读取对齐导致 ref2 的起源的机会。通过这样做,我现在可以看到来自 ref1 的一些正确配对的读数。然而,我不明白的一件事是读取总数以及正确配对的读取增加了,而由于间隙惩罚,这些应该减少。
谁能给我解释一下:
非常感谢
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。