微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在解复用、移除适配器、修剪和过滤之后,有多少 GBS 衍生读取通过过滤器?

如何解决在解复用、移除适配器、修剪和过滤之后,有多少 GBS 衍生读取通过过滤器?

我正在处理来自 GBS 的原始读取。我的最终目标是使用 Stacks 管道(denovo 版本)获取 SNP 数据集。

解复用后,我得到每个样本大约 200 万个单端读取。

但是,在移除 Illumina 适配器、过滤读数并将它们全部修剪为相同长度后(因为 denovo 管道要求读数具有相同长度),我每个样本只能平均获得 50,000 个读数。

这对于 GBS 派生数据是否正常?调用 SNP 并运行管道就足够了吗?我认为我的大部分读数都比这短,这就是它们被过滤掉的原因,但是如果我将最小长度设置为

有人对此有任何建议或想法吗?

非常感谢

朱莉娅

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。