如何解决如何从我的蛋白质列表中排除FASTA格式的长蛋白质序列
我有一个文件,其中包含来自FASTA格式的不同病毒株的许多蛋白质序列。我想排除与其他序列相比过长的序列。 我可以使用Seqkit grep排除它们吗?蛋白质的平均长度为565个氨基酸。 我在Seqkit的手册页上进行了搜索,但找不到解决方案。 有没有其他解决此问题的方法?
希望我能清楚地描述问题。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。