如何解决如何从另一个列表中创建特定序列的新列表?
我想知道如何按照公共序列制作一个拉取的特定序列值(前三个)的列表,以放置到另一个列表中。如果有意义的话,这与实际应用程序相比更基于概念。这是我试图完成的一个例子,
seq = 'ATTACGA'
og_list = ['ATGGGCATAGA','GCCTGAACTT','GAATTACGAAGAGT','AAGTCCAAT','GCACATTACGATAG']
理想情况下,它会从存储在 seq
变量中的公共序列中提取剩余序列以获得:
['AGA','TAG']
这是因为这些值是 seq
公共序列值之后的三个。我想可以使用 find
(.find()
) 函数,但由于我是 Python 新手,如果有人能帮我解决这个问题,那就太好了。
这是我目前所拥有的:
seq = 'ATTACGA'
og_list = ['ATGGGCATAGA','GCACATTACGATAG']
new_list = []
if seq in og_list:
og_list.find(seq)
new_list.append(seq)
print(seq)
这显然不是削减它。我不确定如何从常见的 seq
中获取接下来的三个值 - 也许切片可能有效?
解决方法
如果字符串在字符串中,可以按序列分割字符串,然后对结果的第二部分进行切片
seq = 'ATTACGA'
og_list = ['ATGGGCATAGA','GCCTGAACTT','GAATTACGAAGAGT','AAGTCCAAT','GCACATTACGATAG']
new_list = [x.split(seq)[1][:3] for x in og_list if seq in x]
print(new_list) # ['AGA','TAG']
,
我不知道输入列表有多长,所以生成器似乎是正确的方法:
def follow_up(seq,samples,n):
l = len(seq)
for s in samples:
if (p := s.find(seq)) >= 0:
yield s[p+l:p+l+n]
seq = 'ATTACGA'
og_list = ['ATGGGCATAGA','GCACATTACGATAG']
# just collecting in a list here to print the result
print(list(follow_up(seq,og_list,3)))
结果:
['AGA','TAG']
,
以下几乎是将您想要的内容描述成代码(使用切片)的字面翻译:
target = 'ATTACGA'
og_list = ['ATGGGCATAGA','GCACATTACGATAG']
new_list = []
for seq in og_list:
pos = seq.find(target)
if pos > -1:
new_list.append(seq[pos+len(target): pos+len(target)+3])
print(new_list) # -> ['AGA','TAG']
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。