如何解决通过访问Uniprot使用Python获取蛋白质序列
我有一个蛋白质ID列表,我正在尝试使用python从Uniprot访问蛋白质序列。 我碰到了这篇文章:Protein sequence from uniprot protein id python,但给出了元素列表,而不是实际顺序:
代码
import requests as r
from Bio import SeqIO
from io import StringIO
cID='P04637'
baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)
Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))
给出输出:
输出
[SeqRecord(seq=Seq('MQAALIGLNFPLQRRFLSGVLTTTSSAKRCYSGDTGKPYDCTSAEHKKELEECY...SSS',SingleLetterAlphabet()),id='sp|O45228|PROD_CAEEL',name='sp|O45228|PROD_CAEEL',description='sp|O45228|PROD_CAEEL Proline dehydrogenase 1,mitochondrial OS=Caenorhabditis elegans OX=6239 GN=prdh-1 PE=2 SV=2',dbxrefs=[])]
我只是好奇如何真正获得序列本身。
解决方法
[record.seq for record in pSeq]
编辑:
您需要str(pSeq[0].seq)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。