微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在excel文件中将三个字母的氨基酸转换为单个字母

如何解决如何在excel文件中将三个字母的氨基酸转换为单个字母

我想将excel中一列三个字母的氨基酸转换为一个字母,并将一个字母的氨基酸打印到excel文件中的每个对应行。我知道我可以为此使用 biopython。

我尝试过的:

import Bio
from Bio.SeqUtils import seq1
seq1("MetalaIleValMetGlyArgTrpLysGlyAlaArgTer")
'MAIVMGRWKGAR*'

但我希望人们理解我不能为 python 放置字符串进行转换。我需要在 excel 中读取一整列并用转换后的 1 个字母序列打印一个新列。图片供参考:

示例: enter image description here

解决方法

也许你可以试试下面的脚本。您需要为所有可能的三个字母组合扩展它。希望这对您有用。

# open file 
import pandas as pd
df = pd.read_excel (r'file')
df.columns=['three letter code']

codes = []
for i in df['code']:
  if i == 'uuu':
    codes.append('U')
  if i == 'cuu':
    codes.append('C')    
  if i == 'uaa':
    codes.append('A')
print (codes)
df['new_code']= codes
df

输出为:

        code    new_code
0       uuu     U
1       cuu     C
2       uaa     A

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。