微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

我如何从 SMILES 获取分子结构信息

如何解决我如何从 SMILES 获取分子结构信息

我的问题是:有没有什么算法可以将 SMILES 结构转换成拓扑指纹?例如,如果输入甘油,则答案为 3 x -OH、2x -CH2 和 1x -CH。

我正在尝试构建一个 Python 脚本,该脚本可以使用人工神经网络预测混合物的密度。作为输入,我希望从 SMILES 结构开始获得我的分子的结构/指纹。

我已经熟悉 -rdkit 和摩根指纹,但这不是我想要的。我也知道我可以在 rdkit 中使用“匹配子结构”搜索,但是我必须定义所有不同的子组。有没有更方便/更短的方法

很想听听您的想法。

干杯

解决方法

对于大多数结构,没有找到碎片的现有选项。但是,rdkit 中有一个模块可以为您提供片段的数量,尤其是当它是一个函数组时。看看here。例如,假设您要查找分子中脂肪族 -OH 基团的数量。你可以简单地调用以下函数来做到这一点

import rdkit
rdkit.Chem.Fragments.fr_Al_OH(mol)

或以下将返回芳香族 -OH 组的数量:

rdkit.Chem.Fragments.fr_Ar_OH(mol)

同样,还有 83 个可用的功能。其中一些对您的任务很有用。对于那些,您没有获得预先编写的功能,您可以随时访问这些 rdkit 模块的源代码,弄清楚它们是如何做到的,然后为您的功能实现它们。但正如您已经提到的,方法是定义一个 SMARTS 字符串,然后进行片段匹配。片段匹配模块可以在here找到。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。