如何解决我如何从 SMILES 获取分子结构信息
我的问题是:有没有什么算法可以将 SMILES 结构转换成拓扑指纹?例如,如果输入甘油,则答案为 3 x -OH、2x -CH2 和 1x -CH。
我正在尝试构建一个 Python 脚本,该脚本可以使用人工神经网络预测混合物的密度。作为输入,我希望从 SMILES 结构开始获得我的分子的结构/指纹。
我已经熟悉 -rdkit 和摩根指纹,但这不是我想要的。我也知道我可以在 rdkit 中使用“匹配子结构”搜索,但是我必须定义所有不同的子组。有没有更方便/更短的方法?
很想听听您的想法。
干杯
解决方法
对于大多数结构,没有找到碎片的现有选项。但是,rdkit 中有一个模块可以为您提供片段的数量,尤其是当它是一个函数组时。看看here。例如,假设您要查找分子中脂肪族 -OH
基团的数量。你可以简单地调用以下函数来做到这一点
import rdkit
rdkit.Chem.Fragments.fr_Al_OH(mol)
或以下将返回芳香族 -OH
组的数量:
rdkit.Chem.Fragments.fr_Ar_OH(mol)
同样,还有 83 个可用的功能。其中一些对您的任务很有用。对于那些,您没有获得预先编写的功能,您可以随时访问这些 rdkit 模块的源代码,弄清楚它们是如何做到的,然后为您的功能实现它们。但正如您已经提到的,方法是定义一个 SMARTS 字符串,然后进行片段匹配。片段匹配模块可以在here找到。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。