2.3 分子输入输出格式解析(如 SMILES、Mol、SDF)
在化学信息学中,分子的表示方式有很多种,常见的包括 SMILES、Mol 文件、SDF 文件等。RDKit 支持对这些格式的分子数据进行解析和处理,这使得它在化学和药物设计领域得到了广泛应用。本节将介绍如何在 RDKit 中解析和操作这些分子输入输出格式,帮助你了解并掌握分子数据的处理方法。
2.3.1 SMILES 格式
SMILES(Simplified Molecular Input Line Entry System)是一种简洁且广泛使用的分子表示方法。SMILES 用字符串来描述分子的结构,能够简单、直观地表示分子信息。
2.3.1.1 从 SMILES 解析分子
在 RDKit 中,解析 SMILES 格式非常简单,只需调用 Chem.MolFromSmiles
函数即可。
示例:从 SMILES 解析分子
from rdkit