RDKit 2025.03.3版本发布:化学信息学工具库的重要更新
rdkit The official sources for the RDKit library 项目地址: https://gitcode.com/gh_mirrors/rd/rdkit
RDKit是一个开源的化学信息学工具库,广泛应用于药物发现、材料科学和化学信息处理领域。它提供了丰富的功能,包括分子结构处理、化学描述符计算、分子指纹生成、子结构搜索等。2025年03月发布的第三个维护版本(2025.03.3)带来了一系列功能增强和问题修复,进一步提升了库的稳定性和功能性。
核心功能增强
本次更新在分子处理、构象生成和子结构搜索等方面进行了多项改进:
-
SCSR解析支持:新增了SCSR(Simplified Chemical Structure Representation)格式的解析功能,这种格式在药物发现领域特别有用,能够简化复杂分子结构的表示和处理。
-
构象生成优化:ETKDG(Experimental-Torsion basic Knowledge Distance Geometry)算法是RDKit中用于生成分子构象的重要方法。本次更新将默认的Eigen3版本升级到3.4.0,并改进了双键和累积双键结构的处理,使构象生成更加准确。
-
子结构搜索灵活性提升:现在允许单双键在子结构搜索中匹配芳香键,这一改进使得搜索条件更加灵活,特别是在处理芳香系统时更为实用。
-
立体化学处理增强:新增了从原子中移除增强立体化学信息的方法,并改进了立体化学组的输出表示,使得立体化学信息的处理更加精细。
-
分子属性缓存控制:新增了清除ROMol和Atom对象属性缓存的接口,为内存管理提供了更多控制选项。
性能优化与工具改进
-
环查找优化:对环查找代码进行了优化,减少了不必要的调用,提高了分子处理的整体效率。
-
键序确定功能增强:为
determineBondOrders
方法添加了超时控制和Ctrl+C中断支持,防止在处理复杂分子时陷入长时间计算。 -
Synthon空间搜索改进:增加了命中过滤功能,并修复了手性原子计数问题,使这一专业功能更加可靠。
-
构建系统现代化:改进了CMake配置,使用更标准的包名称代替绝对路径,使构建过程更加规范。
问题修复与稳定性提升
-
JSON序列化修复:解决了MolToJSON无法处理阻转异构体的问题,确保了分子序列化的完整性。
-
PostgreSQL插件修正:修复了Postgres Cartridge中分子相等性比较错误使用坐标信息的问题。
-
内存问题修复:解决了多处内存读取和泄漏问题,包括在测试代码中发现的问题,提高了整体稳定性。
-
GCC 15兼容性:修复了导致在GCC 15下构建失败的问题,确保了对最新编译器的支持。
-
TautomerQuery功能修正:修复了在某些情况下原子查询信息丢失的问题。
文档与示例改进
-
SynthonSpaceSearch文档:新增了这一专业功能的详细文档,帮助用户更好地理解和使用。
-
molzip说明澄清:改进了当使用单个分子对象调用时的文档说明,避免了可能的误解。
-
绘图功能说明:增加了对DrawArrow和rawCoords参数的详细解释,帮助用户更好地控制分子可视化。
总结
RDKit 2025.03.3版本虽然在版本号上是一个维护更新,但包含了多项实质性改进。从核心分子处理功能的增强,到性能优化和专业工具(如Synthon空间搜索)的完善,再到各种稳定性问题的修复,这个版本进一步巩固了RDKit作为化学信息学领域重要工具的地位。特别是对立体化学处理、构象生成和子结构搜索的改进,将直接提升用户在药物设计和分子建模中的工作效率。
rdkit The official sources for the RDKit library 项目地址: https://gitcode.com/gh_mirrors/rd/rdkit
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考