基于模板生成的单步与多步逆向合成技术

最新推荐文章于 2025-12-11 12:02:01 发布

原创最新推荐文章于 2025-12-11 12:02:01 发布 · 977 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #化学信息学 #逆向合成 #程序那些事 #AIGC #深度学习 #人工智能

摘要

逆向合成规划因化学反应空间的复杂性和庞大性仍是分子发现的核心挑战。传统基于模板的方法虽易处理，但扩展性差且泛化能力有限；而无模板生成方法可能产生无效反应。本研究提出TempRe生成框架，将模板方法重构为序列生成任务，实现可扩展、灵活且化学合理的逆向合成。实验表明，TempRe在单步和多步逆向合成任务中均优于模板分类和SMILES生成方法。在PaRoutes多步基准测试中，TempRe展现出优异的top-k路径准确率。此外，该框架可直接生成多步合成路线，为传统单步搜索方法提供轻量高效的替代方案。

核心贡献

序列化模板生成：将反应模板转化为可生成的序列格式，结合化学规则约束确保有效性。
多步路线优化：通过端到端模型直接预测多步合成路径，减少传统搜索的计算开销。
基准测试验证：在USPTO和PaRoutes数据集上，Top-1准确率分别提升12%和8%以上。

方法架构

TempRe采用Transformer编码器-解码器结构：

输入处理：目标分子通过图神经网络编码为特征向量。
模板生成：解码器逐token输出反应模板序列，动态应用化学价校验等约束。
路线扩展：多步任务中，通过迭代生成中间产物模板链实现路径规划。

实验结果

任务类型	数据集	TempRe Top-1准确率	基线方法（SMILES）
单步逆向合成	USPTO-50	62.3%	50.1%
多步路线生成	PaRoutes	58.7% (Top-5)	49.2%

应用前景

该技术可集成至计算机辅助合成规划系统，显著提升药物分子设计的效率与可行性。代码已开源。
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
公众号二维码
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。