一. 代码
1. Run main code
# Generate synthetic trees
python scripts/03-generate-syntrees.py \
--building-blocks-file “data/pre-process/building-blocks-rxns/bblocks-enamine-us.csv.gz” \
--rxn-templates-file “data/assets/reaction-templates/hb.txt” \
--output-file “data/pre-process/syntrees/synthetic-trees.json.gz” \
--number-syntrees “600000”
二. 摘要
分子设计和合成规划是分子发现过程中的两个关键步骤,我们建议将其作为条件合成途径生成的单一共同任务来制定。我们报告了一种生成合成途径的摊销方法,作为以目标分子嵌入为条件的马尔可夫决策过程。这种方法使我们能够以自下而上的方式进行合成规划,并通过从优化的条件代码解码来设计可合成的分子,这表明同时解决设计和合成问题的潜力。该方法利用神经网络,根据反应模板的离散动作空间中编码的反应性规则,一次一个反应步骤,概率地模拟合成树。我们在可购买的化合物池和专家策划的模板列表中生成的数十万条人工路径上训练这些网络。我们通过以下方式验证我们的方法:(a)使用条件生成回收分子,(b)识别可合成的结构类似物,以及(c)根据与药物发现相关的甲骨文功能优化分子结构
三. 引言
设计新的功能材料,如储能材料(Hachmann等人,2011年;Janet等人,2020年)、治疗分子(Zhavoronkov等人,2019年;Lyu等人,2019年)和环保材料(Zimmerman等人,2020年;Yao等人,2021年),是应对许多社会和技术挑战的关键,也是化学科学和工程的核心任务。然而,传统的分子设计过程不仅昂贵且耗时,而且严重依赖偶然和暴力的试验和错误(Sanchez-Lengeling和Aspuru-Guzik,2018年)。因此,可以利用数据并最大限度地减少昂贵实验数量的系统分子设计方法是该领域非常感兴趣的,也是自主分子发现的先决条件(Coley等人,2020a;b)。
计算机辅助分子发现的核心是分子设计。该任务的目标是通过新生成识别具有理想特性的新型分子,或通过虚拟筛选识别已知分子。近年来,人们对应用机器学习方法来完成这项任务的兴趣与日俱增(Gómez-Bombarelli等人,2018年;Jin等人,2018年;You等人,2018年;Bradshaw等人,2019年;2020年;Jin等人,2020年;Fu等人,2021年),这是许多评论的主题(Elton等人,2019年;Schwalbe-Koda和Gómez-Bombarelli,2020年;Vanhaelen等人,2020年)。尽管开发了大量模型,但很少有例子进行实验验证或用于现实发现场景(Zhavoronkov等人,2019年;Schneider & Clark,2019年)。这些算法部署的一个主要障碍是,它们缺乏可合成性的考虑(Gao & Coley,2020年;Huang等人,2021年);Gao & Coley(2020年)已经证明,当应用于目标导向的优化任务时,de novo分子设计算法可以提出高比例的分子,而这些分子在算法上找不到合成计划
规划和执行假设分子结构的实用合成路线是阻碍分子设计算法实验验证的瓶颈。计算机辅助合成规划(CASP)的目标是确定一系列化学上合理的反应步骤,从可用的起始材料开始合成目标化合物。机器学习方法已被应用于提高CASP模型性能(Segler等人,2018年;Coley等人,2018年;2019年b;Schwaller等人,2020年;Genheden等人,2020年),实验执行验证了近年来的重大进展(Klucznik等人,2018年;Coley等人,2019年c)。然而,由于树搜索的组合复杂性,大多数当前的算法需要数十秒或几分钟来规划一个目标化合物的合成路线。这一成本使临时过滤策略在将新设计和合成规划脱钩的分子设计工作流程中变得不切实际(Gao & Coley,2020年)。然而,可合成性受限的发电已成为这个两步管道的有希望的替代品(第2.1节)
本文报告了一种生成以目标分子嵌入为条件的树的合成路径的策略,作为同时解决设计和合成问题的一种手段。拟议的路径保证使用可购买的起始材料,并要求遵循由专家策划的反应模板编纂的“化学规则”,该模板或多或少可以根据应用变得保守。当应用于合成规划时,我们要求该模型生成以目标分子为条件的合成树。当应用于可合成分子设计时,我们使用数值优化算法优化了固定长度的嵌入向量;然后,我们解码优化的嵌入,以获得以根分子为输出的相应合成树。这个想法以Bradshaw等人(2019年)和Bradshaw等人(2020年)的工作为基础;然而,这些方法未能恢复任何目标分子的多步合成路径,因此仅适用于可合成模拟推荐的任务。相比之下,这里介绍的方法除了用于合成模拟推荐外,还可以以摊销方式成功恢复多步逆合成途径。
本文的主要贡献可以总结为:
-
我们制定了马尔可夫决策过程来模拟合成树的生成,允许生成多步和收敛(即非线性)合成路径。
-
我们提出了一种能够(1)快速自下而上的合成规划和(2)受限分子优化,可以探索由离散定义的化学空间反应模板和可购买起始材料的动作空间。
-
我们展示了首次成功尝试摊销复杂的多步骤综合规划有机分子,在测试分子上实现相对较高的重建精度。
-
我们在多重的denovo分子优化方面展示了令人鼓舞的结果与生物活性分子设计和药物发现相关的客观功能
四. 相关工作
1. 合成可合成分子设计
虽然大多数分子生成模型都专注于产生具有所需特性的有效分子,但人们对生成可合成分子越来越感兴趣,因为并非所有化学上有效的分子都可以合成。MoleculeChef(Bradshaw等人,2019年)是最早将分子生成问题转换为一步合成途径生成的神经模型之一,从而通过选择一袋可购买的反应物并使用数据驱动的反应预测器枚举可能的产物分子来确保合成性。ChemBO(Korovina等人,2020年)将约束生成扩展到多步情况,但是一种随机算法,使用随机选择的反应物作为另一个数据驱动反应预测器的输入,迭代生成合成路径。虽然MoleculeChef和ChemBO使用神经模型预测反应结果作为化学反应性的基础真理(Coley等人,2019年b;Schwaller等人,2019年),但反应模板提供了通过算法(Coley等人,2019a)或手工编码领域专业知识(Molga等人,2019年)定义允许的化学步骤的替代手段。PGFS(Gottipati等人,2020年)和REACTOR(Horwood和Noutahi,2020年)都使用离散反应模板,并将多步合成途径的生成作为马尔可夫决策过程,并通过强化学习优化分子。两者都仅限于线性合成途径,其中中间体只能与可购买的化合物反应,两个中间体之间不会发生反应。他们无法设计收敛合成,限制了模型可以访问的化学空间。值得注意的是,之前还存在以前报告的非神经合成性受限分子设计方法,如SYNOPSIS(Vinkers等人,2003年)和DOGS(Hartenfeller等人,2012年),它们早于深层分子生成。
最近,Bradshaw等人(2020年)引入了DoG-AE/DoG-Gen模型,该模型将合成途径视为定向无环图(DAG)。DoG-Gen序列化了DAG的构建,并使用循环神经网络进行自回归生成。Dai Nguyen和Tsuda(2021)还使用自动编码器(AE)框架,与结节树变分自动编码器(JT-VAE)联合训练(Jin等人,2018年)。然而,之前合成分子生成的方法都没有成功实现高重建精度。
2. 综合规划
自20世纪60年代复古合成首次正式化以来,合成规划的算法和模型一直在开发中(Corey & Wipke,1969年)。近年来引入了各种数据驱动的方法(Segler等人,2018年;Coley等人,2018年;2019年b年;Schwaller等人,2020年;Genheden等人,2020年),尽管具有人类编码的“化学规则”的专家方法可以说在实践中取得了更大的成功(Klucznik等人,2018年;Mikulak-Klucznik等人,2020年)。这些方法的主要区别是如何定义允许的单步化学变换,以尽可能接近物理现实;它们都可以使用类似的树搜索算法。虽然这些工具可用于规划从没有找到途径的de novo发电中瞄准分子和过滤化合物的路线,但它们都不能直接用于分子生成。此外,它们都采用逆合成规划,递归地从目标分子转向可购买的起始材料(即自上而下的方式),而我们提出了一种自下而上的方法,这种方法可以通过减轻树搜索的需求来提高计算效率。
3. 将可合成设计与合成规划相结合
我们的方法可用于合成可合成的分子设计和合成规划。虽然我们的方法与Bradshaw等人(2020)的RetroDoG模型最相似,但他们的模型仅适用于结构模拟生成,无法证明目标分子的成功恢复。Bradshaw等人(2019)展示了一些成功恢复的例子,但他们的配方将搜索限制在单步合成途径上,这严重限制了其对这两项任务的实际效用。相比之下,我们的模型可以成功处理多步骤反应。
五. 模型框架

**图1:**迭代生成过程的说明。我们的模型以自下而上的方式构建合成树,从可用的构建块开始,逐步构建更复杂的分子。生成以目标分子的嵌入为条件。如果目标分子在我们的模板集和构建块可到达的化学空间中,最终的根分子应该匹配或至少类似于输入的目标分子。
1. 问题定义
我们将合成路径建模为称为合成树的树结构(附录A中的图6A)。根据离散反应模板列表,有效的合成树有一个根节点(最终产物分子)通过可行反应与可购买的构建块相连。反应模板是定义分子结构转换的模式,旨在表示有效的化学反应,通常编码为SMARTS字符串(图6B&C)。我们使用反应模板列表来定义可行的化学反应,而不是数据驱动的反应预测器,以便在不改变其架构的情况下完善或扩展该模型的实际效用。给定反应模板列表R和可购买化合物列表C,我们的目标是生成一棵有效的合成树T,该树产生具有所需结构或功能的根分子。树中的产物分子和中间分子本身不是由模型生成的,而是通过将反应模板应用于反应分子隐式定义的。与分子图的生成相比,由于执行化学反应规则的额外限制和起始材料的商业可用性,合成树的生成更加困难
综合规划 这项任务是推断到给定目标分子的合成途径。我们将这个问题表述为生成合成树T,使其产生的产品分子(根节点的分子)Mproduct与所需的目标分子Mtarget匹配。
合成分子设计 这个任务是优化相对于甲骨文函数的分子结构,同时确保分子的合成可及性。我们将这个问题描述为优化合成树T的结构,相对于它产生的产物分子Mproduct的期望特性。
2. 作为马尔科夫决策过程的合成树生成
我们提出了一种摊销方法来处理合成树的概率建模。在这种方法中,我们将合成树的构造建模为马尔科夫决策过程(MDP),这要求状态转换满足马尔科夫性质: p(S(t+1)jS(t); : : : ; S(0))=p(S(t+1)jS(t))。合成树自然地满足了这一性质:在获得特定化合物(合成路线中的中间体)时,后续反应步骤可以完全从中间体化合物推断出来,并且不依赖于以目标分子为条件时用于获得所述化合物的途径。下面,我们首先介绍一个用于合成树生成的MDP框架,然后介绍解决它的模型,在我们的框架中,我们只允许单分子和双分子反应
在高层次上,我们以自下而上的方式一次一个反应步骤构建一棵合成树。图1说明了用于综合规划目的的生成过程。我们强制要求生成过程以反向深度优先顺序进行,并且同时生成不超过两个断开的子树。
状态空间 我们将状态S(t)定义为中间合成树的根分子,T(t)在步骤t。因为我们强制要求最多可以同时发生两个子树,所以最多可以有两个根分子。所有根节点都是以反向深度优先的方式生成的;此外,我们强制合成树始终从最近添加的节点(Mmost_recent)展开,并且任何合并总是发生在两个根节点之间。因此,合成树的状态嵌入是通过连接两个根分子的嵌入来计算的。
动作空间 我们将每次迭代时采取的行动分解为四个部分:(1)动作类型,行为,从可能的操作“添加”、“扩展”、“合并”和“结束”中取样;(2)第一个反应物,art1,从C或Mmost_recent取样;(3)反应模板arxn,从R中取样;以及(4)第二个反应物,art2,从C中取样
(A)如果aact =“添加”,将向T(t)添加一两个新的反应节点,并在给定特定反应模板时添加与其产品相对应的新节点。这始终是构建合成树时使用的第一个动作,并导致额外的子树。
(B)如果aact =“膨胀”,则使用最近的分子Mmost_recent作为第一个反应物,如果arxn是双分子反应模板,则选择第二个反应物。如果arxn是单分子反应模板,则仅向T(t)添加一个新的产品节点。如果arxn是双分子反应模板,则添加一个新的产品节点和一个新的反应节点
(C)如果aact =“合并”,则使用两个根节点作为双分子反应的反应物。在这种情况下,在T(t)中添加一个新的产品节点,并将两个子树连接成一个子树。
(D)如果act =“结束”,T = T(t)和合成树是完整的。最后一个产品节点是Mproduct。
状态过渡动力学 每个反应代表一个过渡步骤。为了确保每个反应步骤在化学上都是合理的,并且具有很高的实验成功可能性,我们在R中纳入了编码为反应模板的特定领域反应规则。一旦选择了有效的操作,过渡是确定性的;不遵循已知模板的不可行操作将被拒绝。重要的是,模板应用程序生成的结构被明确纳入新状态,而Bradshaw等人(2020年)中的RNN模型必须隐式了解环境的动力学(即反应预测器的结果)
奖励 对于合成规划来说,奖励是产品与目标分子的相似性,1.0的相似性是最高的奖励,并表明完美匹配。对于分子设计,奖励取决于产品性能与所需标准的匹配程度。
3. 合成规划的条件生成
我们将合成规划建模为条件合成树生成问题。为了解决这个问题,我们训练了一个模型来预测作用,a(t),基于状态嵌入,zstate(t),在步骤t,以M目标为条件。具体来说,在每个步骤中,我们的模型f,估计 a(t) = (a( act t); a( rt1 t); a( rxn t); a( rt2 t)) ∼ p(a(t)jS(t); Mtarget)
如图2所示,我们的模型由四个模块组成:(1)动作类型选择函数,事实,将动作类型归类为四个可能的动作(“添加”、“扩展”、“合并”和“结束”);(2)第一反应物选择函数frt1,预测第一个反应物的嵌入。通过从潜在构建块C(Cover & Hart,1967)中进行k-最近邻居(k-NN)搜索,确定第一个反应物的候选分子。我们使用预测的嵌入作为查询,在构建块中选择最近的邻居;(3)反应选择函数frxn,其输出是可用反应模板上的概率分布,从中掩盖不适用的反应(基于反应物1),然后使用贪婪的搜索对合适的模板进行采样;(4)第二反应物选择函数frt2,如果采样模板是双分子,则识别第二个反应物。该模型预测了第二个反应物的嵌入,然后通过从掩蔽构建块C0的k-NN搜索对候选物进行采样。
形式上,这四个模块预测一个反应步骤中动作的概率分布:
aact (t)∼fact (S(t),Mtarget )=σ(MLPact (zstate (t)⊖ztarget ))arl1(t)∼frt1(S(t),Mtarget )=k−NNCC(MLPrtl(zstate (t)⊕zlarget ))ar2(t)∼fr22(S(t),art1(t),arxn(t),Mlarget )=k−NNC′(MLPr22(zstate (t)◯zlarget (1)zrt1(t)()zrxn(t)))\begin{array}{l} a_{\text {act }}^{(t)} \sim f_{\text {act }}\left(S^{(t)}, M_{\text {target }}\right)=\sigma\left(\mathrm{MLP}_{\text {act }}\left(z_{\text {state }}^{(t)} \ominus z_{\text {target }}\right)\right) \\ a_{\mathrm{rl1}}^{(t)} \sim f_{\mathrm{rt1}}\left(S^{(t)}, M_{\text {target }}\right)=\mathrm{k}-\mathbf{N N} \mathrm{C}_{\mathcal{C}}\left(\operatorname{MLP}_{\mathrm{rtl}}\left(z_{\text {state }}^{(t)} \oplus z_{\text {larget }}\right)\right) \\ a_{\mathrm{r} 2}^{(t)} \sim f_{\mathrm{r} 22}\left(S^{(t)}, a_{\mathrm{rt} 1}^{(t)}, a_{\mathrm{rxn}}^{(t)}, M_{\text {larget }}\right)=\mathrm{k}-\mathrm{NN}_{\mathcal{C}^{\prime}}\left(\mathrm{MLP}_{\mathrm{r} 22}\left(z_{\text {state }}^{(t)} \bigcirc z_{\text {larget }}(1) z_{\mathrm{rt1}}^{(t)}() z_{\mathrm{rxn}}^{(t)}\right)\right) \\ \end{array}aact (t)∼fact (S(t),Mtarget )=σ(MLPact (zstate (t)⊖ztarget ))arl1(t)∼frt1(S(t),Mtarget )=k−NNCC(MLPrtl(zstate (t)⊕zlarget ))ar2(t)∼fr22(S(t),art1(t),arxn(t),Mlarget )=k−NNC′(MLPr22(zstate (t)◯zlarget (1)zrt1(t)()zrxn(t))) (1)
其中⊕表示串联,MLP表示多层感知器(MLP),z表示相应实体的嵌入,C0表示C的子集,该子集掩盖与所选模板a(rxn t)不匹配的反应物,k-NNX是集合X中的k-NN。k-NN搜索基于查询向量和X中所有分子的嵌入之间的余弦相似性。而所有分子嵌入(ztarget、zrt1和zrt2)都是分子指纹(见第4.1节中的表示),zrxn(t)是a(rxn t)的单热编码,zstate(t)是T(t)中根分子的分子指纹。σ是每个步骤中已知无效操作的softmax掩码,例如不适用的动作类型(基于中间树T(t)的拓扑)和反应模板(基于子图匹配的要求)。每个MLP都使用已知合成路线的信息子集作为单独的监督学习问题进行训练。有关模型和算法的更多详细信息,请参阅附录D&E。
4. 用于分子优化的遗传学算法
我们通过优化基于Mproduct中所需特性的分子嵌入ztarget来解决可合成分子设计的问题。我们采用遗传算法(GA)对ztarget进行数值优化。这种方法在程序上比强化学习更简单,以解决MDP,并通过我们的条件生成模型对高性能分子产生偏见生成。交配池被定义为分子嵌入载体的列表,适应函数是生产产品分子的理想特性。在每一代人中,一个后代池是由作为父母从交配池中随机采样的两个载体的交叉构造的。交叉被定义为从一个父级继承大约一半的位,从另一个父级继承剩余的位。突变可能发生在每个后代载体上,概率很小,我们将它们解码为合成树,以评估适应功能。选择性能最高的向量来形成下一代的交配池,我们重复这个过程,直到满足停止标准。有关插图,请参阅图7

**图2:**我们的模型概述。在每个步骤中,最多两个根分子(最近的和另一个)和作为条件代码的目标分子充分描述了状态。网络对状态进行嵌入,并先后预测作用类型、第一反应物、反应模板和第二反应物。这些结果用于更新合成树进行一个反应步骤。
六. 实验
1. 实验设置
反应模板 我们使用一组基于Hartenfeller等人(2011年)和Button等人的两个公开模板集的反应模板。(2019)。我们结合这两组,去除重复和罕见的反应,并获得最后一套91个反应模板。这组包含13种单分子反应和78种双分子反应。63种主要用于骨骼形成,23种用于外围修饰,其余5种可用于两者。在骨骼形成反应中,我们包括45个环形形成反应,包括37个杂环形成和8个碳循环形成
可购买积木 这套可购买的化合物包括来自Enamine积木(美国库存;2021年5月12日访问)的147,505个分子,这些分子与我们套装中的至少一个反应模板相匹配。
数据集准备 为了准备遵守这些约束的合成路径数据集,我们对第3.2节中描述的MDP应用了随机策略。通过产品分子的QED过滤后,我们获得了208,644棵合成树进行训练,在随机分裂后获得69,548棵树进行验证和测试。有关更多详细信息,请参阅附录E
表示 我们使用长度为4096和半径2的摩根圆形分子指纹表示分子作为MLP的输入,以及长度为256和半径为2的摩根指纹作为k-NN模块的输入。其他分子表示的其他实验显示经验结果更差;进一步分析见附录一
遗传算法 GA对4096位半径为2的摩根指纹进行操作。要继承的位数取自N(2048;410)。突变被定义为在指纹中翻转24位,概率为0.5。种群规模为128,后代规模为512。当(a)模型达到200代,或(b)10代人口平均值的增长小于0.01,表明一定程度的收敛时,则满足停止标准。
优化Oracle 为了验证我们的模型,我们选择了几个与生物活性和药物发现相关的常见甲骨文功能,包括对接甲骨文。启发式甲骨文功能包括:药物相似性的定量估计(QED);辛醇-水分配系数(LogP);以及JNK3、GSK3β和DRD2代理模型,分别估计对c-Jun N端激酶-3、糖原合成酶激酶3β和多巴胺受体2的反应。对于对接模拟,我们使用AutoDock Vina(Trott & Olson,2010年)与人类多巴胺受体D3(DRD3,PDB ID:3PBL)和SARS-Cov-2病毒的主要蛋白酶Mpro对接(PDB ID:7L11)。我们通过治疗数据共享(TDC)接口访问所有甲骨文功能(Huang等人,2021年)。

**图3:**ChEMBL的示例,用作条件生成的目标分子。(A)一个成功回收的分子,其中与任何训练示例的低相似性表明该模型的可推广性。(B)未作为可合成模拟建议示例回收的分子(即类似产品)。(C)一种尚未回收但可能激发通往真正目标的路线发展的分子。突出显示匹配的子结构。
2. 综合规划结果
我们评估了该模型在特定选择的反应模板和可用构建块下重建可到达和无法到达的目标分子的能力。我们使用测试数据作为“可到达”的目标(69,548),以及来自ChEMBL的随机样本,主要是“无法到达”分子(20,000)。在培训和验证阶段,测试集中没有看到任何产品。我们在第一个反应物k-NN搜索中使用k = 3,并以贪婪的方式为每个选择扩展树木(k = 1)。从获得的产物分子中,我们选择与目标分子最相似的分子作为使用摩根指纹的谷本相似性所反映的输出。
表1:“可及”和“不可及”目标分子的合成树结构结果。

结果汇总于表1。回收率衡量我们模型成功重建的分子比例。我们的模型可以从被保留的测试集中重建51%的可到达分子。与典型的自上而下的合成规划方法(即逆合成)需要数十秒甚至几分钟不同,我们的自下而上的方法只需要∼1秒就能贪婪地构建k = 1的树。我们的模型仅回收4.5%的ChEMBL分子,但我们注意到,不同的模板和起始材料选择可以在不改变模型架构的情况下导致更高的ChEMBL回收率(Gao & Coley,2020年)。
图3A展示了一个示例,我们的模型成功重建了与训练集中所有分子不同的分子。我们还评估了目标和回收产品之间的目标和产物分子对、KL发散(Brown等人,2019年)和Fréchet ChemNet(FC)距离(Preuer等人,2018年)之间的平均相似性。有关其他综合规划结果,请参阅附录F。

**图4:**Mtarget和Mproduct分子属性之间的相关性。
在这四个网络中,最重要的错误来自第一个反应网络frt1,在k-NN检索后,验证精度仅为30.8%。相比之下,frt2在不掩盖无效操作的情况下达到了70.0%的验证准确性。在采样过程中,我们掩盖了与所选反应模板不兼容的候选二次反应物,以实现更高的准确性。动作和反应网络的验证精度分别达到>99%和85.8%。
3. 可合成的模拟推荐结果
我们观察到,在不可回收分子的情况下,最终产物可以在R和C的约束下作为可合成的结构类似物(示例见图3B)。表1中的指标显示了未恢复情况下的产物分子在结构上仍然与输入分子相似。我们在图4中说明了目标分子和产物分子性质之间的相关性。我们调查了SA分数(Ertl和Schuffenhauer,2009b)、QED、CLogP和分子量,并观察到大多数产品属性与相应的输入属性呈正相关。最不成功的案例是QED,因为它对结构活动景观指数(SALI)量化的结构变化高度敏感(Guha,2012年)(附录G中的表6)。总体而言,我们的模型可以为目标分子建议合理的可合成类似物,特别是当所需的特性与分子结构高度相关时
在其他情况下,如果目标产物没有被生成的途径回收,输出合成树仍然可以为目标分子的合成提供灵感。图3C突出了一个例子,即重建失败是由于二进制摩根指纹无法区分重复单元。我们的模型成功地构造了这个对称分子的一侧。在这种情况下,合成化学家可能会认识到,用哌嗪取代1-异丙基哌嗪(第二步中添加的活性剂)可能会导致目标分子的合成。
4. 合成可估计的分子优化结果
为了评估我们算法的优化能力,我们首先考虑了与生物活性和药物发现相关的常见启发式甲骨文函数(表2和表7)。请注意,我们比较的基线方法不会限制合成性,这意味着它们探索更大的化学空间,并能够获得得分更高但不可合成的分子。结果表明,我们的模型始终优于GCPN(You等人,2018年)和MoldQN(Zhou等人,2019年),并在不同任务中与GA+D(Nigam等人,2019年)和MARS(Xie等人,2021年)相当。我们在图5中重点介绍了GSK3β抑制剂优化的案例。
在这项任务中,我们的模型提出了一个比DST(Fu等人,2021年)和MARS得分略差的分子,但结构要简单得多。事实上,通过简单的铃木反应,可以在C中的可购买化合物的一个反应步骤内访问该分子(合成途径见图12)。这使得我们模型的建议更易于操作,即准备好进行实验验证。作为基于结构的药物设计的另一个准现实应用,我们优化了SARS-Cov-2与DRD3和Mpro的结合亲和力,作为示例目标蛋白,并成功生成了多个分子,相对于已知抑制剂具有更好的对接分数(见图5)。我们使用Guacamol滤波器(Brown等人,2019年)和SA_Score(Ertl & Schuffenhauer,2009a)对照DRD3定量评估前100个生成的分子,并将其与TDC生成基准进行比较(Huang等人,2021年)。我们的方法是唯一一种实现高通过率和低SA_Score的方法,这表明结构质量更好(见表8)。其他分子优化结果见附录H
**表2:**各种新分子设计任务中生成的分子得分最高。请注意,除我们的方法外,所有基线都没有对合成可访问性施加限制。

七. 总结
在这项工作中,我们引入了一种摊销的条件合成树生成方法,可用于合成规划、可合成模拟推荐以及分子设计和优化。我们的模型通过将分子生成和合成规划耦合成一个快速步骤,将它们连接起来,消除了对两阶段生成和过滤管道的需求。我们展示了与药物发现相关的各种分子优化任务的有希望的结果,说明了如何利用这种方法有效地探索可合成的化学空间,以追求新的功能分子。其他展望在附录C中

本文提出了一种自下而上的马尔可夫决策过程(MDP)模型,用于条件合成路径生成,结合分子设计和合成规划。模型通过模拟化学反应,基于反应模板和可购买化合物,生成合成树,用于快速合成规划和设计具有特定特性的分子。在实验中,模型展示了在生成多步合成路径和优化分子结构方面的潜力,尤其是在药物发现相关任务中。
6427

被折叠的 条评论
为什么被折叠?



