基于深度学习的分子性质预测模型解析
1. 分子嵌入算法基础
在分子性质预测的研究中,嵌入算法是重要的基础。在该算法里,分子被视为句子,像 “A” 或 “-B” 这样的子串则相当于单词。以包含五个原子的甲烷分子为例,每个原子都作为起始点,记录其相连的键和原子。从化学键样本中提取字典,子串 “A” 和 “-B” 由初始向量表示,比如独热编码。每个初始向量用于训练嵌入神经网络,基于这些训练样本,神经网络会输出表示字典中每个子串成为下一个子串的概率。训练完成后,嵌入网络中神经元的权重形成目标向量。
2. 深度神经网络构建
构建了结合 Tree - LSTM 和 BPNN 的深度神经网络(DNN)。Tree - LSTM 神经网络用于描绘具有规范分子特征的分子树数据结构,而 BPNN 用于关联性质。
- Tree - LSTM 模型 :有 Child - sum Tree - LSTM 和 N - ary Tree - LSTM 两种。Child - sum Tree - LSTM 适用于依赖树,其组件由子隐藏状态的总和计算得出,适合高分支因子或子节点无序的树;N - ary Tree - LSTM 适用于分支因子最多为 N 且子节点有序的树,它为每个子节点引入单独的参数矩阵,能更精细地学习子节点状态。两种 Tree - LSTM 模型在语义分类上的性能优于顺序 LSTM 模型。在本研究中,采用 N - ary Tree - LSTM 网络描绘分子,输入变量是通过嵌入算法转换的向量。
- BPNN 关联性质 :在定量结构 - 性质关系(QSPR)模型中,变量 $x_j$ 是表示化学键子串的输
超级会员免费看
订阅专栏 解锁全文
2215

被折叠的 条评论
为什么被折叠?



