基于机器学习的环境属性预测中分子特征的自动提取
在许多领域中,化合物的环境属性都起着至关重要的作用,如可持续化学、过程设计、环境修复以及化学品环境行为评估等。环境效益推动着绿色溶剂、化学合成和分子设计向环保技术发展,因为环境属性为化合物的吸收、分布和代谢提供了有价值的信息,并指导着对可能对人类和野生动物构成严重威胁的有机污染物的处理。然而,可靠地测量化合物的环境属性是一项成本高昂且有时繁琐的任务,特别是对于那些蒸气压极低、水溶性低或风险高的化合物。因此,人们提出了不同的方法来预测各种类型化合物的属性。
现有预测方法
- 经验关系法 :这是一种流行的属性估计方法,它使用不同的物理化学性质(如临界温度、蒸气压和水溶性)作为输入参数来计算化合物的目标属性。例如,Gharagheizi等人开发了一个相当准确的经验模型,用于预测有机化合物的亨利定律常数,该模型依赖于几个基本属性(如正常沸点温度和临界压力),对于1816种有机化合物,其绝对平均偏差约为10%。但这种方法严重依赖于所需输入属性的可用性和准确性,如果其中一个输入不可用(或无法估计),则不实用。
- 定量结构 - 属性关系(QSPR)模型 :该模型认为物理化学性质与分子结构相关。许多研究在这方面做出了重要贡献,还有一些QSPR模型是基于基团贡献(GC)方法提出的。在这些模型中,将感兴趣的分子划分为各种基团(如原子和包含原子与化学键的子结构),并为每个基团分配特定的贡献值,然后通过汇总基团的贡献来得到化合物的目标属性。GC方法被视为多元线性数学模型,但不同的GC方法中相同的基团可能有不同的贡献值,且基团的定义也不完全相同,因此不同的GC方法虽然工作
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



