8、基于机器学习的环境属性预测中分子特征的自动提取

基于机器学习的环境属性预测中分子特征的自动提取

在许多领域中,化合物的环境属性都起着至关重要的作用,如可持续化学、过程设计、环境修复以及化学品环境行为评估等。环境效益推动着绿色溶剂、化学合成和分子设计向环保技术发展,因为环境属性为化合物的吸收、分布和代谢提供了有价值的信息,并指导着对可能对人类和野生动物构成严重威胁的有机污染物的处理。然而,可靠地测量化合物的环境属性是一项成本高昂且有时繁琐的任务,特别是对于那些蒸气压极低、水溶性低或风险高的化合物。因此,人们提出了不同的方法来预测各种类型化合物的属性。

现有预测方法
  • 经验关系法 :这是一种流行的属性估计方法,它使用不同的物理化学性质(如临界温度、蒸气压和水溶性)作为输入参数来计算化合物的目标属性。例如,Gharagheizi等人开发了一个相当准确的经验模型,用于预测有机化合物的亨利定律常数,该模型依赖于几个基本属性(如正常沸点温度和临界压力),对于1816种有机化合物,其绝对平均偏差约为10%。但这种方法严重依赖于所需输入属性的可用性和准确性,如果其中一个输入不可用(或无法估计),则不实用。
  • 定量结构 - 属性关系(QSPR)模型 :该模型认为物理化学性质与分子结构相关。许多研究在这方面做出了重要贡献,还有一些QSPR模型是基于基团贡献(GC)方法提出的。在这些模型中,将感兴趣的分子划分为各种基团(如原子和包含原子与化学键的子结构),并为每个基团分配特定的贡献值,然后通过汇总基团的贡献来得到化合物的目标属性。GC方法被视为多元线性数学模型,但不同的GC方法中相同的基团可能有不同的贡献值,且基团的定义也不完全相同,因此不同的GC方法虽然工作
是一个聚合物相关数据集,包含以下内容: SMILES:以简化分子输入线性表达式形式表示聚合物的化学结构,这种表示方法用文本序列描述分子结构,方便计算机处理。 Tg:聚合物的玻璃化转变温度,单位是摄氏度。这是聚合物从玻璃态向高弹态转变的温度,是其重要的物理性质。 PID:聚合物的唯一标识符,用于区分不同的聚合物。 Polimers Class:聚合物的分类,如聚烯烃、聚酯等,有助于了解聚合物的通用类别。 该数据集可用于聚合物性质预测、材料信息学和化学结构分析等领域。 数据集包含SMILES、Tg、PID、Polimers Class”。 Extra dataset:表示一个额外的、附加的数据集。在科学研究、数据分析等领域,数据集是用于存储和处理数据的集合,这个额外的数据集可能是为了补充主数据集或者用于特定的分析目的。 SMILES:是“Simplified Molecular Input Line Entry System”的缩写,即简化分子输入线性表达式。这是一种用一串文本表示化学分子结构的方法,它能够将复杂的分子结构用简单的字符序列来描述,方便在计算机程序中进行处理和存储。例如,水分子H₂O可以用SMILES表示为“O”。 Tg:通常表示玻璃化转变温度(Glass transition temperature)。这是聚合物材料的一个重要物理性质,是指聚合物从玻璃态向高弹态转变的温度。在这个温度下,聚合物的物理性质会发生显著变化,例如从硬脆状态变为具有弹性的状态。例如,聚苯乙烯的玻璃化转变温度大约在100℃左右。 PID:可能有多种含义,具体含义需要根据上下文来判断。在化学和材料科学领域,它可能表示某种特定的标识符(Product ID),用于唯一标识某个产品或化合物。例如,在一个化学试剂数据库中,PID可以用来区分不同的化学试剂。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值