化学知识的数据挖掘与发现:SVM在药物研究和工业优化中的应用
1. 引言
在化学研究和工业生产中,数据挖掘技术正发挥着越来越重要的作用。支持向量机(SVM)作为一种强大的数据挖掘工具,在药物定量构效关系(QSAR)研究和化学过程工业优化中展现出巨大潜力。本文将详细探讨SVM在这两个领域的应用,包括具体操作步骤和实际案例分析。
2. SVM在药物QSAR研究中的应用
2.1 HEPT - 类似物抗HIV - 1活性的SVC建模
2.1.1 描述符获取
首先,使用PM3半经验分子轨道方法在受限Hartree - Fock水平且无构型相互作用的条件下,结合HYPERCHEM软件的相应选项,获取一系列描述符,如HOMO能量、LUMO能量、总能量等。由于部分参数存在冗余,选择合适的描述符对于构建准确的QSAR模型至关重要。
操作步骤:
1. 运用PM3半经验分子轨道方法进行计算。
2. 利用HYPERCHEM软件的对应选项获取其他参数。
2.1.2 描述符选择
采用熵方法对给定的15个测量数据集进行描述符子集选择。定义可分离率R作为选择关键描述符的标准,最终确定Q4、MV、LogP、MR、MP和MW这六个描述符适合构建SVC模型。
操作步骤:
1. 计算可分离率R(R = 1 - N2 / N1),其中N1为高活性样本正确预测的数量,N2为低活性样本误分类的数量。
2. 根据R值选择描述符,确保不降低R值或增加数据集的熵。
2.1.3 核函数和容量参数C的选择
通过留一法交叉验证(LOOCV)程序,以错误预测数量Pw为标
超级会员免费看
订阅专栏 解锁全文
309

被折叠的 条评论
为什么被折叠?



