酶分类与主机移动性管理协议整合研究
1. 酶分类相关研究
在酶分类领域,Lorens分类法对变量进行了分区操作。对于aofb、cah2和hs90a这三种酶,分别将变量划分为9个子空间、4个子空间和5个子空间。与标准逻辑回归不同的是,Lorens在过程中使用了所有变量或预测因子。
1.1 随机分区与模型构建
随机变量的分区是通过最小化集合上的相关性来进行的,随机分区以相同分布选择,假设每个分区内无偏差。以aofb酶为例,随机分区和模型构建步骤如下:
- 变量在每个子空间中随机分配,且每个子空间中的变量数量相同。
- 若分区数为2,aofb酶的70个预测因子将被分配到2个子空间(第1分区和第2分区)。在每个集合中会有2个模型,10个集合总共会有20个模型。例如,在第一个集合中,A Log P变量分配到第二分区,A Log P MR分配到第一分区,A Log P98分配到第二分区,以此类推。
- 对于分区数为4、5、6、7、8、9和10的情况,采用类似的分配过程。
- 每个变量按分区分配后,在集合的每个分区中构建逻辑回归模型。例如,设置2个分区时,10个集合中的逻辑模型如下表所示:
Ensemble | Logistic regression model partition 1 | Logistic regression model partition 2 |
---|---|---|
1 | (g(x) = \ln(\frac{\ |