机器学习在系外行星候选体识别与企业破产预测中的应用
1. 系外行星候选体识别
1.1 模型构建
1.1.1 RFE 后接全连接模型
递归特征消除(RFE)是一种特征选择技术,它基于特征对目标变量的依赖关系递归地对特征进行排名。通过从所有特征开始选择子集,根据特征的相关性和重要性消除最弱的特征,直到达到所需选择的特征数量。使用 RFECV(一种交叉验证方法)捕获了六个与响应变量相关的特征。对全连接模型在 1 - 5 个隐藏层的不同设置下进行测试,使用了四个丢弃层,阈值分别为 0.25、0.25、0.25 和 0.4。优化器使用 Adam,损失函数为二元交叉熵。对不同批量大小进行测试,结果记录在表 2 中,并使用提前停止作为回调函数,参数与全连接模型相同。
1.1.2 RFE 后接随机森林模型
使用 RFECV 选择六个最佳特征,通过交叉验证方法自动选择最佳特征,然后将这些特征传递给随机森林模型。使用 100 个决策树作为估计器,每个决策树的最大深度为 10。
1.2 结果分析
1.2.1 隐藏层数量的影响
在每个深度学习模型中改变隐藏层的数量,计算了从 1 到 5 个隐藏层时模型的性能,结果如下表所示:
| 隐藏层数量 | 全连接模型 | PCA 后接全连接模型 | RFE 后接全连接模型 |
| — | — | — | — |
| 1 | 98.36 | 98.41 | 98.61 |
| 2 | 98.18 | 98.36 | 98.61 |
| 3 | 98.27 | 98.44 | 98.70 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



