机器学习算法在医学图像和数据处理中的应用
1. 子采样并发 AdaBoost 算法
1.1 实验结果
对三个数据集进行实验,以 ROC - AUC、F1 分数、精确率和召回率来衡量结果。实验中使用了 1%、5%、10%、50% 和 100% 的子采样比例。
分析实验结果发现,该算法在使用较小重采样数据进行分类任务时,与使用更多数据的重采样相比,性能相似。在某些情况下(如 Quasar/Star 数据集),使用最小子样本时能达到最佳性能,这表明该算法受重采样数据大小减小的影响不大。
以下是不同数据集在不同子采样比例下的执行时间和测试准确率:
| 数据集 | 百分比 s | 时间 [秒] | 测试准确率 |
| — | — | — | — |
| Quasar/Star | 1% | 257 | 0.980 |
| | 5% | 606 | 0.982 |
| | 10% | 923 | 0.978 |
| | 50% | 3645 | 0.980 |
| | 100% | 2912 | 0.975 |
| Twitter | 1% | 1398 | 0.512 |
| | 5% | 7046 | 0.524 |
| | 10% | 16685 | 0.537 |
| | 50% | 83215 | 0.555 |
| | 100% | 113652 | 0.606 |
| 乳腺癌 | 1% | - | - |
| | 5% | 7.54 | 0.974 |
| | 10% | 7.56 | 0.972 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



