机器学习模型在乳腺癌和MNIST数据集上的实验分析
1. 乳腺癌数据集实验
在对乳腺癌数据集的实验中,使用RBF SVM模型,对不同的C和γ值进行了10次运行取平均值,结果如下表所示:
| C | γ | 准确率 |
| — | — | — |
| 1 | 0.03333 | 0.97345 |
| 2 | 0.03333 | 0.98053 |
| 10 | 0.00417 | 0.97876 |
| 10 | 0.00417 | 0.97699 |
| 10 | 0.00417 | 0.98053 |
| 10 | 0.01667 | 0.98053 |
| 10 | 0.01667 | 0.97876 |
| 10 | 0.01667 | 0.98053 |
| 1 | 0.03333 | 0.97522 |
| 10 | 0.00417 | 0.97876 |
从这些结果可以看出,(C, γ) = (10, 0.00417)是一个不错的组合。使用这些值进行1000次五折交叉验证的总体平均值计算,得到的总体准确率为0.976991,即97.70%,这是在乳腺癌组织学数据集上训练的所有模型类型中最高的平均准确率。由于乳腺癌数据集规模不大,使用k折交叉验证能够找到与之适配的良好模型。
2. MNIST数据集实验
MNIST手写数字数据集是机器学习,尤其是深度学习中常用的数据集。该数据集包含60,000个训练图像和10,000个测试图像,图像为28×28像素的灰度手写数字[0, 9],每个图像中心有一个数字。
超级会员免费看
订阅专栏 解锁全文
169

被折叠的 条评论
为什么被折叠?



