模式分类与函数逼近:数据集与评估方法解析
1. 支持向量机决策函数与泛化能力
支持向量机针对两类问题确定能最大化泛化能力的直接决策函数。当不同类别的训练数据不重叠时,决策函数的确定原则是使与训练数据的距离最大化,此为最优决策函数。由于确定非线性决策函数较为困难,所以将原始输入空间映射到被称为特征空间的高维空间,在特征空间中确定最优决策函数,即最优超平面。支持向量机在训练数据少、输入变量多的情况下,表现优于传统分类器,因为传统分类器没有最大化分类边界间隔的机制,而引入这种机制可提高泛化能力。
2. 各类问题的数据集
2.1 两类分类问题数据集
| 数据 | 输入 | 训练数据 | 测试数据 | 数据集数量 |
|---|---|---|---|---|
| Banana | 2 | 400 | 4,900 | 100 |
| Breast cancer | 9 | 200 | 77 | 100 |
| Diabetes | 8 | 468 | 300 | 100 |
超级会员免费看
订阅专栏 解锁全文
1232

被折叠的 条评论
为什么被折叠?



