支持向量机特性与分类器开发全解析
在机器学习领域,支持向量机(SVM)是一种强大的分类工具。下面我们将深入探讨支持向量机在不同条件下的特性,以及如何开发具有高泛化能力的分类器。
1. 支持向量机的特性
1.1 多项式核与RBF核的表现
通过对血细胞数据的计算机模拟,我们可以观察到支持向量机在不同核函数和参数下的特性。
- 多项式核 :当多项式次数增加时,训练数据的识别率会提高,但测试数据的识别率变化不大。对于L1和L2支持向量机,当多项式次数大于3时,它们的行为几乎相同。例如,在图2.15中,展示了血细胞数据使用多项式核时的识别率,L1和L2支持向量机的测试数据识别率变化不明显,这意味着在这种情况下不会出现过拟合现象。图2.16则显示了在相同条件下,支持向量数量随多项式次数的变化。对于多项式次数低于4的情况,L2支持向量机所需的支持向量数量比L1支持向量机多,但次数高于3时,两者几乎相同。
- RBF核 :固定C = 5000,改变γ值时,L1和L2支持向量机的识别率几乎相同。当γ大于1时,训练数据的识别率达到100%,且测试数据的识别率变化不大。图2.17展示了血细胞数据使用RBF核时的识别率情况。图2.18显示了支持向量数量随γ值的变化,当γ小于1时,L2支持向量机的支持向量数量比L1支持向量机多,但γ大于或等于1时,两者几乎相同。随着γ变小,RBF的半径变小,需要更多的支持向量来正确分类训练数据。
| 核函数类型 | 影响因素 | 训练数据识别率变化 |
|---|
超级会员免费看
订阅专栏 解锁全文

1093

被折叠的 条评论
为什么被折叠?



