7、机器学习中的分类器优化与线性分类器解析

最新推荐文章于 2026-01-09 11:22:02 发布

原创最新推荐文章于 2026-01-09 11:22:02 发布 · 29 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #分类器优化 #线性分类器

机器学习入门指南专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的分类器优化与线性分类器解析

1. 去除冗余示例

在机器学习的训练集中，有些示例虽不会对分类性能产生负面影响，但会增加计算成本，因此去除冗余示例是很有必要的。

1.1 Tomek链接的去除

Tomek链接是指训练集中，两个属于不同类别的示例互为最近邻。去除Tomek链接通常能提高数据的整体质量，甚至可能使1 - NN分类器达到使用整个原始训练集的k - NN分类器的性能。不过，Tomek链接技术也有局限性，它不能识别所有误导性示例，而且有些被移除的示例可能是“无辜”的，本应保留。在两种特定情况下需要谨慎使用该技术：一是训练集非常小的时候；二是其中一个类别显著多于另一个类别的时候。