9、非监督式非线性缩放参数估计以提升相异度空间分类性能

最新推荐文章于 2025-11-09 11:08:26 发布

wasm7browser

最新推荐文章于 2025-11-09 11:08:26 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏：模式识别前沿探析文章标签：非监督式准则相异度空间非线性缩放

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wasm7browser/article/details/151004456

模式识别前沿探析专栏收录该内容

63 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

非监督式非线性缩放参数估计以提升相异度空间分类性能

1. 引言

在统计模式识别中，对象通常被表示为向量，其元素对应特征的数值，这样对象就成为向量空间（特征空间）中的点。然而，这种传统表示在处理符号数据（如图形和语法）或原始传感器测量值（如信号和图像）时，往往存在特征提取困难的问题。

作为替代方案，Pekalska和Duin提出测量对象对之间的相异度，并将其组织成向量，使每个对象在相异度空间中表示为一个点。在这个空间中，可以训练和应用任何分类器。相异度表示属于（不）相似模式识别领域，近年来得到了积极研究。

在许多模式分类问题中，需要对特征空间进行归一化，常见方法是对向量空间的轴进行线性缩放。但在相异度空间中，由于所有特征性质相同（都是到参考组对象的距离），线性缩放的重要性相对较低。不过，更复杂的缩放操作，如非线性变换，对提升分类性能非常有用。Duin等人发现，对给定相异度进行幂变换的非线性缩放，有助于提高相异度空间中最近邻分类的性能。当幂小于1时，幂变换具有以下优点：
- 对象之间的距离趋于相等。
- 到离群点的距离缩小。
- 通过强调近邻对象之间的距离，扩大每个对象的邻域。

然而，确定合适的幂参数是一个关键问题。通常，该参数是手动设置或通过穷举搜索得到的，Duin等人使用的留一法交叉验证在处理大型数据集时计算成本过高，且无法解释非线性缩放的拓扑效应。

本文提出了一种全新的非监督式准则，用于指导幂变换参数的选择。该准则试图在数据分散度的降低和相异度空间固有维度的增加之间找到平衡。实验表明，使用该准则选择的最佳参数进行幂变换，分类准确率通常显著优于未预处理的空间，且多次与交叉验证方法相当或更优。

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。