ESL学习之kNN

本文探讨了kNN算法在高维空间中的局限性。随着维度增加,最近邻点更可能分布在较远处,而非靠近目标点。通过半径为0.5的球体体积与总球体体积的比例变化说明了这一现象。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在利用kNN进行分类时,我们是选择一个点的k个最近的neighbor的一些属性来估计当前点的属性。

kNN的一个局限性就在于当参数空间的维数p增大后,这k个neighbor更趋近于分布在离当前点较远的那部分。意思就是在一个半径为1的p维球体中,若存在k个点,那么这k个点更趋近于这个球体的边缘,这是为什么呢。

作为一个大概的理解,考虑在半径为0.5的地方,那么0.5半径以内的球体体积为exp(0.5,p),由于整体球体体积为1,故0.5半径内所占整体球体的体积会随着p的增大而逐渐趋向于0,所以这k个点更趋向于分布在0.5以及更远的地方。

下面是具体的数学表达。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值