机器学习中的 kNN 算法与社交网络分析
1. kNN 算法介绍
k 近邻(k-Nearest Neighbors,kNN)算法是一种直观的机器学习算法。它可以基于相似度指标为网站用户推荐物品。其基本思想就像我们向朋友征求推荐一样,先找到与自己品味相似的人,然后根据他们的推荐来做选择。
1.1 分类问题与 kNN 算法的引出
在处理分类问题时,对于线性决策边界的分类问题,可以使用逻辑回归通过 glm 函数进行分类。但对于非线性决策边界的问题,逻辑回归就不太适用了。这时可以尝试非线性方法,如核技巧,也可以使用 kNN 算法。
例如,有一个“草根民主”算法,它通过在要分类的点周围画一个圆,根据圆内的点来进行分类。但这个算法有一个缺陷,就是需要选择合适的圆半径。为了解决这个问题,我们可以直接考虑 k 个最近的点,即 k 近邻,然后根据多数规则来决定新点的类别。
1.2 kNN 算法的代码实现
以下是实现 kNN 算法的具体步骤和代码:
1. 读取数据集 :
df <- read.csv('data/example_data.csv')
head(df)
# X Y Label
#1 2.373546 5.398106 0
#2 3.183643 4.387974 0
#3 2.164371 5.341120 0
#4 4.595281 3.870637 0
#5 3.329508 6.433024
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



