目录
如何求距离? 欧氏距离。相似的样本,特征之间的值应该都是相近的。
1 基本概念
1.1 定义
如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
1.2 sklearn k-近邻算法API
sklearn.neighbours.KNeighborsClassifier(n_neighbors=5,algorithm="auto")
- n_neighbors:int,可选(默认=5),k_neighbors查询默认使用的邻居数
- algorithm:{"auto","ball_tree","kd_tree","brute"}可选用于计算最近邻居的算法。
- ball _tree将会使用BallTree,kd_tree将使用KDTree."auto"将尝试根据传递给fit方法的值来决定最适合的算法。
2 kaggle实例:预测facebook签到位置
2.1 实例背景
2.2 文件说明
- train.csv,test.csv
- row_id:登记时间的ID
- xy:坐标
- 准确性:定位准确性
- 时间:时间戳
- place_ID:业务的ID,这是您预测的目标