机器学习基础——分类算法之K近邻算法(KNN)、预测facebook签到位置案例

目录

 1 基本概念

1.1 定义 

1.2 sklearn k-近邻算法API

2 kaggle实例:预测facebook签到位置

2.1 实例背景

 2.2 文件说明

2.3 案例分析

2.3.1 分类

2.3.2 处理

2.4 代码及分析

2.4.1 代码分析

2.4.2 完整代码

3 K值的选择

4 流程

5 knn算法的优缺点

5.1 优点

5.2 缺点

如何求距离? 欧氏距离。相似的样本,特征之间的值应该都是相近的。

 1 基本概念

1.1 定义 

如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

1.2 sklearn k-近邻算法API

sklearn.neighbours.KNeighborsClassifier(n_neighbors=5,algorithm="auto")

  • n_neighbors:int,可选(默认=5),k_neighbors查询默认使用的邻居数
  • algorithm:{"auto","ball_tree","kd_tree","brute"}可选用于计算最近邻居的算法。
  • ball _tree将会使用BallTree,kd_tree将使用KDTree."auto"将尝试根据传递给fit方法的值来决定最适合的算法。

2 kaggle实例:预测facebook签到位置

2.1 实例背景

 2.2 文件说明

  • train.csv,test.csv
  • row_id:登记时间的ID
  • xy:坐标
  • 准确性:定位准确性
  • 时间:时间戳
  • place_ID:业务的ID,这是您预测的目标

2.3 案例分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值