knn算法，利用numpy简单实现

原创已于 2022-01-25 13:36:48 修改 · 2.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#算法 #回归 #机器学习

于 2022-01-25 13:36:47 首次发布

初识人工智能专栏收录该内容

2 篇文章

订阅专栏

本文详细解释了机器学习中回归与分类算法的区别，包括它们的应用场景及如何处理不同类型的预测问题。并给出了一个具体的回归算法实例——预测房价，并讨论了特征处理的方法。

首先明确概念：
回归：预测体重、预测房价、预测损失。结果是不容易确定的。

分类：预测男女、预测是否能通过考试结果是容易确定的。

我的理解：回归针对连续的数据、分类针对离散的数据。 回归连续、分类离散。

classfication和regression的区别：
回归的是求topk的value求平均值；

分类是求topk中出现最多的类别。

例子：预测房价（回归例子）

根据经度、维度->预测房屋价格

numpy中数组的特性：广播效应

减法时会自动匹配每一行/列

例如：

思路：

拿到feature(影响结果的影响因子)与预测的作差平方和开方得到欧式距离然后利用argsort得到下标的升序排序，通过label访问下标的值+k值预测求得平均值。

包装成函数看看：

注意：不管是feature/label还是predictPoint这些都是np下的数组才能使用广播响应。

为什么这里不使用归一化？

因为数据之间差异太大，使得处理后的数据不集中不好获得理想预测结果。

可以使用标准化来解决一下：

数据标准化的格式，仔细看看有点复杂但是Python的第三库已经写好了！

# mean std 再到result。。。

最后的最后，分享给大家：
数学的学习方法：

试着去理解原理、理解数学背后的原理；

避免抽象数学和理论数学；

结论不靠数学公式证明，靠的是编写程序实验证明。

原理->应用

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。