机器学习中的K近邻算法与房屋价值评估
1. 机器学习概述
1.1 机器学习的定义与解决的问题
机器学习是理论健全的计算机科学与实际嘈杂数据的交叉领域,本质上是让机器像人类一样从数据中获取意义。它主要解决以下几类问题:
| 问题 | 机器学习类别 |
| — | — |
| 将某些数据拟合到函数或函数逼近 | 监督学习 |
| 在没有任何反馈的情况下弄清楚数据是什么 | 无监督学习 |
| 随着时间最大化奖励 | 强化学习 |
1.2 机器学习算法类别及特点
不同的机器学习算法具有不同的特点和适用场景,以下是一些常见算法的比较:
| 算法 | 学习类型 | 类别 | 限制偏差 | 偏好偏差 |
| — | — | — | — | — |
| K近邻算法 | 监督学习 | 基于实例 | 一般来说,KNN适用于基于距离的近似测量;受维度灾难影响 | 偏好基于距离的问题 |
| 朴素贝叶斯 | 监督学习 | 概率型 | 适用于输入相互独立的问题 | 偏好每个类别的概率始终大于零的问题 |
| 决策树/随机森林 | 监督学习 | 树型 | 在低协方差问题上实用性降低 | 偏好分类数据的问题 |
| 支持向量机 | 监督学习 | 决策边界 | 在两个分类之间有明确区分的情况下有效 | 偏好二元分类问题 |
| 神经网络 | 监督学习 | 非线性函数逼近 | 限制偏差较小 | 偏好二元输入 |
| 隐马尔可夫模型 | 监督/无监督学习 | 马尔可夫型 | 通常适用于满足马尔可夫假设的系统信息 | 偏好时间序列数据和无记忆信息 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



