机器学习全解析:从基础算法到人工智能应用
1. 监督学习中的偏差 - 方差问题
监督机器学习算法必须面对偏差 - 方差问题。偏差误差源于算法中的错误假设,在统计学中,偏差指的是期望值与被估计参数的真实值之间的差异。零偏差意味着算法完全无偏差。方差误差则是由于算法对训练集中的小波动过于敏感而引起的,通常会导致算法对训练数据集过拟合。一般来说,增加偏差会降低方差,反之亦然。理想情况是同时拥有低偏差和低方差,否则会导致某种类型的误差。
2. 无监督学习算法
2.1 聚类
无监督机器学习的一个常见方法是聚类。聚类算法的目标是将输入数据分组,使得同一组内的项目彼此之间的相似度高于与其他组内项目的相似度。在执行算法之前,操作人员可能并不知道这些组会是什么样子。聚类可以揭示出操作人员可能未曾预料到的模式。常见的聚类模型有:
- 连通性模型 :基于距离,每个输入集是一个向量,算法通过确定输入向量之间的距离来确定聚类。
- 质心模型 :每个聚类有一个单一的均值向量,即该聚类的质心。
- 图模型 :以图中的团为基础对输入数据进行聚类。团是图中顶点的一个子集,其中任意两个不同的顶点都是相邻的。
- 密度模型 :寻找数据空间中的密度区域,这些区域被确定为聚类,数据按聚类分组,如 DBSCAN 算法就使用了这种方法。
2.2 异常检测
异常检测方法用于数据分析和机器学习。其概念很简单,算法旨在寻找数据中的任何离群值或异常值。离群值是指与其他数据点
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



