1. 监督学习(Supervised Learning)
- 定义: 监督学习是一种学习范式,算法在带有输入特征(features)和对应标签(labels)的标注数据集上进行训练,学习特征与目标变量之间的映射关系。
- 任务类型:
- 分类(Classification): 预测数据属于哪个类别(离散输出)。
示例:垃圾邮件检测(邮件是垃圾还是正常)。 - 回归(Regression): 预测连续的数值(连续输出)。
示例:房价预测。
- 分类(Classification): 预测数据属于哪个类别(离散输出)。
- 常见算法:
- 分类:逻辑回归、支持向量机(SVM)、k近邻(kNN)。
- 回归:线性回归、岭回归、支持向量回归(SVR)。
- 数据特点: 数据中包含输入(XXX)和目标输出(YYY),模型通过已知的X,YX, YX,Y对来学习。
2. 无监督学习(Unsupervised Learning)
- 定义: 无监督学习的算法在没有标签的情况下学习数据的结构或模式。目标是发现数据中的潜在规律或分布。
- 任务类型:
- 聚类(Clustering): 将数据分组为若干类群(没有预定义标签)。
示例:客户群体划分。 - 降维(Dimensionality Reduction): 减少数据的维度,同时尽可能保留重要信息。
示例:主成分分析(P
- 聚类(Clustering): 将数据分组为若干类群(没有预定义标签)。