机器学习基础与Scikit - Learn库的应用
1. 机器学习基础概念
1.1 降维算法介绍
在处理高维数据时,降维算法的作用尤为明显。例如,当我们想要可视化一个包含100或1000个特征的数据集内的重要关系时,可视化1000维的数据是一项挑战。此时,使用降维技术将数据降至二维或三维是一种有效的解决办法。
重要的降维算法包括主成分分析(PCA)以及各种流形学习算法,如Isomap和局部线性嵌入等。
1.2 机器学习方法分类
机器学习方法主要分为监督学习和无监督学习,具体如下:
| 学习类型 | 子类型 | 描述 |
| ---- | ---- | ---- |
| 监督学习 | 分类 | 基于标记的训练数据预测离散类别标签的模型 |
| 监督学习 | 回归 | 预测连续标签的模型 |
| 无监督学习 | 聚类 | 检测并识别数据中不同组别的模型 |
| 无监督学习 | 降维 | 检测并识别高维数据中低维结构的模型 |
2. Scikit - Learn库简介
2.1 Scikit - Learn概述
Scikit - Learn是一个提供大量常见机器学习算法高效实现的Python库。它具有简洁、统一和精简的API,以及实用且完整的在线文档。一旦掌握了Scikit - Learn对一种模型的基本使用和语法,切换到新的模型或算法就非常简单。
2.2 Scikit - Learn的数据表示
2.2.1 数据作为表格
在Scikit - Lea
超级会员免费看
订阅专栏 解锁全文
2159

被折叠的 条评论
为什么被折叠?



