数据处理与Scikit - learn实战
在数据科学领域,当你掌握了Python基本的数据加载和操作方法后,就可以开始使用更复杂的工具进行数据处理和机器学习了。Scikit - learn是一个强大的Python库,它几乎包含了数据科学家完成项目所需的所有工具。
1. Scikit - learn基础
Scikit - learn是大多数数据科学家进行机器学习和数据科学实验时青睐的工具包,它包含了各种成熟的学习算法、误差函数和测试程序。
Scikit - learn的核心是一些基础类,所有算法都基于这些基础类构建。除了所有其他类都继承的BaseEstimator类外,还有四种类型的类涵盖了基本的机器学习功能:
- 分类 :对新观察值所属的类别进行猜测。
- 回归 :预测新观察值的值。
- 聚类分组 :将数据分组到不同的簇中。
- 数据转换 :对数据进行转换。
这些基础类通过接口来保证数据处理和机器学习的核心功能。Scikit - learn有四种基于对象的接口:
| 接口类型 | 功能 |
| ---- | ---- |
| estimator | 根据算法拟合参数并从数据中学习 |
| predictor | 根据拟合的参数生成预测 |
| transformer | 应用拟合的参数对数据进行转换 |
| model | 报告拟合优度或其他评分指标 |
Scikit - learn将基于基
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



