Table of Contents
Scikit-Learn依赖库
NumPy, SciPy, Matplotlib
安装指令
pip install scikit-learn
检查是否安装成功:
#! /usr/bin/env python
# -*- coding: utf-8 -*-
from sklearn.linear_model import LinearRegression #导入线性回归模型
model = LinearRegression()
print(model)
接口
- 所有模型提供的接口:
- model.fit(): 训练模型
- 对于监督模型来说是fit(X,y),对于非监督模型是fit(X)
- 监督模型提供的接口:
- model.predict(X_new):预测新样本
- model.predict_proba(X_new):预测概率,仅对某些模型有用(比如LR)
- model.score():得分越高,fit越好
- 非监督模型提供的接口:
- model.transform(X_new):从数据中学到新的“基空间”
- model.fit_transform():从数据中学到新的基并将这个数据按照这组“基”进行转换
实例数据集
Scikit-Learn本身提供一些实例数据,比较常见的:
- 安德森鸢尾花卉数据集Iris
- 手写图像数据集MNIST
- 世界名人图片数据集Labled Face Worldwide
以上摘自我的读书笔记_《Python数据分析与挖掘实战》
扩展阅读:如何选择合适的算法
更多可参考https://scikit-learn.org/stable/tutorial/machine_learning_map/

本文详细介绍Scikit-Learn的安装配置、常用接口及数据集使用,包括NumPy、SciPy和Matplotlib等依赖库的安装,以及如何利用线性回归模型进行基本操作。文章还提供了如何选择合适算法的扩展阅读资源。
781

被折叠的 条评论
为什么被折叠?



