Sklearn自学历程(一)

本文介绍了Sklearn库的基础知识,包括安装方法、机器学习的基本概念、监督学习与无监督学习的区别、数据集划分、加载示例数据集如Iris,并展示了使用Sklearn进行学习和预测的过程,以及模型的持久化。此外,文章还强调了在使用Sklearn时的一些注意事项,如类型转换和参数更新。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

自学网站

http://scikit-learn.org/stable/tutorial/basic/tutorial.html

关于sklearn

      自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了。scikit-learn简称sklearn,支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。

Sklearn 包含了很多种机器学习的方式:

  • Classification 分类
  • Regression 回归
  • Clustering 非监督分类
  • Dimensionality reduction 数据降维
  • Model Selection 模型选择
  • Preprocessing 数据预处理

  sklearn是Scipy的扩展,建立在NumPy和matplotlib库的基础上。利用这几大模块的优势,可以大大提高机器学习的效率。

sklearn库的安装

windows 系统下通过powershell配置好pip后,输入以下命令安装

pip install sklearn

得到以下结果安装完成

Successfully installed scikit-learn-0.20.0 scipy-1.1.0 sklearn-0.0
You are using pip version 9.0.3, however version 18.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.

也可以直接在配置了Anaconda的环境中使用。

机器学习基础

学习问题

通过分析多个数据样本,尝试预测未知数据的属性及特征。

 

机器学习问题类型

监督学习(supervised learing)

监督学习的经验数据包含有我们想要预测的属性,输入向量与目标值对应,即从已知正确答案的一系列数据中学习经验。

监督学习的分类:

  1. 分类(classifcation):样本数据分为多个类。从已标记的数据集里学习如何标记未分类的数据的类
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值