[机器学习]Scikit-Learn学习笔记01——Scikit-Learn基础概念

本文介绍了sklearn(scikit-learn),一个基于NumPy、SciPy和Matplotlib的Python机器学习库。文章概述了如何通过pip安装sklearn,并提供了官方推荐的流程图帮助读者根据具体任务选择合适的算法,包括监督学习(分类与回归)、非监督学习(聚类)及降维算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概念

1.sklearn是一个Python第三方提供的非常强力的机器学习库

2.scikit-learn是一个基于NumPy,SciPy,Matplotlib的开源学习工具包

3. 在数据量不是过大的情况下,可以解决大部分问题.

安装

安装 Scikit-learn (sklearn) 最简单的方法就是使用 pip或者用PyCharm或者 Anaconda 安装它.在安装前,要确保电脑已经安装了Numpy和Scipy

PIP使用方法

# python 2+ 版本复制:pip install -U scikit-learn

# python 3+ 版本复制:pip3 install -U scikit-learn

使用方法

不要直接去用,先了解一下都有什么模型方法,然后选择适当的方法,来达到你的目标。Sklearn 官网提供了一个流程图, 蓝色圆圈内是判断条件,绿色方框内是可以选择的算法:

640?wx_fmt=jpeg

图中,可以看到算法分为两类四大块

监督学习

每个数据对应一个 label

1.分类算法  

2.回归算法

非监督学习

只有数据,而没有与数据相对应得label

3.聚类算法

降维算法当数据集有很多很多属性的时候,可以通过 降维 算法把属性归纳起来.例如 20 个属性只变成 2 个,注意,这不是挑出 2 个,而是压缩成为 2 个,它们集合了 20 个属性的所有特征,相当于把重要的信息提取的更好,不重要的信息就不要了。在了解算法之后,然后看问题属于哪一类问题,是分类还是回归,还是聚类,就选择相应的算法。 当然还要考虑数据的大小,例如 100K 是一个阈值。如图中所显示的一样.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值