pycharm sklearn安装_sklearn 入门笔记

本文介绍了机器学习库sklearn的基础知识,包括sklearn的安装、使用示例和基本操作。通过一个简单的鸢尾花数据集分类示例,讲解了数据集划分、模型选择、模型训练和调参的过程。同时,提到了回归和分类问题的区别,并提供了相关资源链接以帮助读者深入学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

v2-964a9cebc6ba6fbfd32c02ece5f988e8_1440w.jpg?source=172ae18b

什么是sklearn

sklearn(全名scikit-learn,sklearn是包名)是一个python的第三方提供强有力的机器学习库,涵盖了了从数据预处理到模型训练的各个方面,能够极大的减少我们的工作量,快速方便的开展机器学习的工作。

官方网址:https://scikit-learn.org/

安装sklearn

如果已经安装好了numpyscipy,可以直接在控制台中输入

pip 

如果没有,则需要先安装numpy和scipy,方法同上

pip install numpy

如果之前并没有一点python经验请看 配置python环境与pycharm:https://blog.youkuaiyun.com/ling_mochen/article/details/79314118

跑一个sample

运行一下这个示例代码,这个代码是加载了sklearn自带的iris的数据集,由Fisher在1936年整理,包含4个特征(Sepal.Length(花萼长度)、Sepal.Width(花萼宽度)、Petal.Length(花瓣长度)、Petal.Width(花瓣宽度)),特征值都为正浮点数,单位为厘米。目标值为鸢尾花的分类(Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),Iris Virginica(维吉尼亚鸢尾))。通过决策树算法构建起对其分类的模型。

from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import metrics
from sklearn.datasets import load_iris
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
iris = load_iris()#加载数据集
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target, test_size=0.3)#划分训练集与测试集
clf = DecisionTreeClassifier()#采用决策树模型
clf.fit(x_train,y_train)#训练模型
predict_target = clf.predict(x_test)#加载测试集
print(sum(predict_target == y_test)) #预测结果与真实结果比对
print(metrics.classification_report(y_test,predict_target))
print(metrics.confusion
### 安装 `sklearn.model_selection` 模块 为了在 PyCharm安装使用 `sklearn.model_selection` 模块,实际上需要安装整个 scikit-learn 库,因为 `model_selection` 是 scikit-learn 的一部分。以下是具体方法: #### 使用 PyCharm 内置工具安装 1. 打开 PyCharm 并进入项目设置。 2. 寻找 "Python Interpreter" 设置项,在这里可以看到当前环境已安装的包列表。 3. 点击右上角的加号 (+) 来添加新的软件包。 4. 在搜索框内输入 `scikit-learn`,选择合适的版本进行安装。 通过这种方式安装后,可以直接使用 `from sklearn.model_selection import train_test_split` 而不会遇到找不到模块的问题[^1]。 #### 处理不同版本间的差异 考虑到不同版本之间的变化,建议编写具有向后兼容性的代码。例如,可以通过检测 scikit-learn 版本来决定导入哪一个子模块: ```python import sklearn if float(sklearn.__version__[2:]) >= 0.20: from sklearn.model_selection import train_test_split, StratifiedKFold else: try: from sklearn.cross_validation import train_test_split from sklearn.cross_validation import StratifiedKFold except ImportError as e: raise Exception("Your version of scikit-learn is too old and does not support the required modules.") ``` 这段代码会先尝试从较新版 (`>=0.20`) 的 scikit-learn 中加载 `train_test_split` 和 `StratifiedKFold` 函数;如果失败,则回退到旧版路径下寻找这些函数。对于非常老的版本 (早于 0.20),则抛出异常提示更新库文件[^2].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值