pycharm sklearn安装_sklearn 入门笔记

最新推荐文章于 2025-06-17 21:45:17 发布

weixin_39716800

最新推荐文章于 2025-06-17 21:45:17 发布

阅读量7.2k

点赞数 1

文章标签： pycharm sklearn安装 python安装sklearn sklearn保存svm分类模型

本文介绍了机器学习库sklearn的基础知识，包括sklearn的安装、使用示例和基本操作。通过一个简单的鸢尾花数据集分类示例，讲解了数据集划分、模型选择、模型训练和调参的过程。同时，提到了回归和分类问题的区别，并提供了相关资源链接以帮助读者深入学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

v2-964a9cebc6ba6fbfd32c02ece5f988e8_1440w.jpg?source=172ae18b

什么是sklearn

sklearn（全名scikit-learn，sklearn是包名）是一个python的第三方提供强有力的机器学习库，涵盖了了从数据预处理到模型训练的各个方面，能够极大的减少我们的工作量，快速方便的开展机器学习的工作。

官方网址：https://scikit-learn.org/

安装sklearn

如果已经安装好了numpy和scipy，可以直接在控制台中输入

pip

如果没有，则需要先安装numpy和scipy，方法同上

pip install numpy

如果之前并没有一点python经验请看 配置python环境与pycharm：https://blog.youkuaiyun.com/ling_mochen/article/details/79314118

跑一个sample

运行一下这个示例代码，这个代码是加载了sklearn自带的iris的数据集，由Fisher在1936年整理，包含4个特征（Sepal.Length（花萼长度）、Sepal.Width（花萼宽度）、Petal.Length（花瓣长度）、Petal.Width（花瓣宽度）），特征值都为正浮点数，单位为厘米。目标值为鸢尾花的分类（Iris Setosa（山鸢尾）、Iris Versicolour（杂色鸢尾），Iris Virginica（维吉尼亚鸢尾））。通过决策树算法构建起对其分类的模型。

from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn import metrics
from sklearn.datasets import load_iris
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
iris = load_iris()#加载数据集
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target, test_size=0.3)#划分训练集与测试集
clf = DecisionTreeClassifier()#采用决策树模型
clf.fit(x_train,y_train)#训练模型
predict_target = clf.predict(x_test)#加载测试集
print(sum(predict_target == y_test)) #预测结果与真实结果比对
print(metrics.classification_report(y_test,predict_target))
print(metrics.confusion