基本机器学习sklearn接口

本文介绍了使用Python的Sklearn库实现的12种常见机器学习算法,包括线性回归、逻辑回归、K近邻分类、支持向量机、朴素贝叶斯、决策树、K-means聚类、随机森林、梯度提升决策树、PCA降维和XGBoost等,详细展示了每种算法的接口调用过程和实例代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

下面列举了常见的机器学习算法的sklearn接口。

1、LinearRegression

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression #线性回归
iris = load_iris() #加载数据集
X,y = iris.data,iris.target #(150,4)
train_X,test_X,train_y,test_y = train_test_split(X,y,test_size=0.2,random_state=2020) #划分训练集和测试集
model = LinearRegression() #线性回归模型
model.fit(train_X,train_y) #模型训练
predict_y = model.predict(test_X) #模型预测
score = model.score(test_X,test_y) #模型评估,R2 score
print(predict_y)
print(test_y)
print(score)

在这里插入图片描述

2、LogisticRegression

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
iris = load_iris()
X,y = iris.data, iris.target
train_X,test_X,train_y,test_y = train_test_split(X,y,test_size=0.2,random_state=2020)
model = LogisticRegression()
model.fit(train_X,train_y)
predict_y = model.predict(test_X) #模型预测,predict是训练后返回预测结果,是标签值。
#predict_y_prob = model.predict_proba(test_X)#predict_proba返回的是一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。
score = model.score(test_X,test_y) #模型评估,R2 score
print(predict_y)
#print(predict_y_prob)
print(test_y)
print(score)

在这里插入图片描述

3、KNeighborsClassifier

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
iris = load_iris()
X,y = iris.data, iris.target
train_X,test_X,train_y,test_y = train_test_split(X,y,test_size=0.2,random_state=2020)
model = KNeighborsClassifier(n_neighbors=1)
model.fit(train_X,train_y)
predict_y = model.predict(test_X) #模型预测
#predict_y_prob = model.predict_proba(test_X)#输出每一类的概率[为0类的概率,为1类的概率,为2类的概率]
score = model.score(test_X,test_y) #模型评估,R2 score
Sklearn,也称为scikit-learn,是一个针对Python编程语言的免费软件机器学习库。它是由数据科学家David Cournapeau在2007年发起的项目,旨在与Python的数值科学库NumPy和SciPy联合使用。Sklearn提供了一系列简单高效的工具,用于预测数据分析,并且可以在各种情况下重复使用。它是一个开源框架,可以在商业环境中使用,采用BSD许可证。Sklearn建立在NumPy、SciPy、Pandas和Matplotlib之上,提供了简单易用的API接口,非常适合新手上路。Sklearn是一个专门用于机器学习的包,包括有监督学习和无监督学习的任务模块,以及一个数据引入模块。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [Py之scikit-learn:机器学习sklearn库的简介、六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/...](https://blog.youkuaiyun.com/qq_41185868/article/details/79682338)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [sklearn机器学习](https://blog.youkuaiyun.com/weixin_57437047/article/details/129713003)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值