数据分析入门——scikit-learn模型

scikit-learn模型数据集加载函数解释

在这里插入图片描述
数据集的划分
在这里插入图片描述
k折交叉验证
在这里插入图片描述
划分训练集和测试集的函数在这里插入图片描述

from sklearn.model_selection import train_test_split
train_data,teat_data,train_target,test_target=train_test _split(data['data'],data['target'],test_size=0.2)

sklearn转换器

在这里插入图片描述

from sklearn.preprocessing import minmaxscaler
model=minmaxscaler().fit(train_data)
train_data1=model.transform(train_data)
test_data1=model.transform(test_data)

PCA降维算法
在这里插入图片描述

from sklearn.decomposition import PCA
model=PCA(n_compositions=8).fit(train_data_mms)
train_data2=model.transform(train_data)
test_data2=model.transform(test_data)

使用sklearn构建聚类模型

聚类类型:
在这里插入图片描述
使用k-means聚类:

from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
data=load_iris()
model=KMeans(n_cluster=3).fit(data['data'])
#查看聚类中心
model.cluster_centers_
#使用散点图查看
import maplotlib.pyplot as plt
for i in range(3):
 plt.scatter(data['data'][model.labels_==i,0],data['data'][model.labels_==i,1])
 plt.show()

聚类模型的评价指标
在这里插入图片描述
使用轮廓系数评价那种k的效果最好

from sklearn.datasets import load_iris
from sklearn.metrics import Silhouette_score
for k in range(2,9):
 model=KMeans(n_clusters=k).fit(data['data'])
print(k,silhouette_score(data['data'],model.labels)

在这里插入图片描述

sklearn构建分类模型

在这里插入图片描述
使用支持向量机构建分类模型

#数据导入
#划分训练集、测试集
#模型预处理:查看模型的最大值最小值是否进行标准化、归一化
#分类模型的构建
from sklearn.svm import SVC
model=SVC().fit(x_train2,y_train)
model.predict(x_test2)
#判断模型的准确率
model.score(x_test2,y_test)


分类模型的评价指标
在这里插入图片描述

from sklearn.metrics import recall_score,precision_score,f1_score,roc_curve
print(recall_score(y_test,y_pre))
#roc_curve绘制
fqr,tqr,thresholds=roc_curve(y_test,y_pre)
import matplotlib.pyplot as plt
plt.plot(fpr,tqr)
plt.show()

构建回归模型

在这里插入图片描述
在这里插入图片描述

from sklearn.linear_model import linearRegression
model=linearregression().fit(x_train,y_train)
y_pre=model.predict(x_test)

评价指标
在这里插入图片描述
dd

from sklearn.metrics import mean_squared_error,r2_score
mean_squared_error(y_true=y_test,y_pred=y_pre)
出现这个错误的原因是在导入seaborn包时,无法从typing模块中导入名为'Protocol'的对象。 解决这个问题的方法有以下几种: 1. 检查你的Python版本是否符合seaborn包的要求,如果不符合,尝试更新Python版本。 2. 检查你的环境中是否安装了typing_extensions包,如果没有安装,可以使用以下命令安装:pip install typing_extensions。 3. 如果你使用的是Python 3.8版本以下的版本,你可以尝试使用typing_extensions包来代替typing模块来解决该问题。 4. 检查你的代码是否正确导入了seaborn包,并且没有其他导入错误。 5. 如果以上方法都无法解决问题,可以尝试在你的代码中使用其他的可替代包或者更新seaborn包的版本来解决该问题。 总结: 出现ImportError: cannot import name 'Protocol' from 'typing'错误的原因可能是由于Python版本不兼容、缺少typing_extensions包或者导入错误等原因造成的。可以根据具体情况尝试上述方法来解决该问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [ImportError: cannot import name ‘Literal‘ from ‘typing‘ (D:\Anaconda\envs\tensorflow\lib\typing....](https://blog.youkuaiyun.com/yuhaix/article/details/124528628)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值