自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 第6关:模型评估-量化预测效果

average:当涉及到二分类/多分类/多标签等不同的问题时,可以通过设置该参数指定计算方式,可取的值包括[None, ‘binary’ (default), ‘micro’, ‘macro’, ‘samples’, ‘weighted’]。1.评估二分类模型:训练数据集为二类别数据,通过构建简单的svm模型(初始化模型在代码中已给出),对测试数据进行预测,并返回模型正确分类的样本个数、正类的预测准确率、正类的召回率、正类的f值。参数的值为正类标签或负类标签,指定计算的是正类还是负类。

2025-03-27 09:02:06 534

原创 第5关:模型持久化

dumpModel()函数中首先需要打开local_file文件,并开启写入模式,再使用pickle模块将模型存储下来,loadModel()函数中也需要先打开local_file文件,开启读取模式,再使用pickle将local_file文件中存储的模型load至模型变量中,再使用该模型预测。当数据量很大的时候,训练一个模型需要消耗很大的时间成本,每次都重新训练模型预测是非常冗余且没有必要的,我们可以将训练模型存储下来,每当要预测新数据的时候只需加载该模型。#打开本地file文件,并开启写模式。

2025-03-27 09:00:16 627

原创 第4关:使用scikit-learn分类器SVM对digits数据分类

估计器的结构可以通过初始化模型时设置的参数决定,但目前,我们将估计器看做一个黑盒子,先不关心具体的参数设置。从预测集的图像可以看出,并不是完全预测正确,这一点是很正常的,说明使用默认的svc训练模型的无法完全将测试集正确分类,可以通过调整模型的参数使分类更准确,大家可以尝试下设置参数gamma=0.001重新训练模型并预测看是否准确。digits数据集中包含大量的数字图片,如下图所示,我们希望给定其中的一张图片,能识别图中代表的数字,这是一个分类问题,数字0…predicted - 测试数据预测分类值。

2025-03-27 08:58:48 611

原创 第3关:文本数据特征提取

采用fetch_20newsgroups("./",subset='train', categories=categories)函数加载对应目录的新闻数据,subset='train'指定采用的是该数据的训练集,categories 指定新闻目录,具体的函数调用可参考官方文档fetch_20newsgroups。注意:transform函数的返回结果是一个矩阵(sparse matrix),为了更好的表示数据,采用toarray()将数据转化为numpy数组,注意接下来的编程任务中也要转化为一个数组。

2025-03-27 08:30:22 516

原创 第2关:数据预处理 — 标准化

代码中已通过fetch_california_housing函数加载好了数据集,California housing数据集包含8个特征,分别是['MedInc', 'HouseAge', 'AveRooms', 'AveBedrms', 'Population', 'AveOccup', 'Latitude', 'Longitude'],可通过dataset.feature_names访问数据具体的特征名称,通过在上一关卡的学习,相信大家对于原始数据的查看应该比较熟练了,在这里不过多说明。

2025-03-27 08:28:07 647

原创 第1次实验 Python机器学习软件包Scikit-Learn的学习与运用

这些标准数据集采用类字典的对象格式存储,比如.data表示原始数据,是一个(n_samples,n_features)二维数组,通过.shape可以得到二维数组大小,.target表示存储数据类别即标签。scikit-learn包括一些标准数据集,不需要从外部下载,可直接导入使用,比如与分类问题相关的Iris数据集和digits手写图像数据集,与回归问题相关的波士顿房价数据集。#加载并返回波士顿房价数据集(回归)#加载并返回iris数据集(分类)X - 前5条训练特征数据。#加载并返回数字数据集(分类)

2025-03-27 08:24:06 360

原创 第4关:寻找反素数

输出格式 一行内输出从小到大排列的小于这个数的所有反素数,每个数字后面一个空格。反素数是指一个将其逆向拼写后也是一个素数的非回文数。根据提示,在右侧编辑器补充代码,完善寻找反素数的小程序。本关任务:编写一个寻找反素数的小程序。都是素数且均不是回文数,所以。,输出从小到大顺序输出小于。开始你的任务吧,祝你成功!输入格式 输入一个正整数。

2024-05-24 15:53:26 875 1

原创 第3关:寻找回文素数

请你在一行内输出从小到大排列的小于这个数的所有回文素数,每个数字后面一个空格。输出格式 一行内输出从小到大排列的小于这个数的所有回文素数,每个数字后面一个空格。如果一个整数是素数,同时其对应的字符串是回文字符串时,便称其为回文素数。既是素数,其对应的字符串“131”又是回文字符串,所以。根据提示,在右侧编辑器补充代码,完善寻找回文素数的小程序。本关任务:编写一个能寻找回文素数的小程序。开始你的任务吧,祝你成功!输入格式 输入一个正整数。

2024-05-24 15:47:46 791 1

原创 第2关:输出N以内的所有素数 python

根据提示,在右侧编辑器补充代码,计算并输出N以内的所有素数的程序。本关任务:编写一个能输出N以内的所有素数的小程序。输出格式 在同一行中从小到大依次输出不大于。的全部素数,每个数字后面一个空格。开始你的任务吧,祝你成功!输入格式 输入一个正整数。

2024-05-24 15:31:40 887 1

原创 第1关:素数判定 python 头歌

输出格式: 若该数为素数,输出“X是素数” 若该数为非素数,输出“X不是素数” 其中X为输入的整数。将素数的判定代码定义为一个函数,接受用户输入的正整数。根据提示,在右侧编辑器补充代码,进行素数判定的小程序。本关任务:编写一个能进行素数判定的小程序。并调用该函数判定用户输入的一个正整数。编程实现判定用户输入的一个正整数。输入格式: 输入一个正整数。开始你的任务吧,祝你成功!

2024-05-24 15:16:39 3352 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除