
python
文章平均质量分 60
<编程路上>
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python使用邮箱
开启smtp服务,同时会给你一个密码,记着保存。使用后可以成功发送邮件。原创 2022-10-19 21:06:29 · 1302 阅读 · 0 评论 -
机器学习数据集读取和预处理
其二则是因为相比实用函数,sklearn中的评估器其实会有一个非常便捷的串联的功能,sklearn中提供了Pipeline工具能够对多个评估器进行串联进而组成一个机器学习流,从而简化模型在重复调用时候所需代码量,因此通过评估器的方法进行数据标准化,其实是一种更加通用的选择。在之前的内容中我们曾介绍了关于连续变量标准化和归一化的相关内容,对连续变量而言,标准化可以消除量纲影响并且加快梯度下降的迭代效率,而归一化则能够对每条数据进行进行范数单位化处理,我们可以通过下面的内容进行标准化和归一化相关内容回顾。原创 2022-09-18 16:17:15 · 2228 阅读 · 0 评论 -
sklearn标签转换
是一个可以用来将标签规范化的工具类,它可以将标签的编码值范围限定在[0,n_classes-1].。它也可以用于非数值型标签的编码转换成数值标签。原创 2022-09-09 11:18:54 · 548 阅读 · 0 评论 -
seaborn学习3:relplot
此函数提供对一些不同轴级别函数的访问,这些函数通过子集的语义映射显示两个变量之间的关系。这些变量可以是类别变量或者数值型变量,尽管颜色映射在后面的情况中会有不同的表现。这些变量可以是类别变量或者数值型变量,尽管尺寸映射在后面的情况中会有不同的表现。此函数提供对一些不同轴级别函数的访问,这些函数通过子集的语义映射显示两个变量之间的关系。为数值型时,此变量也可以是指定最小和最大尺寸的元组,这样可以将其他值标准化到这个范围。变量为数值型时,用于数据单元的 colormap 的标准化。变量的不同级别的颜色。原创 2022-09-08 18:41:07 · 555 阅读 · 0 评论 -
seaborn学习2:displot()
除了直方图和核密度估计值 (KDE) 之外,还可以绘制经验累积分布函数 (ECDF)此函数提供了对多种方法的访问,用于可视化数据的单变量或二变量分布,包括由语义映射和跨多个子图的分面定义的数据子集。可以是可分配给命名变量的长格式向量集合,也可以是将在内部重塑的宽格式数据集。用于在映射语义时选择要使用的颜色的方法。不使用色相映射时的单色规范。列表或字典值表示分类映射,而色彩映射表对象表示数字映射。指定 x 轴和 y 轴上位置的变量。映射以确定绘图元素颜色的语义变量。定义要在不同方面绘制的子集的变量。原创 2022-09-08 16:02:59 · 3784 阅读 · 0 评论 -
seaborn学习1
Seaborn 是一个基于 matplotlib 且数据结构与 pandas 统一的统计图制作库。原创 2022-09-08 14:59:06 · 2181 阅读 · 0 评论 -
独热编码和自然数编码
验证码中分别有大写字母,小写字母以及数字组成,总共为62个符号,如果使用自然数编码的话,那么进行四位验证码的分类识别的话,神经网络的输出层为62的四次方,而使用独热编码的话则输出层为62*4。独热编码即 One-Hot 编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。表示一名中国的女生,One-Hot 编码为:[10001]国籍特征:[‘中国’, ‘美国’, ‘法国’]国籍特征:[‘中国’, ‘美国’, ‘法国’]原创 2022-09-05 22:47:04 · 780 阅读 · 0 评论 -
torch.argmax()使用
参数:input (Tensor) – 输入的Tensor矩阵dim (int) – dim表示不同维度。特别的在dim=0表示二维矩阵中的列,dim=1在二维矩阵中的行。广泛的来说,我们不管一个矩阵是几维的,比如一个矩阵维度如下:(d0,d1,…,dn−1) ,那么dim=0就表示对应到d0 也就是第一个维度,dim=1表示对应到也就是第二个维度,以此类推。原创 2022-08-24 17:32:29 · 391 阅读 · 0 评论 -
pytorch图像识别,识别rice-image-dataset数据集。
水稻是世界范围内生产最广泛的粮食产品之一,具有许多遗传品种。这些品种由于其某些特征而彼此分离。这些通常是纹理、形状和颜色等特征。有了这些区分水稻品种的特征,就可以对种子的质量进行分类和评估。在这项研究中,使用了Arborio,Basmati,Ipsala,Jasmine和Karacadag,它们是土耳其经常种植的五种不同品种的水稻。数据集中共包含 75,000 张颗粒图像,其中每个品种有 15,000 张。原创 2022-08-23 21:13:22 · 1546 阅读 · 0 评论 -
tqdm使用
desc进度条的前缀。预期迭代次数。如果未指定,则尽可能使用 len(可迭代)。如果 float(“inf”) 或作为最后的手段,则仅显示基本进度统计信息(无 ETA,无进度条)。如果 gui 为 True 并且此参数需要后续更新,请指定一个初始任意大正数,例如 9e9。ncols:整个输出消息的宽度。如果指定,则动态调整进度条的大小以保持在此范围内。:最小进度显示更新间隔 [默认:0.1] 秒。最大进度显示更新间隔 [默认:10] 秒。原创 2022-08-23 20:09:47 · 432 阅读 · 0 评论 -
pytorch神经网络对Excel数据集进行处理2.0(读取,转为tensor格式,归一化),并且以鸢尾花(iris)数据集为例,实现BP神经网络
第一版本可以看第二版本与1.0不一样的地方是使用了Dataset进行预处理数据,使用起来更加方便,同时使用了SummaryWriter保存准确率数据。其中SummaryWriter使用方法看:我将以鸢尾花数据集作为例子进行展示:可以看到鸢尾花数据集有四个特征,分别是0,1,2,3,label是鸢尾花种类,共三种,分别以0,1,2表示。原创 2022-08-22 20:40:00 · 6755 阅读 · 13 评论 -
SummaryWriter基本使用
其中对img_tensor的形状有要求,而默认格式是(3,H,W)即通道(channel)为3,H为高度,W为宽度,不是格式需要使用。img_tensor :图片数据,类型要求为Tensor,numpy,string/blobname。dataformats:不是(3,H,W)形式用此参数。global_step:要记录的全局步长值。scalar_value:x轴数据。global_step:y轴数据。输入参数为保存到哪个文件夹。原创 2022-08-22 20:17:27 · 8269 阅读 · 7 评论 -
pytorch图像识别(基于识别验证码),读取数据集图片以及使用神经网络进行训练
图像数据集为10000张验证码图片,图片每次为验证码内容加数字(后面加入0-10000的数字是为了防止出现一样的验证码):读取文件使用os模块:接下来需要加上路径,这样一会处理的话就可以直接读取每张图片:图片读取功能完成了。首先验证码范围为(0-9,a-z,A-Z),这些装入列表中:图片类型为,需要获取其中的,我将使用正则表达式:后续为转为数字(就是每个符号在符号列表的位置):转为one hot编码:dataset.pymodel_one.py训练:测试我的测试集是500原创 2022-08-21 14:31:41 · 2918 阅读 · 3 评论 -
python PIL生成验证码
想做一下验证码的图像识别,所以自己生成验证码图片来做数据集。原创 2022-08-20 10:25:50 · 699 阅读 · 0 评论 -
python PIL基本使用
使用jupyter前添加配置。原创 2022-08-19 20:07:38 · 555 阅读 · 0 评论 -
Python JSON
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。原创 2022-08-18 14:46:15 · 115 阅读 · 0 评论 -
Python isinstance() 函数
isinstance() 函数来判断一个对象是否是一个已知的类型,类似 type()。classinfo – 可以是直接或间接类名、基本类型或者由它们组成的元组。object – 实例对象。原创 2022-08-18 14:27:42 · 216 阅读 · 0 评论 -
Python eval() 函数
globals – 变量作用域,全局命名空间,如果被提供,则必须是一个字典对象。locals – 变量作用域,局部命名空间,如果被提供,可以是任何映射对象。eval() 函数用来执行一个字符串表达式,并返回表达式的值。expression – 表达式。返回表达式计算结果。...原创 2022-08-18 14:25:00 · 175 阅读 · 0 评论 -
Python enumerate() 函数
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。sequence – 一个序列、迭代器或其他支持迭代对象。返回 enumerate(枚举) 对象。start – 下标起始位置的值。...原创 2022-08-18 14:20:31 · 110 阅读 · 0 评论 -
Python divmod() 函数
python divmod() 函数把除数和余数运算结果结合起来,返回一个包含商和余数的元组(a // b, a % b)。原创 2022-08-18 14:16:48 · 236 阅读 · 0 评论 -
Python filter() 函数
该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判断,然后返回 True 或 False,最后将返回 True 的元素放到新列表中。iterable – 可迭代对象。function – 判断函数。...原创 2022-08-18 14:14:25 · 169 阅读 · 0 评论 -
python异常处理
try的工作原理是,当开始一个try语句后,python就在当前程序的上下文中作标记,这样当异常出现时就可以回到这里,try子句先执行,接下来会发生什么依赖于执行时是否出现异常。异常即是一个事件,该事件会在程序执行过程中发生,影响了程序的正常执行。当Python脚本发生异常时我们需要捕获处理它,否则程序会终止执行。一般情况下,在Python无法正常处理程序时就会发生一个异常。异常是Python对象,表示一个错误。该博客参照了菜鸟驿站相关介绍。......原创 2022-08-18 12:55:58 · 86 阅读 · 0 评论 -
python修饰符
修饰符对应的函数不需要实例化,不需要 self 参数,但第一个参数需要是表示自身类的 cls 参数,可以来调用类的属性,类的方法,实例化对象等。将某函数,做为属性使用,加了@property后,可以用调用属性的形式来调用方法,后面不需要加()。修饰符的内嵌函数的参数跟被修饰的函数参数相同,内嵌函数的返回值跟被修饰函数的定义表达式一样.是把函数嵌入到类中的一种方式,函数就属于类,同时表明函数不需要访问这个类。修饰符必须出现在函数定义前一行,不允许和函数定义在同一行;使用修饰服,修饰方法,不需要实例化。...原创 2022-08-16 13:25:48 · 570 阅读 · 0 评论 -
python使用mongoDB
就是说,数据库创建后要创建集合(数据表)并插入一个文档(记录),数据库才会真正创建。就是说,创建集合(数据表)后要再插入一个文档(记录),集合才会真正创建。方法来删除一个文档,该方法第一个参数为查询对象,指定要删除哪些数据。该方法第一个参数为查询的条件,第二个参数为要修改的字段。该方法第一个参数为查询的条件,第二个参数为要修改的字段。方法来删除多个文档,该方法第一个参数为查询对象,指定要删除哪些数据。方法第一个参数为要排序的字段,第二个字段指定排序规则,方法可以查询集合中的所有数据,类似 SQL 中的。..原创 2022-08-15 09:08:50 · 1808 阅读 · 0 评论 -
python使用正则表达式
import re。原创 2022-08-12 22:03:13 · 418 阅读 · 0 评论 -
torch模块常用方法总结
对输入张量input逐元素加上标量值value,并返回结果到一个新的张量out,即 out=tensor+value。输出1维张量的长度为steps。用标量值value乘以输入input的每个元素,并返回一个新的结果张量。返回一个张量,包含了从区间[0,1)的均匀分布中抽取的一组随机数,形状由可变参数sizes 定义。返回输入张量给定维度每行的中位数,同时返回一个包含中位数的索引的LongTensor。返回一个新张量,包含输入input张量每个元素的floor,即不小于元素的最大整数。......原创 2022-08-07 21:12:42 · 2227 阅读 · 0 评论 -
Numpy介绍
使用之前需要导入NumpyNumPy 的主要对象是同构多维数组。它是一个元素表(通常是数字),所有类型都相同,由非负整数元组索引。在 NumPy 中,维度称为轴。 例如,3D 空间中一个点的坐标[1, 2, 1]只有一个轴。该轴有 3 个元素,因此我们说它的长度为 3。在下图中的示例中,数组有 2 个轴。第一个轴的长度为 2,第二个轴的长度为 3。NumPy 的数组类称为ndarray。它也被称为别名 array。请注意,numpy.array这与标准 Python 库类不同array.array,后者仅原创 2022-08-07 14:46:55 · 1414 阅读 · 0 评论 -
sklearn实现决策树,随机森林,逻辑回归,KNN,贝叶斯,SVM,以葡萄干数据集为例
介绍为:就是将图片通过一定方法提取出7个特征,分别为:同时葡萄干种类为两种,分别为Kecimen 和 Besni。可以看一眼数据集部分数据:其中该数据集是2020年发表的外文文献:Classification of Raisin Grains Using Machine Vision and Artificial该文献使用的是三种方法,分别为LR,MLP,SVM,准确率如下:我将采用不同机器学习的方法进行使用。........................原创 2022-08-05 12:17:44 · 3964 阅读 · 3 评论 -
cu116安装gpu版pytorch
安装前在AnacondaPrompt中输入。原创 2022-07-28 20:25:03 · 2234 阅读 · 0 评论 -
协程代码模板(基于爬虫)
}{}{}该代码是访问六个网页并且将源代码保存到本地文件协程的基本使用格式就是上面的。原创 2022-07-27 16:38:19 · 174 阅读 · 0 评论 -
logging基本使用
但是在实际的工程项目中,我们需要保存程序运行的日志,以排查程序在某一个时候崩溃的具体原因,以便及时定位Bug进行抢救,而在Python中,logging就可以十分灵活的帮助我们记录程序运行的过程的中的一些信息。会发现debug,info不会输出,这是因为logging模块提供的日志记录函数所使用的日志器设置的日志级别是WARNING,因此只有WARNING级别的日志记录以及大于它的ERROR和CRITICAL级别的日志记录被输出了,而小于它的DEBUG和INFO级别的日志记录被丢弃了。...原创 2022-07-27 09:42:23 · 254 阅读 · 0 评论 -
pytorch神经网络对Excel数据集进行处理(读取,转为tensor格式,归一化),并且以鸢尾花(iris)数据集为例,实现BP神经网络
最近跟导师做的项目是关于BP,LSTN神经网络的,数据集对象是一些Excel表格类型的,我使用pytorch进行训练,读取Excel表格数据的时候统一进行一些处理,使用我想把它封装到函数,以后处理其它数据集不就方便了吗。可以看到鸢尾花数据集有四个特征,分别是0,1,2,3,label是鸢尾花种类,共三种,分别以0,1,2表示。使用方法很简单,输入为特征值,标签,划分比例,是否打乱,返回值为训练集,测试集的特征值和标签。,输入为Excel名字,返回值为numpy类型的特征值和标签。.........原创 2022-07-19 22:48:56 · 16318 阅读 · 7 评论 -
pandas处理Excel基本方法
学习总结主要参考了视频内容主要总结了使用pandas处理Excel表格,以及将Excel数据显示为图表。情况1第一行为脏数据,不需要可以使用情况2没有columns名字。原创 2022-07-18 23:05:31 · 13222 阅读 · 0 评论 -
pytorch设置batch
使用pytorch进行数据网络训练时,数据集可能有上万条数据,训练的话比较浪费时间,设置batch,一次训练一个batch_size的大小,既节省时间,又可以使数据集快速收敛。使用前需要导入包:设置batch,需要将训练数据的输入属性和标签放入DataLoader中,见下:使用时调用即可:进行神经网络训练用下面方法:enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。......原创 2022-07-02 07:50:55 · 10193 阅读 · 1 评论 -
NP10 投递简历(del,pop,remove使用)
描述毕业季到了,牛牛为了找工作准备了自己简历,以及投递公司的列表company_list,其中包括了字符串 ‘Alibaba’, ‘Baidu’, ‘Tencent’, ‘MeiTuan’, ‘JD’ 作为他投递简历的目标公司。请向列表中每个公司发送一条消息类似 ‘Hello Alibaba, here is my resume!’。然而,遗憾的是Alibaba、Tencent、MeiTuan、JD都没有通过牛牛的简历审核,只有Baidu回复了他,邀请他去参加面试。因此你需要:使用 del() 函数原创 2022-06-28 11:46:01 · 179 阅读 · 0 评论 -
python列表创建
可以看,讲解了列表的各种函数创建空列表:创建二维空列表:创建二维列表:创建了一个6*6列表原创 2022-06-28 18:57:53 · 395 阅读 · 0 评论