
数据预处理
文章平均质量分 67
XC___XC
这个作者很懒,什么都没留下…
展开
-
【解决】error: Microsoft Visual C++ 14.0 is required,提示安装包丢失或损坏
前言亲测有效,转自 https://www.cnblogs.com/yangx124/p/15660771.html我之前是为了不想下载几个G的tools,然后就按照网上的其他教程安装了各种各样的tools但是都没有用,还是会报上面的错误,然后多出了很多的tools的文件,我冲动了一下,把这些都给卸掉了,然后就出现了上述的错误这种情况吃的亏也出现过好几次了,下次卸载这种东西的时候一定要好好考虑清楚再来【哭泣!!!】下载直接从网盘上下载,解压后安装即可。永久有效。链接:https://pan.b原创 2021-12-08 22:34:29 · 1127 阅读 · 0 评论 -
【神经网络可视化】——hiddenlayer、torchviz、Tensorboard、wandb可视化训练过程
前言本文参考极市平台的推文,出自知乎的一位锦恢的作者,使用并改写而来,链接如下:PyTorch下的可视化工具(网络结构/训练过程可视化)改写内容:将可视化方法应用在 ResNet 上,并展现出了灵活的可嵌入性。仅作为笔记分享,如有侵权,请联系删除。1. Graphviz可视化神经网络的库 hiddenlayer 和 torchviz 都是基于 Graphviz 开发的, 使用前必须先安装提示一下:Graphviz比较小,只有5M不到,放心安装,安装过程也比较简单下载路径:https://ww原创 2021-10-27 20:45:32 · 3958 阅读 · 2 评论 -
简单实现K_means聚类分析
聚类分析简单的理解下聚类分析,我们现在平面上生成一些随机点(x,y),每个点都有不同的位置,现在设定一个需求,就是将这些点分成K类,该怎么去分?K_means聚类分析有很多种方法,这里我们使用K_means方法简单实现,K_means的原理如下所示:设置类的个数,即K的值,必须提前知道我们要分成几类。在随即点位的内部,根据算法随机生成K类的中心点,当然,这个中心点位并不准确,需要多次迭代。在平面范围内,依次判断每个点距离最近的中心点,并将该点设置为该中心点的类中。依次判断平面内的所有原创 2021-06-02 17:39:15 · 511 阅读 · 0 评论 -
通过坐标点位,计算多边形面积
多边形面积本文使用三角形面积累计法计算多边形面积,就是将多边形按照一个顶点,分割成多个三角形,计算三角形的面积,累加,得到多边形的面积。当然,这个算法也有一些缺点,当这个多边形比较奇怪的时候,不能将多边形按照一个顶点分割成多个三角形面积之和,比如:本文先按照常规的多边形进行处理,特殊情况之后再分析。栗子由于基本的测量点位坐标都是dat文本格式的,本文采用读取txt/dat格式的文本点位数据,更符合测量的操作。data的数据如下所示:这里简单以五个点组成的五边形为例,保存到path中。d原创 2021-06-03 14:51:27 · 3192 阅读 · 0 评论 -
目标检测数据集格式转换( xml - txt )和( txt - xml ),以及图像标签的对应裁剪
前言在目标检测数据集的制作上,我们保存的标签格式基本是xml格式的,但是在yolov5等网络模型中,我们使用的是txt的标签格式,需要进行相互转换。还有一些其他的用处,需要修改相关的xml的标签数据,这里写了一个脚本,用来修改我们的标签数据。xml to txt直接修改输入和输出的路径,以及修改一下自己的保存格式即可,还设置了一个归一化的可选的操作,直接看代码即可。写的粗糙了点,需要改的你们自己改就行。import osfrom lxml import etree#设置输入的xml文件夹,原创 2021-10-19 16:07:25 · 4155 阅读 · 1 评论 -
RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.cuda.HalfTensor) should be.
device首先是查看输入的两个数据的device是否一致,出现这种情况的原因可能是因为device不同导致的,可能在不同的GPU上。device = torch.device("cuda" if torch.cuda.is_available() else "cpu")data.to(device)通过这个设定一个device,然后将data转到device中,然后debug查看数据的device是否相同。type在我这里,我的两个输入数据是在同一个cuda中,但是还是出错了,通过查看数据原创 2021-10-16 17:34:20 · 19563 阅读 · 2 评论 -
python基础——常见的一些基础题
目录一、前言二、笔记1. 从hello world开始一、前言在整理之前的一些笔记的时候,发现了这个文件,之前是保存在本地,但是经常忘记放在哪了,主要是一些基础,现在就想记录在博文里。都是一些简单的基础题,还有一些容易遗忘的知识点,稍微记录以下。二、笔记1. 从hello world开始各种print字符串的方法,format的用法,以及简便的使用方法s = 'hello world' print(s) #输出字符print (s[2]) #输出字符的第三个字母原创 2021-08-12 11:45:54 · 1237 阅读 · 3 评论 -
【数值分析】欧拉、高斯、神经网络反向传播的迭代方法
数学这里记录一下数值分析课程的一些数学方法的代码,相当于课程作业或者笔记吧。欧拉迭代法#1 迭代公式def fun(xn,xn_1,yn,h): yn = yn + (h/2)*((xn - yn) + (xn_1 - yn - h*(xn - yn ))) return yn#2 已知参数xn = 0yn = 0h = 0.1#3 迭代过程for i in range(30): xn_1 = xn + h*(i+1) xn = xn + i*h原创 2021-05-26 17:29:25 · 1562 阅读 · 0 评论 -
python批量更改文件名——os.renames(old, new)用法
os.renames(old, new)官方的解释:Super-rename; create directories as necessary and delete any left empty. Works like rename, except creation of any intermediate directories needed to make the new pathname good is attempted first. After the rename, dir原创 2021-06-03 14:45:05 · 2307 阅读 · 0 评论 -
【爬虫】——requests、selenium的常用爬取和保存操作
一些简单的API就是在日常的学习中,经常用到的一些简单的API,在这里做一个小的总结,仅作为笔记使用。读取测量点位数据import revertices = []VERTICES_FILE = "vertices.txt"with open(VERTICES_FILE, "r", encoding="utf-8") as fr: seq = re.compile(",") for d in fr.readlines(): # 读取出来的数据d为字符串,需切割后原创 2021-05-26 16:27:39 · 452 阅读 · 1 评论 -
数据预处理和数据集的设置——以目标检测数据集为例
数据集在网上有很多可用的公开的数据集,根据自己的需要,下载相应的数据集,可以用来训练网络,测试网络模型的精度。[转载]深度学习中的遥感影像数据集转载的一篇包含了比较多的数据集的一篇博文,可以参考一下。但有些时候,我们需要根据我们自己的需求,根据自己的研究方向和类型,设置自己的数据集,以下,简单的阐述了设置数据集的一些步骤。创建数据集在pytorch中,官方文档简单的介绍了创建数据集的简单步骤。# =================================================原创 2021-06-25 20:16:19 · 2323 阅读 · 0 评论