- 博客(45)
- 收藏
- 关注
原创 yolo格式批量修改类别
本教程详细介绍了如何使用提供的 Python 脚本批量修改 YOLO 格式标注文件中的类别标签。通过配置路径和运行脚本,您可以快速将指定目录下所有 .txt 文件中的类别 ID 从 3 改为 0。请确保在操作前备份数据,并根据实际需求调整脚本。
2025-04-03 19:17:28
381
原创 教程:如何使用 JSON 合并脚本
本教程将指导您如何使用提供的 Python 脚本将多个 COCO 格式的 JSON 标注文件合并为一个单独的 JSON 文件。该脚本会自动处理 image id(图像 ID)、bbox id(标注 ID)和 category id(类别 ID),确保合并后的文件中的 ID 是唯一且连续的。
2025-04-03 18:59:28
446
原创 图像数据增强教程:为目标检测任务准备数据
在目标检测任务中,数据增强是一种关键技术,通过对原始图像应用多种变换来增加训练数据的多样性,从而提升模型的泛化能力。本教程将详细讲解一个基于 Python 和 OpenCV 的图像数据增强工具,专为目标检测任务设计。该工具支持旋转、平移、裁剪、翻转、亮度调整、噪声添加和 Cutout 等增强方法,并能自动调整边界框(Bounding Box)坐标。
2025-03-29 16:27:01
899
原创 提取 VOC 数据集标签类别
VOC(PASCAL Visual Object Classes)是一个经典的计算机视觉数据集,广泛用于物体检测任务。其标注文件通常采用 XML 格式,包含图像中的物体类别、边界框坐标等信息。本教程将通过一个示例代码,展示如何使用 Python 的 xml.dom.minidom 模块读取 VOC 数据集的 XML 文件,并提取所有唯一的标签类别。
2025-03-26 15:38:01
274
原创 使用 pycocotools 统计 COCO 标注每个类别的图像数量和标注框数量。
COCO(Common Objects in Context)是一个广泛用于计算机视觉任务(如物体检测、实例分割)的数据集格式。pycocotools 是一个 Python 库,专门用于加载和操作 COCO 数据集的标注文件(通常是 JSON 格式)。本教程将通过一个示例代码,展示如何使用 pycocotools 加载 COCO 标注文件,提取类别信息,并统计每个类别的图像数量和标注框数量。
2025-03-26 15:23:11
315
原创 扩张/空洞卷积可视化
本文介绍了一种基于膨胀卷积的可视化方法,并提供了灵活的参数调整方式以优化特征图的呈现效果。通过修改特征图大小(size)、调整膨胀率(dilated_rates)、改变卷积核大小(k)以及自定义可视化参数(如颜色映射、网格线样式和文字颜色阈值),用户可以轻松定制膨胀卷积的行为及其可视化结果。文中详细说明了每个参数的修改位置和方法:特征图大小在main函数中设定,膨胀率通过dilated_rates列表调整,卷积核大小在dilated_conv_one_pixel和dilated_conv_all_map函数
2025-03-25 19:20:06
266
原创 将 YOLO 格式的标注文件(.txt)转换为 VOC 格式的 XML 标注文件
"""此函数用于将yolo格式txt标注文件转换为voc格式xml标注文件在自己的标注图片文件夹下建三个子文件夹,分别命名为picture、txt、xml"""函数接收三个参数:picPath:图片所在文件夹路径。txtPath:YOLO 格式的 .txt 文件所在文件夹路径。xmlPath:生成的 .xml 文件保存路径。
2025-03-18 10:05:02
1038
原创 将 VOC 格式 XML 转换为 YOLO 格式 TXT
这是一个列表,定义了数据集中所有物体的类别名称。类别名称的顺序非常重要,因为它们的索引(从0开始)将作为YOLO格式中的class_id。
2025-03-18 09:53:19
284
原创 将COCO格式的物体检测数据集划分训练集、验证集和测试集
设置数据集的根目录、图像文件夹和注释文件路径。根目录:"D:\\dataset"图像文件夹:"D:\\dataset\\images"注释文件:"D:\\dataset\\annotations.json"# 数据集路径(请根据实际情况修改)
2025-03-17 18:49:50
965
原创 CUDA与CUDNN在Windows下的安装与配置
点击后等待一会即可进行下载,我是Windows11操作系统所以选择Windows,Version选择11,选择本地下载exe(local),最后Download进行本地下载。把CUDA选一下,还需要注意一点,如果你前面没有安装vs,需要把CUDA里面的Visual Studio Integration取消勾选,否则会安装不成功。我的CUDA Version为12.5,说明该显卡最高支持到12.5,我这里就选择12.4的版本,你也可以选择更低的版本更低的版本。点击下载后,需要你进行注册。选择自定义,下一步。
2025-03-16 11:30:52
517
原创 数据处理图像增强
后至少会随机选择一种增强方式生效,返回增强后的图像和更新后的 bounding boxes。里面实现了旋转、平移、裁剪、亮度调整、加噪声、cutout、翻转等多种增强方法。读取原始 XML 文件,提取出每个目标的 bounding box 和类别;分别保存增强后的图片和对应的 XML 标注文件。
2025-03-08 10:17:35
301
原创 双非计算机研究生如何进国企
我在21年本科毕业的时候,互联网计算机行业基本上还是一片形式大好。那时候就想这去北上广闯闯,有可能是年轻的原因。当时毕业的同学大家都找了比较高薪的工作。我本科毕业后考研加上读研正好经历了口罩,并且我毕业就26了。心态上发生了变化,内心非常迫切的想让自己稳定下来。所以研究生必要大部分人都选择了公务员、事业编和国企。如何进国企呢?
2024-12-17 11:16:35
598
原创 win11左边部分图标,不能点击解决方案
最近一段时间,电脑左边部分图标经常无故点击不了,也没有高亮反映。然后尝试了三种方案,最后发现竟然是word与win11有冲突。我列举三种方案,仅供大家参考。
2024-11-04 16:14:55
2469
8
原创 IEEE Transactions on Intelligent Transportation Systems投稿指南
一般会需要介绍信。介绍信内容如下:I am writing to submit the enclosed manuscript entitled "你期刊的名字" for consideration in介绍一下你论文的大概内容列出你的创新Sincerely,通信作者名字Professor单位, 城市 邮编, 国家通信作者邮箱。
2024-08-08 10:16:53
3254
13
原创 Apriori算法,python实现
df = pd.read_excel('D:\\Document_Exercitation\\关联规则apriori-python\\数据.xls',keep_default_na=False)这个函数实现了Apriori算法的主要流程,用于发现数据集中频繁项集。参数 minSupport=0.02 指定了最小支持度阈值,表示频繁项集在数据集中至少出现的比例为 2%。参数 minConf=0.35 指定了最小置信度阈值,表示生成的关联规则的置信度至少为 35%。假如有五个购买清单,一行代表一个单子。
2024-07-30 17:00:31
1082
原创 Pattern Recognition投稿指南
2024.8.8 With Editor 没动静,感觉很慢。2024.8.8 拒绝拒绝原因大致是格式问题,要求修改重新提交Comment 1Comment 2Comment 3Comment 4Comment 5。
2024-07-15 22:02:43
3003
31
原创 YOLO建立没有目标的负样本标签
images_list = os.listdir(r"D:\Document_Exercitation\Video_Segmentation\picture1") # 遍历整个文件夹下的文件并返回一个列表。txt_name.append(j.split(".")[0]) # 若带有后缀名,split去掉后缀名。在yolo格式中,如果想让无目标地背景图片参与训练,需要创建与图片名字一样的空白的txt文件。如果标注文件夹里,没有相应图片的标注,则就创建一个同样名字的空白txt作为负样本的标签。
2024-07-15 15:09:35
1278
原创 Python文件批量重新命名
fold_dir = 'C:/Users/10431/Desktop/4517+VOC/JPEGImages/JPEGImages' # 需要修改的文件所在的文件夹。os.rename(fold_dir + '/' + temp, fold_dir + new_filename) # 文件重命名后替换原文件名。这一行指定了源代码文件使用的字符编码为 UTF-8,确保文件中包含的任何非 ASCII 字符都能够被正确处理。文件夹中所有文件的名称,并将这些名称存储在。,存储了需要批量修改文件名的文件夹路径。
2024-07-15 10:22:00
423
原创 MATLAB一维数据转换二维图像的方法
首先我们需要准备一个mat数据文件。文件格式如下这个项目提供了24中转图像的类型:时频类:梅尔频谱图Mel spectrogram短时傅里叶变换short-time Fourier transform变换S-transform魏格纳分布Wigner-Ville Distribution离散魏格纳分布Discrete Wigner-Ville Distribution希尔伯特变换Hilbert-Huang Transform。
2024-07-12 13:47:39
788
8
原创 txt生成大模型一问一答标签
{"id": "identity_1", "conversations": [{"from": "user", "value": "1. 前言\n在进行文本处理和 数据分析等任务时,经常需要将结果追加写入到已有的txt文件中。{"id": "identity_2", "conversations": [{"from": "user", "value": "Python 函数形参\n在定义函数时,括号中声明的变量列表是形参。\n\n在调用函数时:\n\n所有的参数都是必需的。"value": "你好"
2024-07-09 14:02:26
968
原创 IEEE Transactions on Intelligent Transportation Systems投稿记录
submitted 2024-5-29Awaiting AE Assignment 2024-6-11
2024-06-11 11:13:29
560
2
原创 COCO格式数据集可视化
save_path 是将可视化图片保存的路径。annFile 是json文件的路径。img_path 是图片所在的文件夹。
2023-12-26 10:57:16
284
原创 FLOPs与Params
更多的参数通常意味着更大的模型,可以拟合更多的数据和复杂的特征,但也可能需要更多的计算资源来训练和推理。研究人员和工程师通常会尝试设计更加轻量级的模型,以降低模型的 FLOPs,从而在资源受限的环境中实现高性能的计算机视觉应用。参数量通常与模型的规模和复杂度相关,较大的参数量可能意味着更复杂的模型。在计算机视觉领域的论文中,"Params" 通常指的是模型的参数数量,是一个衡量模型规模的指标。在论文中,作者通常会报告模型的参数数量,以便读者了解模型的规模和复杂度,这有助于评估模型的适用性和性能。
2023-09-19 16:50:28
441
原创 服务器创建容器指南
查看那个GPU可以调用,尽量使用空闲的GPU。你在创建容器时,写这3卡,就可以看见三张卡的状态。内部镜像是你自己下载好的压缩包,你自己已经传输到账户文件夹。创建好之后进入点击容器名字进入容器内部。下载命令在dockerhub上查找。点击确定,在传输列表查看状态。传输完成后在容器管理可以查看。选择自己想要的镜像,点击复制。开启训练之前在shell中输入。镜像分为内部镜像和外部镜像。可以在传输列表看进程。在镜像管理中点击导入。在开发环境中点击创建。
2023-09-04 14:22:43
315
原创 vscode连接容器
在AI平台上查看你自己的容器ssh信息,填写一下内容。打开vscode插件安装Remote - SSH。安装完成后打开ssh设置confing文件。出现配置好的ssh,点击连接,输入密码即可。保存关闭confing文件。
2023-09-01 18:58:39
151
原创 连接服务器容器 Network error: Connection refused
按i进入编辑模式,将 #PermitRootLogin prohibit-password 修改为 PermitRootLogin yes。连接服务器容器时出现Network error: Connection refused。结果显示:ssh:unrecognized service。显示也是 unrecognized service。按Esc推出编辑模式,输入 :wq 保存退出。在AI平台上进入容器使用shell终端。首先怀疑容器中没有ssh服务。是因为没有开启ssh服务。
2023-08-20 11:19:29
1604
原创 super().__init__()的作用
super().__init__()就是调用父类的init方法,同样可以使用super()去调用父类的其他方法。我们发现G继承自E, F是并列的,初始化的时候不会先把E初始化完毕才初始化F。super()用来调用父类(基类)的方法,__init__()是类的构造方法。如何子类B和子类A,都写了init方法,那么A的init方法会被B覆盖。B覆盖了父类A的init,通过super又调用了A的init。如果想要调用A的init方法需要用super调用。B的init被调用了。A的init被调用了。
2023-08-04 14:41:28
584
原创 nn.LayerNorm的作用
这有助于将输入数据的分布规范化,减少不同样本之间的差异,有利于网络的稳定性和学习能力。可以减少不同样本之间的差异,提高模型对于输入的泛化能力。是逐通道进行归一化的,不涉及批次维度,因此参数量较少,对于小批量或单样本的情况更加适用,减少了模型的复杂性和计算量。缓解内部协变量偏移:在深度神经网络中,随着网络层数的增加,每一层的输入分布可能发生变化,导致网络难以训练。是一种归一化层,用于对神经网络的输入或隐藏层输出进行归一化操作。可以在每一层内对输入进行归一化,减少层与层之间的协变量偏移,提升网络的训练效果。
2023-07-18 15:08:25
2193
原创 Fully connected(全连接)
全连接层的计算过程可以表示为 Y = X * W + b,其中 X 是输入数据的向量,W 是权重矩阵,b 是偏置向量,Y 是输出数据的向量。在图像分类任务中,通常会在全连接层之前使用卷积层和池化层来提取特征,然后通过全连接层将提取的特征映射到不同类别的概率或得分。在全连接层中,每个输入神经元都与输出层的每个神经元相连,形成一个完全连接的结构。总之,全连接层是神经网络中的一种层类型,每个输入神经元与输出层的每个神经元都有连接,通过权重和偏置项进行线性组合,将输入数据映射到最终的输出空间。
2023-07-13 19:36:38
1846
原创 “sampling“(采样)
在机器学习和深度学习中,"sampling"(采样)通常指从一个数据集中选择(或提取)一部分样本的过程。这个过程可以是随机的,也可以是根据特定的采样策略进行选择。高置信度样本挖掘:在训练过程中,根据模型对样本的置信度或预测概率选择具有较高置信度的样本。通过合理的采样方法,可以有效地利用有限的数据集,并提高模型的性能和泛化能力。硬负样本挖掘:在目标检测和分类任务中,从负样本中选择更具挑战性的样本。例如,针对类别不平衡问题,可以使用过采样或欠采样技术来平衡不同类别的样本数量。
2023-07-13 19:32:23
869
原创 “sampling“(采样)
在机器学习和深度学习中,"sampling"(采样)通常指从一个数据集中选择(或提取)一部分样本的过程。这个过程可以是随机的,也可以是根据特定的采样策略进行选择。高置信度样本挖掘:在训练过程中,根据模型对样本的置信度或预测概率选择具有较高置信度的样本。通过合理的采样方法,可以有效地利用有限的数据集,并提高模型的性能和泛化能力。硬负样本挖掘:在目标检测和分类任务中,从负样本中选择更具挑战性的样本。例如,针对类别不平衡问题,可以使用过采样或欠采样技术来平衡不同类别的样本数量。
2023-07-12 15:59:36
795
原创 stochastic depth是什么
通过这种方式,每个训练样本在每个层的路径上都会遇到不同数量的层,从而在训练过程中实现对不同深度的模型的均衡训练。这种方法已经被证明在一些图像分类和目标检测任务中取得了良好的效果,并成为深度神经网络正则化的一种重要技术。它通过在训练过程中随机地丢弃(跳过)网络中的一些层来减轻深层网络中的过拟合问题。这样,模型可以充分受益于较深的结构,从而提高性能。在传统的深度神经网络中,所有层都会参与前向和反向传播过程,无论网络多深。然而,较深的网络可能会导致更多的参数和更复杂的模型,这会增加过拟合的风险。
2023-07-12 15:55:28
557
原创 independent instance maps是什么
使用独立实例映射可以有效地对目标实例进行分割和区分。在语义分割任务中,它可以实现对每个目标实例的像素级分割,从而更好地理解图像中的不同实例。在独立实例映射中,对于每个目标实例,生成一个二进制掩码图像,其中目标实例部分的像素值为1,背景部分的像素值为0。"Independent Instance Maps"(独立实例映射)是指在目标检测和语义分割任务中,为每个独立目标实例生成的二进制掩码图像。总之,独立实例映射是为每个目标实例生成的二进制掩码图像,在目标检测和语义分割任务中用于实现目标实例的独立分割和区分。
2023-07-12 14:51:33
126
原创 什么是前向过程
在深度学习中,前向过程是对输入数据进行特征提取和转换的过程,将输入数据通过网络的各个层级,逐步进行计算和变换,最终得到模型的输出。总结起来,前向过程是神经网络中将输入数据通过网络的层级结构进行计算和传播的过程,通过一系列的计算和变换,从输入数据中提取特征并生成输出结果。特征提取:通过网络的一系列层(如卷积层、池化层、全连接层等)对输入数据进行一系列的计算和变换,提取输入数据的特征。输出层:在前向过程的最后,通过网络的最后一层(如全连接层或卷积层)进行最终的计算和变换,得到模型的输出结果。
2023-07-12 14:27:04
242
原创 如果自定义coco数据集中没有iscrowd字段,请使用以下代码修改cocoeval.py
最好不要用vim打开粘贴,会缩进导致报错。直接新建一个py文件进行替换。在Linxu环境下修改这个文件。
2023-05-26 19:20:10
1181
1
转载 yolo格式转coco格式
由于原作者imageFile打印出来是图片名字加图片格式比如15454.jpg,imageFile[:5]这里的索引不能自由匹配长度所以,我进行了修改。
2023-05-18 18:31:00
1892
10
空空如也
swin transformer 训练时间长
2023-04-20
TA创建的收藏夹 TA关注的收藏夹
TA关注的人