数据集

最新推荐文章于 2025-09-24 17:56:28 发布

转载最新推荐文章于 2025-09-24 17:56:28 发布 · 122 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/zhoulixue/p/6776080.html

# 删除无关的XML文件和jpg文件
#所有的类型
# 需要识别的类型包括 bicycle，bus,car,person
import os
import re
import shutil
items=['aeroplane','bird','boat','bottle','cat','chair','cow','diningtable','dog','horse','motorbike','pottedplant','sheep','sofa','train','tvmonitor']
years=['VOC2007','VOC2012']

for item in items:
    pattern=r'[\s\S]*<name>'+item+'</name>[\s\S]*'
    for year in years:
    #     imagedir=os.listdir('./VOCdevkit/'+year+'/JPEGImages')
        xmldirs=os.listdir('./VOCdevkit/'+year+'/Annotations')
        for xmldir in xmldirs:
            f=open('./VOCdevkit/'+year+'/Annotations/'+xmldir)
            xmlhasperson=False
            lines=f.readlines()
            for line in lines:
                if re.match(pattern, line,flags=0):
                    xmlhasperson=True
            f.close()
            if xmlhasperson:
                os.remove('./VOCdevkit/'+year+'/Annotations/'+xmldir)
                os.remove('./VOCdevkit/'+year+'/JPEGImages/'+xmldir[:-4]+'.jpg')

    #             person_list.append(xmldir[:-4])
    #             shutil.copyfile('./VOCdevkit/'+year+'/Annotations/'+xmldir,'./result/VOCdevkit/'+year+'/Annotations/'+xmldir) 
    #             shutil.copyfile('./VOCdevkit/'+year+'/JPEGImages/'+xmldir[:-4]+'.jpg','./result/VOCdevkit/'+year+'/JPEGImages/'+xmldir[:-4]+'.jpg')

转载于:https://www.cnblogs.com/zhoulixue/p/6776080.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

aibi8107

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

汽车与摩托车分类数据集

网易搬砖头

11-16

1万+

关于数据集该数据集是2,000 张摩托车和汽车图像的集合。在收集这些图像时，确保所有类型的摩托车和汽车都包含在图像集合中。这是因为汽车和摩托车的内部多样性很高。也就是说，汽车和摩托车的类型不同，这对模型来说是一项艰巨的任务，因为模型还必须了解摩托车和汽车的多样性。但如果你的模型能够理解汽车和摩托车的基本结构，它将能够区分这两个类别。数据未经过预处理。这样做是有意为之，以便你可以应用想要使用的增强功能。几乎所有2000 张图像都是独一无二的。因此，在应用一些数据增强后，你可以增加数据集的大小。

Open Images V7 数据集介绍

lansebingxuan的专栏

03-26

4457

Open Images是由谷歌发布的一个开源图片数据集，在2022年10月份发布了最新的V7版本。这个版本的数据集包含了900多万张图片，都有类别标记。

参与评论您还未登录，请先登录后发表或查看评论

鸢尾花(Iris)数据集

热门推荐

qinzhongyuan的博客

05-30

9万+

鸢尾花数据集1. 鸢尾花数据集下载2. Pandas库基础操作3. 数据可视化 1. 鸢尾花数据集下载下载鸢尾花数据集 tf.keras.utils.get_file(fname,origin,cache_dir) 参数说明 fname 下载后的文件名 origin 文件的URL地址 cache_dir 下载后文件的存储位置 TRAIN_URL="http://download.tensorflow.org/data/iris_training.csv" train_p

关于flickr的数据集笔记

oneself的博客

07-24

8342

关于flickr的数据集笔记

自制数据集

weixin_51998587的博客

04-21

3941

记录如何制作图像检测的数据集Make Sense将下载好的数据集图片进行上传，并选择目标检测进入界面在创建标签这步中，选择将标签导入文件（如图所示），将需要识别的目标进行分类，并将名字以分行的方式呈现，存储在txt文件中，再将txt文件上传到MAKE SENSE中。标签设好以后可以在图片中选择对应的目标进行标注，标注完成后将数据集以YOLO的格式进行导出到我们的电脑上。图片和导出的标签一一对应，标签的txt文档中不同列的数字代表不同的含义，已在图中给出。

免费开源数据集平台大全

cjd688的博客

09-24

3207

在数据分析、机器学习及 AI 项目开发中，高质量数据集是突破研发瓶颈的关键。本文针对开发者、研究者及学生群体，系统整理了通用、计算机视觉（CV）、自然语言处理（NLP）、金融经济、地理地图、社交行为 6 大领域的 20 + 个免费开源数据集平台，不仅提供可直接访问的官方网址，还详细说明各平台数据集特色、适用场景及商用许可规则，解决 “找数据难、辨合规难” 的核心痛点。无论是算法练手、学术研究还是商业项目开发，都能通过本文快速定位目标数据集，显著提升研发效率，是一份兼具实用性与收藏价值的工具指南。

COCO数据集

m0_62948300的博客

09-16

1872

coco数据集百度网盘下载

PU轴承数据集分析

3hex的博客

11-22

1701

提取码: 1111。

Hugging Face数据集的简单使用

IT菜鸟

07-30

3450

Hugging Face数据集的简单使用

KITTI数据集

Cethy‘s Learning Notes

04-01

1万+

KITTI数据集感谢~收藏用！原文出自：https://blog.youkuaiyun.com/solomon1558/article/details/70173223摘要：本文融合了Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite和Vision meets Robotics: The KITTI Dataset两篇论文...

精选资源

跌倒检测数据集数据集数据集

03-11

视频链接如下： https://www.bilibili.com/video/BV16Z4y127w3/?vd_source=6ea7a224dd878fde411995c70d3c5adb#reply118347089152 看好多人要数据集，可能看不到，就存在这里吧。

生活垃圾数据集YOLO版

09-23

标题中的“生活垃圾数据集YOLO版”指的是一个针对生活垃圾识别训练的数据集，采用了流行的YOLO（You Only Look Once）目标检测算法格式。YOLO是一种实时的物体检测系统，以其高效和准确性在计算机视觉领域受到广泛...

精选资源

中文短信数据集-带标签

02-05

本数据集可用于进行文本分类、信息检索等自然语言处理实验，共包含80万条短信。其中：原始数据集data.txt每行为1条短信，格式为“标签\t短信内容”，标签=0表示正常短信，标签=1表示垃圾短信。train.csv和test.csv为...

猫狗数据集（包含标签）

06-28

这个“猫狗数据集（包含标签）”是一个用于图像分类任务的典型数据集，特别适合于深度学习模型的训练和验证。数据集包含了两个类别，即“猫”和“狗”，每个类别下都有大量的图像样本，这样的结构使得它在机器学习...

NeRFStudio数据集

05-22

在复现nerfstudio时有可能会遇到数据集下载不出来的问题，所以我把nerfstudio作者使用的数据集压缩出来上传。下载完解压之后把数据集放在/home/wxy/nerfstudio/data/nerfstudio这个位置，之后再运行指令ns-train ...

本教程用作于校园跑刷跑，适用于除了部分不提供bl锁的手机类型（如vivo）

12-18

根据原作 https://pan.quark.cn/s/801a2ca3e47c 的源码改编前言本教程用作于校园跑刷跑，适用于除了部分不提供bl锁的手机类型（如vivo）需要下载FakeLocation以及刷入面具具体方法会在md文件中说明

【VSG 并网空载仿真】虚拟同步发电机并网空载仿真，包含有功-无功功率环与电压-电流双闭环研究（Matlab代码实现）

12-18

【VSG 并网空载仿真】虚拟同步发电机并网空载仿真，包含有功-无功功率环与电压-电流双闭环研究（Matlab代码实现）内容概要：本文介绍了虚拟同步发电机（VSG）并网空载仿真的Matlab代码实现，重点研究了有功-无功功率环与电压-电流双闭环控制系统的设计与仿真。通过对VSG控制策略的建模，展示了其在并网运行时的动态响应特性与稳定性控制能力，涵盖虚拟同步机的核心控制逻辑、功率调节机制及双闭环结构的协调作用，适用于电力系统中分布式电源的并网仿真分析。; 适合人群：具备电力系统基础知识和Matlab/Simulink仿真经验的电气工程专业学生、研究人员及从事新能源并网技术开发的工程师。; 使用场景及目标：①掌握虚拟同步发电机的基本工作原理与控制结构；②实现VSG并网空载工况下的系统仿真；③深入理解有功-无功功率解耦控制与电压-电流双闭环设计方法；④为后续研究VSG在复杂电网环境中的动态行为提供仿真基础。; 阅读建议：建议结合Matlab代码与电力系统控制理论同步学习，重点关注控制环路参数设计与仿真结果分析，可通过调整控制器参数验证系统稳定性变化，进一步拓展至负载工况或多机并网场景的研究。

需求响应动态冰蓄冷系统与需求响应策略的优化研究（Matlab代码实现）

12-18

需求响应动态冰蓄冷系统与需求响应策略的优化研究（Matlab代码实现）内容概要：本文围绕需求响应动态冰蓄冷系统及其优化策略展开研究，结合Matlab代码实现，探讨在需求响应背景下冰蓄冷系统的动态特性与运行优化方法。研究聚焦于通过优化算法提升系统在电力负荷高峰时段的调节能力，降低能耗与运行成本，同时兼顾电网侧的负荷平衡目标。文中详细构建了系统数学模型，并采用Matlab进行仿真验证，复现了顶级EI论文中的优化方法，体现了较强的工程应用与学术参考价值。; 适合人群：具备一定电力系统、能源管理或优化算法基础，从事科研或工程应用的研发人员、高校研究生及高年级本科生。; 使用场景及目标：①研究冰蓄冷系统在需求响应机制下的运行优化策略；②学习如何利用Matlab实现能源系统建模与优化算法仿真；③复现高水平论文中的优化模型，提升科研能力与项目实践水平。; 阅读建议：建议读者结合Matlab代码逐步理解模型构建与求解过程，重点关注目标函数设计、约束条件设置及优化算法的选择，同时可参考文中提及的EI论文深入掌握研究背景与技术细节。

STM32电机库无感代码注释无传感器版本龙贝格观测三电阻双AD采样前馈控制弱磁控制斜坡启动