搜寻图像集的方法

搜寻图像集的方法(持续更新)

做图像识别的孩子,都会遇到这个问题,如何找适合的图片去做训练集,测试集。在这里,我会持续地总结我所学到的搜寻方法。

一.各类比赛网站

二.优快云站内搜索

这里可以下载很多资源https://download.youkuaiyun.com/
或者在csdn里搜索“比赛数据集”,这里面有很多,大家分享出来的比赛数据集

三.在知乎里面搜索

关键词:公开 图像数据,里面有大佬们分享的数据

三.论文链接下载

论文里一般有图片数据的来源

四.爬取图库网站的图片

国内外的图库网站很多,这里不细说。
图库网站的图片与关键词的相关性较强。

五.爬取百度/谷歌图片

在这里吐槽一下,这种方法爬取的照片与搜索关键词的相关性真的不高。
关键词的搜索技巧是找近义词。比如如果你的关键词“不开心”,可以同时搜索“哭”,“失落”等

六.社交网站爬虫

这种方法爬出来的照片与关键词的相关性也不高。
不过好处是能爬到较为真实的图片。

七.数据集网站下载

### 数据集资源 对于目标检测任务,存在多种公开可用的数据集。这些数据集涵盖了不同的应用场景和技术需求。例如,有专注于工业缺陷检测的数据集[^1],这类数据集特别适用于发现生产过程中的瑕疵或异常情况。此外,还有专门针对小目标识别的小目标数据集以及应用于遥感图像分析的遥感数据集。 如果需要直接使用的数据集,某些平台已经提供了经过预处理并适配特定框架(如YOLO)的目标检测数据集。这意味着它们已经被转换为适合模型训练的标准格式,从而减少了前期准备的工作量。 另外值得注意的是,部分高质量数据集不仅限于上述提到的应用领域,还可能涉及行人检测、交通标志识别等多个方面。下面是一些获取目标检测数据集的具体途径: #### 常见开源数据集网站链接 - **Open Images Dataset**: 提供大量标注好的图片用于视觉对象检测研究。 - **COCO (Common Objects in Context)**: 包含超过30万张照片,覆盖80种类别的物体实例。 - **Pascal VOC**: 主要面向分类和定位挑战赛而建立的经典数据集合之一。 ```python import torch from torchvision import datasets, transforms transform = transforms.Compose([transforms.ToTensor()]) dataset = datasets.CocoDetection(root='./data', annFile='./annotations.json', transform=transform) print(f"The dataset contains {len(dataset)} images.") ``` 以上代码片段展示了如何利用PyTorch加载来自COCO的数据集作为示例。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值