
数据集
hzhj
写作不只为了传播,更重要的是思考和学习。
展开
-
检测识别数据集汇总
bdd100k,自动驾驶数据集,数据介绍可查看该文章。标注对象共10类,github地址。2D Bounding Boxes annotated on 100,000 images for bus, traffic light, traffic sign, person, bike, truck, motor, car, train, and rider.Imagenet 2014 Det...原创 2019-12-13 15:42:46 · 1972 阅读 · 0 评论 -
imagenet、voc、cocolabel名称
imagenet数据1000个label列表 voc数据共20个label self._classes = ('__background__', # always index 0,之后的id按照顺序递增 'aeroplane', 'bicycle', 'bird', 'boat', 'bottle',...原创 2019-11-27 16:02:54 · 698 阅读 · 1 评论 -
faster-rcnn网络数据集的获取逻辑
参考tf-faster-rcnn工程的layer.py函数,整体逻辑为:shuffle图片(roidb)顺序; 初始化batch的起始位置,读取配置文件中的batch(faster rcnn检测的batch为1); 根据起始位置和batch获得当前训练的图片; 迭代值起始位置等于图片总数时,重新shuffle图片顺序; 迭代值达到max_iters时停止读取数据; def __i...原创 2019-11-23 18:12:35 · 310 阅读 · 0 评论 -
数据集汇总
深度学习应用数据集原创 2019-11-20 16:59:45 · 799 阅读 · 0 评论 -
图像美学数据集
美学数据集一栏表AVA:A Large-Scale Database for Aesthetic Visual Analysis, 2012年;tid2013AADB(2016年)PCCD photo critique captioning dataset(2017年)AROD(multi-useragreements and assemble a large dataset)201...原创 2019-11-10 14:22:03 · 5651 阅读 · 0 评论 -
检测标注数据量
EfficientDetphi=1系统模型在2007测试集上的结果如果要问需要标注多少检测数据就可以了,得到的答复多半是越多越好。可是不可能无限制的标注数据,也不可能只通过数据就能达到预期效果,毕竟数据和算法才最终决定效果(算力直接决定了做事效率)。既然没有统一答案,但是从公开的数据集中还是能获得些启发的。本文以VOC中的数据为例,探讨标注数据量的问题。首先看下各主流检测算法在该voc200...原创 2019-07-31 21:16:43 · 375 阅读 · 0 评论 -
检测数据标注参考
本文以VOC2007中部分类别(bicycle,motorbike,car,bus,person)的图片为参考,通过解析xml文件得到标注结果,借此说明对检测数据的标注要求。检测标注中常遇到多类别物体、局部物体、物体间遮挡、真假物体、小物体(物体占比较小)等情况,故从VOC中筛选部分图片进行演示。图片如下。VOC部分数据单类别物体标注结果多类别物体标注结果局部物体标注结果...原创 2019-07-31 20:11:50 · 814 阅读 · 0 评论 -
AVA(aesthetic visual analysis)数据集简介
数据集共包含25w+张图,每张图包含语义标签、风格标签和美学打分。其中语义标签共66类,风格标签共14类,打分为1-10共10个分值。文件信息列表如下。|-- AVA.txt 图片id,美学打分分布,语义id,challenge_id综合文件 |-- aesthetics_image_lists 部分语义类别的文件集合 |-- challenge...翻译 2019-04-25 18:00:36 · 11683 阅读 · 2 评论 -
PASCAL VOC标注文件解析代码
功能函数:从检测的xml文件中提取物体,并保存。看下xml的文件内容:<?xml version="1.0" ?><root> <filename>2464-1</filename> <source>2sc</source> <size> <width>5原创 2018-06-27 10:34:23 · 1467 阅读 · 0 评论 -
MNIST数据集
MNIST数据集作为机器学习界的“Hello World”,是学习模式识别和各大深度学习框架的基础数据库。2017年,大神Hinton的最新研究方向CapsNet就是基于该数据集做的实验。该数据集是手写字符,如下图所示。数据集源自NIST,后经CNN鼻祖Lecun等人修改后创建,共包含60000个训练样本和10000个测试样本,验证样本每张图为28*28的灰度图像。 下文借助Pytho原创 2018-01-25 14:59:38 · 2491 阅读 · 0 评论