
视频中的目标检测
文章平均质量分 86
沙雅云
这个作者很懒,什么都没留下…
展开
-
视频检索前期研究
1 linux 线程操作问题undefined reference to 'pthread_create’的解决办法(cmake)找到类似这一句的:gcc -g -Wall -I/usr/local/include -o transmitter transmitter.c IniFileRW.c在最后加上: -L…/boost/stage/lib -pthread开源视频检索技...原创 2019-11-29 13:04:11 · 271 阅读 · 0 评论 -
视频检索
视频检索本文采用了三种方法进行视频检索1 根据图像检索视频关键帧的算法2 采用vedioSearch的方式进行检索3 采用yolo视频目标检测的算法进行检索下面针对三种方法进行详细说明根据图像检索视频关键帧的算法step1:提取新闻片头关键帧step2:提取整个新闻的关键帧step3:定义图像的相似度匹配算法step4:根据相似的匹配算法匹配关键帧代码如下:#关键帧提取算...原创 2019-11-29 10:18:37 · 2416 阅读 · 0 评论 -
deep feature flow
因为如果将图片识别的网络直接引入视频中的帧,就会发现计算量就会很大作者提出的这个网络利用的是1,fowl estimetion,feature propagation,比一般的卷积计算速度快很多2,在空间上找一个关键帧做图像识别,然后将 deep feature map 从关键帧传到其他的帧,通过光流网络。并且这两帧是很相似的,所以传递过来的特征与原始特征很相似。2.并且整个结构是end ...原创 2018-11-11 20:01:37 · 888 阅读 · 0 评论 -
Flow -Guided feature Aggregation for video object detection
这篇文章是对之前的deep-featureflow的一个延续,利用了前后帧的信息来加强当前帧的特征,从而得到较好的识别度,但是速度上回很慢。基于流引导的特征聚合,端到端的学习框架,利用时间一致性,沿着运动轨迹聚合附近的帧,来提高每一帧的特征。这种方法对于strong single-frame baselines in ImageNet VID 有很大的改进,并且对于快速移动的物体效果显著。1....原创 2018-11-12 17:00:11 · 1470 阅读 · 0 评论 -
flow
1,光流的概念就是利用图像的的像素在时间域上的一些变化以及相邻帧之间的相关性来找到帧之间的对应关系,计算出相邻帧之间的运动信息。光流是二通道的,不同颜色表示不是不同的运动方向,颜色的深浅表示位移的速度。2论文的结构1,收缩的网络结构2,方法的网络结构3,训练数据集4,实验与结果分析5,训练的小tips1 没有全连接层2 网络包含9个 stride为2的convolution l...原创 2018-11-14 22:06:35 · 240 阅读 · 0 评论 -
Powering Robust Clothes Recognition and Retrieval with Rich Annotations
主要贡献:1,提出了一个数据集2,提出了一个网络结构数据集网络结构基础网络是vgg16,这个网路已经在目标检测和语义分割上有很大的应用网络的最后一个卷积层被三个分支取代橙色部分:代表了全局的特征,输出的特征作为最终检索的一部分。绿色部分:在关键点估计之上的局部特征,作者提出了一个新的层。这一层,与faster-rcnn比较类似,就是在提取特征图上的某一块区域进行统一的编码。...原创 2018-11-22 09:45:52 · 164 阅读 · 0 评论 -
Impression Net
1提出的背景例如faster-rcnn这一系列的网络在在图像检测方面已经取得了很好的效果,但是直接将图像检测器运用到视频中的每一帧,就面临这各种问题,比如图像检测器需要的是大型的特征网络,即使在GPU上运行的也是很慢的,而且不准确,在视频中由于运动和虚焦导致目标出现视觉模糊的现象,使得相应帧的检测不够准确。因为基于特诊融合的网络使得检测器可以检测到低质量的帧,提高了检测的精度,但是牺牲了检测的...原创 2018-12-11 13:04:00 · 486 阅读 · 1 评论 -
视频目标检测
1视频目标检测的简介视频目标检测要解决的问题就是对视频中每一帧都正确的识别和定位对于图像的目标检测,视频是高度冗余的,包含大量的时间冗余性和空间冗余性,就是在不同的时间或者空间看起来是相似的。充分的利用好上下问信息,可以解决连续帧之间的大量冗余的情况,提高检测的速度,还可以提高检测的质量。解决图像中的运动模糊,视频失去焦点,部分遮挡以及形变的问题。视频目标检测和追踪的不同两个领域解决的都会对...原创 2019-06-17 10:47:12 · 11319 阅读 · 1 评论 -
cs小屋-感知hash算法
第一部分faster r-cnn是区域建议网络,fast r-cnn和区域建议网络的组合,以图搜商品的准确率,会根据物体类别有所不同,大致分为三个类别。1 平面物体,画报,装饰画,准确率可以达到95%以上2 三位刚性物体,立体家具模型,准确率可以得到80%3 对于柔性和纹理单一物品,如纺织类,纹理单一物品等,识别相对困难目标检测的第一步就是要区域提名,类似与光学字符识别,问题的核心就是如...原创 2019-07-20 20:11:08 · 259 阅读 · 0 评论