
图像处理
文章平均质量分 90
勤劳的凌菲
Try my best! Do myself~~
展开
-
You Only Look One-level Feature(YOLOF)
paper codeMotivation目标检测中常用到特征金字塔(FPN),在各网络中证明FPN确实有效,通常认为其有效得益于两个方面:(1)多尺度特征融合:融合了多种高分辨率和低分辨率的特征获取到更好的特征表达;(2)分而治之:根据目标的大小在不同层进行目标检测。目标检测的网络结构可以分为三大部分:backbone、encoder、decoder,如下所示:对encoder设计如下结构Figure 1进行实验,验证FPN的有效性是得益于多特征融合还是分而治之通过实验发现SiMo作为enc原创 2021-03-23 16:08:12 · 446 阅读 · 0 评论 -
文字图像超分辨率论文笔记
TextSR: Content-Aware Text Super-Resolution Guided by Recognition论文链接:https://arxiv.org/abs/1909.07113代码:https://github.com/xieenze/TextSR网络结构:SRGAN网络的基础上加文字识别网络,文字识别网络采用的是ASTER;损失函数:1)SR采用的是VGG的感知损失以及对抗损失;2)文字感知损失如下:上图中蓝线是训练过程,红线是推理过程;训练:3种训练方原创 2020-09-10 11:41:13 · 1189 阅读 · 0 评论 -
RealSR算法汇总
RealSRNTIRE2020真实超分双赛道冠军;两阶段:1)自监督数据生成;2)监督SR超分;作者提出一种新的数据制作方案:统计模糊核与真实噪声分布并用于制作训练数据对;可以使得LR与真实世界图像处于同域,进而将提升图像超分的性能;作者提出一种真实世界超分模型以获得更好的感知效果真实世界超分的关键问题在于如何引入精确的降质模型以确保生成的LR图像与原始图像具有同域属性(比如噪声分布、模糊等)在实际场景,HR图像、模糊核和噪声均未知的。为更精确的估计降质模型,我们需要从图像中估计模糊核与噪声。原创 2020-07-30 13:14:12 · 3514 阅读 · 0 评论 -
MuCAN: Multi-Correspondence Aggregation Network for Video Super-Resolution论文笔记
论文链接:https://arxiv.org/abs/2007.11803代码:未公开ECCV2020前言当前VSR算法所存在的问题:1)通常采用光流来建立时间相关性,但是光流估计易有误,从而影响重建结果;2)VSR算法极少采用自然图像中本就存在的相似模式。之前的VSR算法对对齐和回归两个阶段单独建模,本文将VSR看作帧内和帧间集成任务。本文所依据的现象:连续帧具有相似内容;同一帧内不同位置具有相似内容。帧间相关性:为了验证作者的想法,实验设置:在MPI-Sintel Flow数据集上,用一.原创 2020-07-28 13:42:07 · 1252 阅读 · 1 评论 -
图像超分辨率论文笔记
Real-World Super-Resolution via Kernel Estimation and Noise Injection论文链接:http://openaccess.thecvf.com/content_CVPRW_2020/papers/w31/Ji_RealWorld_SuperResolution_via_Kernel_Estimation_and_Noise_Injection_CVPRW_2020_paper.pdf代码:RealSRCVPR2020, NTIRE2020原创 2020-06-18 11:33:34 · 1525 阅读 · 0 评论 -
视频超分辨率论文笔记
持续更新Deep SR-ITM: Joint Learning of Super-Resolution and Inverse Tone-Mapping for 4K UHD HDR Applications论文连接:https://arxiv.org/ftp/arxiv/papers/1904/1904.11176.pdf代码:https://github.com/sooyekim/Deep-SR-ITM (matlab)CVPR 2019 oral网络结构:初始图像分解为base l原创 2020-06-15 18:28:42 · 2575 阅读 · 0 评论 -
行人检测几篇论文相关笔记
这部分内容会持续更新,比较难的论文会单独开篇博文讲解,相对比较简单的就只写概要记录在此篇博文中。PedHunter: Occlusion Robust Pedestrian Detector in Crowded Scenes链接:https://arxiv.org/abs/1909.06826代码:https://github.com/ChiCheng123/PedHunter(...原创 2020-01-17 11:51:03 · 793 阅读 · 2 评论 -
Double Anchor R-CNN for Human Detection in a Crowd论文笔记
论文链接:Double Anchor R-CNN for Human Detection in a Crowd论文题目表明该算法应用场景为 拥挤人群的人体检测。一、摘要人体检测的难题:1)拥挤遮挡问题;2)后处理的NMS,很难确定阈值,太大会导致误检多,太小漏检较多,如图1所示;现象:相比于人体,头部特征更为明显,头和头之间的交叉肯定比人小很多;思想:将头部检测添加到人体检...原创 2020-01-15 13:46:04 · 1726 阅读 · 0 评论 -
FreeAnchor: Learning to Match Anchors for Visual Object Detection论文详解
问题在基于anchor的目标检测算法中,训练时,通常通过anchor和真实object 框之间的IoU来决定该anchor是否用来预测object (包括类别和位置),通常IoU超过某一阈值则认为该anchor为正例(即作为预测object ),小于某一阈值则认为该anchor为背景。本文的思想就是通过修改loss函数去除人工参与指定anchor的过程,使网络能够自主学习选择哪个anchor和真...原创 2019-09-18 20:16:57 · 1452 阅读 · 2 评论 -
few-shot learning几篇论文
Prototypical Networks for Few-shot Learning论文链接:https://arxiv.org/abs/1703.05175开源代码:https://github.com/jakesnell/prototypical-networks发表时间:2017年6月该论文属于metric_based论文中心思想:经过神经网络学会一个映射,将所有样本映射到同一...原创 2019-05-23 10:46:04 · 2370 阅读 · 0 评论 -
Learning to Compare: Relation Network for Few-Shot Learning论文笔记
前言在语音问答系统领域,很多时候,每一个类所拥有的训练数据量是很少的,采用传统的分类器进行训练,很可能出现overfitting,为了应对这种问题,最近要研究一下小样本学习。关于小样本学习的基本概念,可以参看https://www.chainnews.com/articles/650132977783.htm,该综述中还提到了每种类型算法中的典型算法。论文评价论文链接:https://ar...原创 2019-05-22 13:37:44 · 2082 阅读 · 6 评论 -
NMS(非极大值抑制)在物体检测中的应用
转自:http://blog.youkuaiyun.com/running_j/article/details/51727350非极大值抑制在物体检测方面的应用结合faster-rcnn给出的py_cpu_nms.py的源码来介绍一下nms算法在物体检测方面的应用。faster-rcnn中经过rpn层之后会得到一些boundingbox和boundingbox对应的属于某一类的分数(置信度)。所...转载 2018-03-21 15:10:00 · 832 阅读 · 4 评论 -
SSD(Single Shot Multibox Detector)算法及Caffe代码详解
由于工作原因,最近需要深刻理解SSD算法的原理,本文博客中记录了翻看不同博客的内容,每篇的侧重不同,相信大家跟我一样,从每篇文章中都能get到之前理解错误的点。转自:http://blog.youkuaiyun.com/u014380165/article/details/72824889 这篇博客主要介绍SSD算法,该算法是最近一年比较优秀的object detection算法,主要特点在于采用...转载 2018-03-21 14:21:12 · 525 阅读 · 0 评论 -
SSD详解
转自:http://blog.youkuaiyun.com/u012235274/article/details/52212077 SSD github : https://github.com/weiliu89/caffe/tree/ssdSSD paper : https://arxiv.org/abs/...转载 2018-03-20 19:09:07 · 2652 阅读 · 2 评论 -
MobileleNet学习
转自:http://blog.youkuaiyun.com/zhang1bao2/article/details/77800941MobileNet(1)文章介绍google 201704在archive上的论文。采用depthwise separable卷积核,减少计算量和模型大小。引入了两个超参数,用于选择合适大小的模型。在imagenet, object dectection, face atrribu...转载 2018-03-20 10:49:52 · 338 阅读 · 0 评论 -
分类精度评价
转自:http://blog.sina.com.cn/s/blog_95f4ca670102v9rs.html易康Developer软件中提供的【Error Matrix based on TTA MASK】和【Error Matrix based on Samples】两种精度评价方式,前者是一种基于像素的精度评价,通常情况是将验证样本的点文件或面文件以矢量专题数据的形式导入后转化为评价转载 2017-09-20 15:39:08 · 21267 阅读 · 6 评论 -
bounding-box regression
转自:http://blog.youkuaiyun.com/elaine_bao/article/details/604690360. 引言在人脸检测算法如R-CNN、Fast RCNN中都用到了bounding box回归,回归的目标是使得预测的物体窗口向groundtruth窗口相接近。我一开始没理解如何能回归出一个框来,看完下文就理解了^^下文转载自:Fast转载 2017-10-20 17:37:54 · 452 阅读 · 0 评论 -
度量学习(metric learning)
转自:http://blog.youkuaiyun.com/nehemiah_li/article/details/44230053度量学习(Metric Learning)度量(Metric)的定义 在数学中,一个度量(或距离函数)是一个定义集合中元素之间距离的函数。一个具有度量的集合被称为度量空间。1 为什么要用度量学习?很多的算法越来越依赖于在输入空间给定转载 2017-10-20 17:48:01 · 15407 阅读 · 0 评论 -
SeamlessClone泊松克隆
原文地址:http://blog.youkuaiyun.com/hjimce/article/details/45716603作者:hjimce本篇博文主要讲解2004年Siggraph的经典paper:《Poisson Image Editing》,在图像融合领域,融合效果最牛逼的paper。讲这个算法,我没打算讲太多理论的公式,理论的东西,对于大部分数学比较差的人来说看了就头晕。什转载 2017-12-11 14:41:25 · 1045 阅读 · 0 评论 -
RCNN算法详解
转自:http://blog.youkuaiyun.com/shenxiaolu1984/article/details/51066975Girshick, Ross, et al. “Rich feature hierarchies for accurate object detection and semantic segmentation.” Proceedings of the IEE转载 2018-01-17 15:46:25 · 428 阅读 · 0 评论 -
DSSD: Deconvolutional Single Shot Detector
转自:https://blog.youkuaiyun.com/yaoqi_isee/article/details/73277398论文地址:DSSD : Deconvolutional Single Shot Detector 项目地址:Github概述这篇论文应该算是SSD: Single Shot MultiBox Detector的第一个改进分支,作者是Cheng-Yang Fu, 我们熟知的Wei ...转载 2018-03-23 14:28:34 · 580 阅读 · 0 评论 -
RSSD论文详解
转载: http://blog.youkuaiyun.com/u014380165/article/details/77130922论文:Enhancement of SSD by concatenating feature maps for object detection 论文链接:https://arxiv.org/abs/1705.09587算法详解: SSD算法在object detection领域...转载 2018-03-23 15:57:47 · 5114 阅读 · 0 评论 -
RefineNet
转自:https://blog.youkuaiyun.com/u010158659/article/details/72352833?locationNum=10&fps=1[CVPR 17]RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic SegmentationGuosheng Lin, Anton Mil...转载 2018-03-23 16:19:59 · 973 阅读 · 0 评论 -
Fast RCNN
转自:http://blog.youkuaiyun.com/shenxiaolu1984/article/details/51036677 Girshick, Ross. “Fast r-cnn.” Proceedings of the IEEE International Conference on Computer Vision. 2015.继2014年的RCNN之后,Ross Girshick在15年...转载 2018-03-20 10:22:19 · 203 阅读 · 0 评论 -
Faster RCNN
转自:http://blog.youkuaiyun.com/hunterlew/article/details/71075925论文:《Faster R-CNN: Towards Real-Time ObjectDetection with Region Proposal Networks》摘要:算法主要解决两个问题:1、提出区域建议网络RPN,快速生成候选区域;2、通过交替训练,使RPN和Fast-RCNN...转载 2018-03-20 10:24:28 · 374 阅读 · 0 评论 -
YoLov1论文理解
转自:http://blog.youkuaiyun.com/hrsstudy/article/details/70305791You Only Look Once: Unified, Real-Time Object DetectionAbstract作者提出了一种新的物体检测方法YOLO。YOLO之前的物体检测方法主要是通过region proposal产生大量的可能包含待检测物体的 potential b...转载 2018-03-20 10:29:12 · 508 阅读 · 0 评论 -
Yolov2算法详解
转自:http://blog.youkuaiyun.com/jesse_mx/article/details/53925356 论文地址:YOLO9000: Better, Faster, Stronger项目主页:YOLO: Real-Time Object DetectionCaffe实现:caffe-yolo9000概述时隔一年,YOLO(You Only Look Once: Un...转载 2018-03-20 10:31:48 · 4477 阅读 · 0 评论 -
最近邻搜索值乘积量化(Product Quantization)
转自:http://blog.youkuaiyun.com/CHIERYU/article/details/50321473 和 http://blog.youkuaiyun.com/CHIERYU/article/details/50347735简介Product Quantizer是由Herv´e J´egou等人2011年在IEEEE上发表的论文《Product Qua转载 2017-10-18 17:05:59 · 1686 阅读 · 0 评论