
论文阅读笔记
论文阅读的方法和内容介绍。
Lyndsey
这个作者很懒,什么都没留下…
展开
-
计算机视觉及图像处理领域会议,CCF推荐(A类,B类,C类)
https://blog.youkuaiyun.com/qq_15029743/article/details/84887343转载 2019-07-11 11:12:37 · 3666 阅读 · 0 评论 -
论文笔记-LiteFlowNet3: Resolving Correspondence Ambiguity for More Accurate Optical Flow Estimation
Hello, 这是论文阅读计划的第25篇啦!Code: https://github.com/twhui/LiteFlowNet3一、背景介绍光流估计是计算机视觉中的经典问题。它广泛应用于运动跟踪、动作识别、视频分割、三维重建等领域。随着深度学习的发展,许多研究工作试图利用卷积神经网络来解决这个问题。大多数CNN属于从图像对推断流场的2帧方法。特别是,LietFlowNet和PWC-Net 是第一个提出在从粗到细的估计中使用多个金字塔级别的特征扭曲和成本量的CNNs。这极大地减少了模型参数的数量,从F原创 2020-12-07 11:17:11 · 1165 阅读 · 0 评论 -
论文笔记-Reliable Supervision from Transformations for Unsupervised Optical Flow Estimation
Hello, 这是论文阅读计划的第24篇啦今天介绍的这篇论文是CVPR 2020的论文,非监督的光流估计。一、背景介绍光流作为图像的运动描述,已经广泛应用于高级视频任务。得益于深度学习的发展,基于学习的光流方法具有相当高的精确度和高效的推理能力,正逐渐取代经典的基于变分的方法。然而,在现实中很难收集到稠密光流的基本事实,这使得大多数有监督的方法严重依赖于大规模的合成数据集,并且当模型转移到现实世界时,区域差异导致潜在的退化。从另一个角度来看,许多著作提出了以无监督的方式学习光流,其中ground t原创 2020-12-07 10:33:20 · 857 阅读 · 0 评论 -
论文笔记-PointASNL: Robust Point Clouds Processing using Nonlocal Neural Networks with Adaptive Sampling
Hello,这是论文阅读计划的第23篇啦~一、背景介绍随着3D传感器的普及,我们可以相对容易地获得更多原始3D数据,例如RGB-D数据、激光雷达数据和微机电系统数据。考虑到点云是3D数据的基本代表,对于各种应用,例如自动驾驶、机器人和位置识别,对点云的理解已经引起了广泛的关注。与2D图像不同,稀疏性和无序特性使得鲁棒的点云处理成为一项具有挑战性的任务。此外,从这些3D传感器或重建算法获得的原始数据在现实世界中不可避免地包含异常值或噪声。与2D图像的情况不同,传统的卷积运算不能直接处理非结构化的点云数原创 2020-12-06 21:39:15 · 482 阅读 · 0 评论 -
论文笔记-BANet: Bidirectional Aggregation Network with Occlusion Handling for Panoptic Segmentation
Hello,论文阅读计划的第22篇啦~22/30这篇论文来介绍一下全景分割,也是我第一次了解这个课题方向啦。论文代码:https://github.com/Mooonside/BANet一、背景介绍全景分割是计算机视觉中一个新兴的、具有挑战性的问题,它是一个将语义分割(针对背景材料)和实例分割(针对前景实例)统一起来的复合任务。任务的典型解决方案是自上而下的深度学习方式——首先识别实例,然后分配给语义标签。通过这种方式,鲁棒的解决方案产生了两个关键问题:1)如何有效地建模语义分割和实例分割之间的内原创 2020-12-06 16:43:38 · 1205 阅读 · 1 评论 -
论文笔记-BMBC:Bilateral Motion Estimation with Bilateral Cost Volume for Video Interpolation
一、背景介绍时间分辨率是影响视频质量的一个重要因素。为了提高时间分辨率,已经提出了许多视频插值算法,它们合成两个实际帧之间的中间帧。这些算法广泛应用于各种应用,包括视觉质量增强、视频压缩、慢动作视频生成和视图合成。然而,由于各种因素,如大的非线性运动、遮挡和光照条件的变化,视频插值具有挑战性。特别是,为了产生高质量的中间帧,精确地估计运动或光流矢量是重要的。最近,随着基于深度学习的光流方法的发展,已经开发了基于流的视频插值算法,产生了可靠的插值结果。Niklaus等基于前向扭曲生成中间帧。然而,由于孔洞原创 2020-12-06 11:20:33 · 1329 阅读 · 0 评论 -
论文笔记-Global-Local Bidirectional Reasoning for Unsupervised Representation Learning of 3D Point Cloud
Hello, 今天是论文阅读计划的第20天啦~今天要介绍的论文是关于3D点云的,也是我看的第一篇关于3D点云的文章。之前有听过这个名词,但是一直也没有去了解过,今天就趁着这篇文章好好的了解一下啦。一、背景促进机器理解3D世界对于许多重要的现实世界应用来说是至关重要的,例如自动驾驶、增强现实和机器人。点云等3D几何数据的一个核心问题是学习有区别、通用和鲁棒的强大表示。为了解决这个问题,在大量人工标注的超视觉信息的帮助下,建立了点云分析的当前技术水平。然而,人工标记的数据需要很高的人工成本,并可能限制所学原创 2020-11-30 22:43:49 · 335 阅读 · 0 评论 -
论文笔记-Suppress and Balance: A Simple Gated Network for Salient Object Detection
Hello, 今天是论文阅读计划的第19天啦~也是我在这30天中要介绍的最后一篇目标检测的论文啦一、背景最显著的目标检测方法使用的基本结构是三角网或特征金字塔网络(FPN)。这些方法忽略了编码器与解码器交换信息时的两个关键问题:一是它们之间缺乏干扰控制,二是没有考虑不同编码器块贡献的差异。在这项工作中,我们提出了一个简单的门控网络来同时解决这两个问题。众所周知,解码器中预测的高质量显著图严重依赖于编码器提供的有效特征。然而,上述方法直接使用all-pass skip-layer结构来将编码器的特征连原创 2020-11-29 21:03:44 · 1785 阅读 · 0 评论 -
论文笔记-Multi-Scale Positive Sample Refinement for Few-Shot Object Detection
Hello, 论文阅读计划的第18天啦~今天接着前两天的目标识别方向的论文来介绍~一、背景本文主要想解决的问题是有些训练数据并不是非常方便获取,从而导致训练、识别效果不好。对于物体检测,标记数据相当昂贵,并且一些物体类别的样本甚至难以收集,例如濒危动物或肿瘤病变。这引发了对处理有限训练样本的有效检测器的极大关注。二、研究内容 & 贡献本文提出了一种Multi-scale Positive Sample Refinement (MPSR)方法用于few-shot 目标检测,旨在解决其稀疏尺原创 2020-11-28 22:21:57 · 2071 阅读 · 0 评论 -
论文笔记-Dual Refinement Underwater Object Detection Network
Hello,今天是论文阅读计划的第17天~今天来学习的一篇论文也是关于目标检测的~不过变成水下的了Code: https://github.com/Peterchen111/FERNet一、背景目前,水下机器人应用于许多领域,如水下目标捕捉、水下调查和水下搜索。水下目标检测作为水下机器人的关键技术,仍然面临着严峻的挑战(如模糊、纹理失真、光照不平衡等)。当我们直接在水下场景中使用通用检测算法时,它们不能很好地工作。为了解决这些问题,我们提出了一种具有特征增强和锚细化的水下检测框架。它有一个复合连接主原创 2020-11-27 22:17:34 · 1318 阅读 · 1 评论 -
论文笔记-A Single Stream Network for Robust and Real-time RGB-D Salient Object Detection
昨天当作15天休息一天吧那么今天就是论文阅读计划的第16天了今天开始介绍目标检测相关的论文啦~天池有一个将这篇论文的视频,感兴趣的朋友可以去看看:https://tianchi.aliyun.com/course/video?liveId=41223一、背景显著目标检测旨在估计图像区域的视觉意义,进而分割出显著目标。它已被广泛应用于许多领域,例如场景分类[29]、视觉跟踪[21]、人的重新识别[30]、前景图评估[10]、内容感知图像编辑[52]、光场图像分割[36]和图像字幕[14]等。随着深原创 2020-11-22 22:45:43 · 704 阅读 · 0 评论 -
论文笔记-MSFM: Multi-scale Fusion Module for Object Detection
论文阅读计划的第15天一、研究背景目标检测要求检测器使用边界框定位图像中的对象,并为每个对象分配正确的类别。目标检测的关键挑战之一是协调解决两个子任务,即定位和分类。定位要求网络准确捕捉对象的位置,而分类则要求网络提取对象的语义信息。特征融合有利于双重目标检测任务。一方面,当来自浅层和深层的高分辨率和低分辨率特征被融合时,细节和位置信息可以与语义信息相结合。另一方面,可以在不同的尺度上检测对象,提高了框架的健壮性。二、研究内容本文提出了一个多尺度融合模块(MSFM),它从一个单一的输入中提取细节和原创 2020-11-20 22:13:00 · 1663 阅读 · 3 评论 -
论文笔记-Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing
第1…4天啦今天依旧给大家介绍一篇人脸反欺骗的论文,略读。一、研究背景人脸反欺骗对人脸识别系统的安全性至关重要。深度监督学习已被证明是最有效的人脸反欺骗方法之一。尽管取得了巨大的成功,但大多数先前的工作仍然通过简单地用深度来增加损失来将问题公式化为单帧多任务问题,同时收集详细的细粒度信息以及面部深度和运动模式之间的差异。以往的方法通常将人脸反欺骗形式化为欺骗和现实生活之间的二元分类。然而,这些方法对于探索欺骗模式的本质是具有挑战性的,例如皮肤去尾的丢失、颜色失真、莫尔模式和欺骗伪像。为了克服这个问原创 2020-11-19 20:45:29 · 693 阅读 · 0 评论 -
CelebA-Spoof: Large-Scale Face Anti-Spoofing Dataset with Rich Annotations
Hello, 今天是论文阅读计划的第13天啦今天介绍一片关于人脸反欺骗的文章~实验室最近有本科生要做这个的毕设,既然我对自己有论文阅读计划的安排,那我就把这个课题当作课外补充,来了解一下这块的知识。论文阅读计划主要是用来自己扩充知识,如果能与实际结合,给他们提提建议那也是不错的。CelebA-Spoof:大规模带有丰富的标注的人脸反欺骗数据集来自北京交通大学、商汤科技、香港中文大学等单位贡献了一个大规模的人脸反欺骗数据集CelebA-Spoof,其论文被ECCV 2020 收录。一、研究背景随原创 2020-11-18 16:12:34 · 843 阅读 · 0 评论 -
论文笔记-Random Shifting for CNN: a Solution to Reduce Information Loss in Down-Sampling Layers
Hello,今天是论文阅读计划的第12天啦,快过半了哦~今天为大家介绍的这篇论文,主要说的是在下采样层通过加入随机转换的操作,可以减少信息损失而提升精度,并且不增加任何多的计算量。一、方法随机移位可以应用于任何下采样层,以减少信息损失。只要特征图上的核步距大于1,随机移位的可用域就不为空。在训练的每次迭代中,我们从可用的随机移位域中随机选择一个作为偏移量。算法1描述了随机移位的过程:随机移位可以进一步增强最大池化层和交错卷积层的变换不变性,因为随机策略通过在特征图上移位核中心来扩展感受野。具有原创 2020-11-17 22:31:04 · 622 阅读 · 0 评论 -
论文笔记-Learning from Synthetic Data for Crowd Counting in the Wild 人群计数新方法
Hello, 今天是论文阅读计划的第11天啦。今天介绍的这篇论文是CVPR 2019的一篇论文,是关于在室外拥挤的人群中的人群计数问题。哈哈,这是我在看别人整理的CVPR论文合集的时候,发现了这篇论文,然后对这个任务有点好奇,所以就下载来看看学习下了。附上别人整理资料:CVPR 2020 论文开源项目合集:https://github.com/amusi/CVPR2020-CodeECCV 2020 论文开源项目合集:https://github.com/amusi/ECCV2020-Code论文原创 2020-11-16 22:15:17 · 633 阅读 · 0 评论 -
论文笔记-Searching Central Difference Convolutional Networks for Face Anti-Spoofing
Hello 今天是论文阅读计划的第10天啦,转眼就过去三分之一啦~接下来的论文笔记,我不会再局限于基于骨架的人体动作识别这块啦,会开始了解和学习下其他方向的论文。目前主要来源是CVPR2020的论文,我会找一些我比较感兴趣的论文来解读~今早已经下载了10多篇,就觉得这样还挺好的挺有趣的。今天为大家介绍一篇人脸活体检测的论文,貌似也叫人脸反欺骗(Face Anti-Spoofing, FAS),那就一起来了解了解吧~一、题目关键词解读Searching:应该是使用了NAS相关的技术Central原创 2020-11-15 10:41:21 · 1912 阅读 · 0 评论 -
论文笔记-混合卷积MixConv: Mixed Depthwise Convolutional Kernels
Hello,今天是论文阅读计划的第9天啦~调整计划后,现在都趁着早上最安静最无打扰的时候看论文,完成每天的论文阅读任务。今天我们介绍一篇混合卷积的内容,我最初找到这篇论文呢,是因为我自己做的论文,在思考怎么能让它更好的补获时序信息。所以现在会有意识的培养自己论文阅读的习惯,不断累积更多的想法,在未来突然有需要的时候,脑袋里不会空空如也。一、题目关键词解读MixConv: 混合卷积,思考怎么混合法?大概是不同大小的卷积吧,但具体怎么设置还要继续往下看。Depthwise: DW卷积,最初了解到它的时原创 2020-11-14 09:34:39 · 1640 阅读 · 0 评论 -
论文笔记-Temporal Extension Module for Skeleton-Based Action Recognition
Hello, 今天是论文阅读的第八天啦目前每天一篇真的稍微有点吃不消啦,但是说好的30天论文阅读打卡,自己又不想就这样放弃啦。就像怡姐姐说的那样,什么是爱自己?自己说出的话,都全力去做到。这句话让我感受到了一种力量~所以为了完成这个计划,我决定要做出适当的调整了。接下来我会每天早睡早起23睡6起,然后用早晨最宝贵最安静的时间来阅读论文。每天保证1-1.5小时的阅读论文时间,产出一片略读的论文应该还是能吃得消的。如果还有问题的话,就再继续做出调整。给自己加油打气!一、解读题目关键词Temporal原创 2020-11-13 19:43:50 · 454 阅读 · 0 评论 -
论文笔记-Skeleton-Based Action Recognition with Shift Graph Convolutional Network
转眼来到了论文阅读计划的第七天啦~(存货也日益耗尽啦大家如果有看到不错的论文,也推荐我来看看~嘻嘻嘻别人都是剧荒、小说荒,我们一起论文荒哈哈哈哈哈平时我主要是根据自己的论文需求来看论文,所以覆盖面相对就比较狭窄,所以欢迎大家来扩充我的认知库!!!今天介绍一篇在提升准确率的同时,大大优化性能、效率的一篇论文。一、题目关键词解读shift: 转换、移位二、研究背景本文也是基于ST-GCN这篇论文来改进的,之前绝大多数论文都在疯狂提升NTU数据集的准确率,极少有人关注效率这块。目前准确率已经很难再继原创 2020-11-12 21:21:14 · 740 阅读 · 2 评论 -
论文笔记-Squeeze-and-Excitation Networks
Hello, 今天是论文阅读计划的第六天。今天介绍的这篇论文,是我在做我自己的论文时搜索到的。我的目的是想找到更有效的注意力机制,刚好这一篇论文提出的方法是即插即取的形式,所以就了解学习了下。????论文及代码:PaperCodeCode-PyTorch在学习这篇论文的时候,看到了论文作者自己对于本文的解读,以及别人写的非常好的笔记,所以本文也会借鉴他们的部分内容。 参考链接一、论文题目关键词Squeeze: 挤、压Excitation: 刺激、激发这两个词有一点点对立的感觉,先挤压再刺原创 2020-11-11 20:45:06 · 326 阅读 · 0 评论 -
论文笔记-Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition
Hello,今天是论文阅读计划的第5天啦。今天这篇论文比较简单,没有什么特别复杂的技术。一、论文题目关键词提取Richly:丰富地。为什么称之丰富的呢?丰富地激活了什么呢?Robust: 鲁棒的。提取的特征更具备鲁棒性?带着疑问往下阅读。二、研究背景这个NTU数据集上目前都是直接识别分类的,但实际真实情况下,会出现物体遮挡、自遮挡等情况。现有的算法在缺失的情况下,性能下降非常多非常快。本篇论文的Baseline是ST-GCN。三、研究目标 & 内容目标:提升ST-GCN的准确率,在原创 2020-11-10 19:08:25 · 724 阅读 · 0 评论 -
论文笔记-ExGAN: Adversarial Generation of Extreme Samples
Hello,今天是论文阅读计划的第四天啦。有一个小尴尬的事情是,我最近比较熟悉的论文差不多也写上来了,相当于脑子里没什么可以直接输出的论文啦,有些要么是只读了最基本的没去研究方法的论文,有些要么是很早之前看了却有点忘了。对此呢,也得作出调整才好呀。我这个论文阅读计划的初衷就是想让自己首先能保持论文阅读的习惯,其次是能拓展下视野,不要局限在了自己这个小方向中,想要做出好的论文,只看自己这个领域的论文是远远不够的。我也是在与自己想要“完美”做斗争,总觉得如果只看了一篇论文的大概,并没有完全理解别人方法的时原创 2020-11-10 08:59:53 · 502 阅读 · 0 评论 -
论文笔记-Vertex Feature and Hierarchical Temporal Modeling in a Spatial-Temporal Graph Convolutional Net
今天是论文阅读计划的第三天啦,为大家送上一篇论文略读笔记,看了主要部分,但不是精读扣细节。略读时主要是看看别人用了什么方法处理了什么东西解决了什么问题,收集点子,一、解读论文题目关键词Vertex Feature、Hierarchical Temporal Modeling,一个是针对顶点特征的,一个是针对时序信息建模的。二、研究背景本文是基于ST-GCN来做的改进,也是对ST-GCN的改进版AS-GCN的改进。关注了ST-GCN中对于原骨架信息编码以及时序建模的不足,分别对其进行了改进。三、研究原创 2020-11-09 08:33:54 · 334 阅读 · 0 评论 -
论文笔记--Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition
Hello, 今天是论文笔记计划的第二天啦。今天为大家介绍下这篇“重磅级”论文,目前是该方向SOTA的论文,并且从处理上来看,与之前大家不断改进的ST-GCN的那些论文来看,引入了一些新的视角,还是值得我们学习的。(细心认真的读者借鉴我的论文笔记模版,摸索出一个属于你们最适宜的论文笔记模版。当我阅读一定量之后,我相信我的笔记模版侧重点也会开始发生变化,因为最适合自己的才是最好的。)其实在慢慢做论文的过程中,就有一点发现,你想用什么或者改什么的时候,那些“点”往往不是从普通的论文笔记找到的,而是在经过自原创 2020-11-07 21:29:35 · 1037 阅读 · 0 评论 -
论文笔记--Skeleton-Based Action Recognition with Multi-Stream Adaptive Graph Convolutional Networks
Hello,接下来的30天,我会坚持输出30篇论文笔记,有些论文会配上代码的理解。以输出的方式倒逼着自己去输入。想做实验,但是脑袋空空如也,没有新的想法,这是大脑在提醒你该踏实去科研去看论文做实验;想写论文,逻辑不清此举匮乏,这是大脑在提醒你该多多看论文记录下那些好的词句;想写一些文字表达自己想法时,却不知如何下笔,这是在大脑在提醒自己该看书了。这样的情形还有很多,但我想表达的并不是“你真懒”,“You are bad”或者其他负面的话语。我想说,我们要看清、认清这些时刻,然后对其作出自己的调整和改变即原创 2020-11-06 20:56:28 · 1004 阅读 · 2 评论