论文笔记
文章平均质量分 85
小趴菜也想当卷王
目前博士在读,研究方向为目标检测以及目标检测在植物疾病检测的应用。硕士研究行为识别与医学图像处理。欢迎各位学者大胆交流。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
动态卷积 Dynamic convolution
动态卷积的相关文章原创 2022-03-17 15:45:35 · 22138 阅读 · 9 评论 -
Swin-Transformer理解
https://www.jianshu.com/p/0635969f478b一. 概要关于swin transformer的原理有很多文章已经讲得非常清楚了,而且很详细,自问自己的功底是不如这些大佬的,只能尽一份绵薄之力,让大家更方便的跑通代码。那么在这篇博客我想要分享的是我自己在理解swin transformer过程中产生的疑惑以及解决之后的想法。首先是假设大家已经读了论文,以及一些博客了。然后咱们来看看在这里会不会有一些共鸣。不知道大家看的时候有没有产生这样的疑问。1、关于swin transf转载 2021-11-08 10:48:10 · 1356 阅读 · 0 评论 -
Compressed Video Action Recognition论文笔记
Compressed Video Action Recognition论文笔记这是一篇2018年的CVPR论文。做了关键内容的记录。对于细节要去论文中认真找。摘要:训练一个稳定的视频表示比学习深度图像表示更加具有挑战性。由于原始视频的尺寸巨大,时间信息大量冗余,那些真正有用的信号通常被大量的无关数据淹没,通过视频压缩可以将信息量减少多达两个数量级。我们提出直接在神经网络上训练压缩的视频。这...原创 2018-12-01 21:51:51 · 1680 阅读 · 3 评论 -
MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition论文笔记
2D/3D联合卷积模块MiCT:全面提升行为识别的性能和效率编者按:行为识别是计算机视觉领域的一个重要研究方向,在监控、自动驾驶等日常场景中具有广泛的应用前景。为了提升3D CNN在行为识别分析中的性能,微软亚洲研究院网络多媒体组在CVPR 2018上提出了一个简单而高效的3D/2D混合卷积模块(MiCT)。MiCT模块使3D CNN能够以更少的3D时空融合、更小的模型、更快的速度来提取到更深...转载 2019-02-17 14:41:59 · 1822 阅读 · 0 评论 -
Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition论文
这是我转载的别人的一片写的还不错的论文笔记,由于内容比较多,就没有自己写。这是一片2018年的CVPR上的一片文章,提出了一种基于光流引导的特征(OFF),将这个特征融入到CNN网络中论文地址:http://openaccess.thecvf.com/content_cvpr_2018/html/Sun_Optical_Flow_Guided_CVPR_2018_paper.htmlOpt...转载 2019-02-24 14:47:06 · 727 阅读 · 0 评论 -
Deep High-Resolution Representation Learning for Human Pose Estimation
基本思想:作者观察到,现有姿态估计算法中往往网络会有先降低分辨率再恢复高分辨率的过程,比如下面的几种典型网络。为便于表达,在下面的a、b、c、d四幅图中,同一水平线上的特征图为相同分辨率,越向下分辨率越小,在最终的高分辨率特征图heatmap中计算姿态估计的关键点。下图描述了作者的思想:在上图中网络向右侧方向,深度不断加深,网络向下方向,特征图被下采样分辨率越小,相...转载 2019-04-13 15:06:48 · 3067 阅读 · 0 评论 -
NTU-RGBD-120数据集
github:https://github.com/shahroudy/NTURGB-D上面有NTU-RGBD和NTU-RGBD120两个数据集,NTU-RGBD120是NTU-RGBD的增强版。从原先的60个动作,拓展到120个动作,从之前的40名演员,扩展到106名演员。具体内容去看github和论文中介绍吧。https://github.com/lshiwjx/2s-AGCN...原创 2019-06-16 21:22:03 · 10770 阅读 · 11 评论
分享