CV
计算机视觉相关记录
Mounsey
一只小菜鸟
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
GhostNet: More Features from Cheap Operations
论文地址(CVPR2020):https://arxiv.org/abs/1911.11907pytorch代码:https://github.com/huawei-noah/ghostnet介绍在深度神经网络的特征映射中,丰富甚至冗余的信息往往保证了对输入数据的全面理解。例如,图1显示了由ResNet-50第一个残差块生成的输入图像的一些特征映射,有一些相似的特征或许可以通过线性变化得到提出了一种新的Ghost模块,可以用较少的参数生成更多的特征实现常规卷积...原创 2020-08-22 11:40:55 · 249 阅读 · 0 评论 -
MobileNet系列网络详细解读
1、MobileNetV1论文地址:https://arxiv.org/pdf/1704.04861.pdf这篇论文是谷歌在2017年提出了,专注于移动端或者嵌入式设备中的轻量级CNN网络。该论文最大的创新点是,提出了深度可分离卷积(depthwise separable convolution)设特征图尺寸为W*H,卷积核大小为k*k,输入通道数为c,有n个卷积核传统的卷积计算量为W*H*k*k*c*(https://www.jianshu.com/p/2a0f3a4a9d1d)深度可原创 2020-08-22 11:34:23 · 8048 阅读 · 0 评论 -
Simplifying Graph Convolutional Networks
一、相关介绍CNN处理的图像或者视频数据中像素点是排列整齐的矩阵(Euclidean Structure),如图2。但是如社交网络、信息网络中存在一些Non Euclidean Structure的数据,如图3.图1 图像矩阵示意图图2 社交网络拓扑示意图所以,GCN中的Graph指的是数学中的用顶点和边建立相应关系的拓扑图。产生的原因如下:CNN无法处理Non Euclidean Structure的数据(离散卷积无法在这样的数据上保持平移不变性),也就是每个拓扑图中每个顶点的相邻顶点数目都原创 2020-08-22 11:17:36 · 2257 阅读 · 0 评论 -
VGG网络解读
论文地址:https://arxiv.org/abs/1409.1556一、网络结构和配置主要贡献是使用一个带有非常小(3x3)卷积滤波器的架构对增加深度的网络进行了彻底的评估,这表明通过将深度推进到16 - 19个权重层,可以实现对先前art配置的显著改进1、结构(1)在训练中,我们的是络一个固定大小的输入224×224 RGB图像。我们所做的唯一预处理是从每个像素中减去在训练集上计算的平均RGB值。(2)图像通过卷积层的堆栈传递,其中我们使用接受域很小的过滤器:3x3(这是捕捉左/右、上/下、原创 2020-08-22 11:00:25 · 1125 阅读 · 0 评论 -
SE模块详解
下图表示一个SE 模块。主要包含Squeeze和Excitation两部分。W,H表示特征图宽,高。C表示通道数,输入特征图大小为W×H×C。1、压缩(Squeeze)第一步是压缩(Squeeze)操作,如下图所示这个操作就是一个全局平均池化(global average pooling)。经过压缩操作后特征图被压缩为1×1×C向量。2、激励(Excitation)接下来就是激励(Excitation)操作,如下图所示由两个全连接层组成,其中SERatio是一个缩放参数,这个参数的目的是为原创 2020-08-22 10:56:34 · 51485 阅读 · 10 评论 -
GoogLeNet网络系列解读
一、Inception V1Inception Module是GoogLeNet的核心组成单元。结构如下图:Inception Module基本组成结构有四个成分。11卷积,33卷积,55卷积,33最大池化。最后对四个成分运算结果进行通道上组合。这就是Inception Module的核心思想。通过多个卷积核提取图像不同尺度的信息,最后进行融合,可以得到图像更好的表征。1x1的卷积核作用1x1卷积的主要目的是为了减少维度,还用于修正线性激活(ReLU)。比如,上一层的输出为100x100x128,原创 2020-08-22 10:52:29 · 883 阅读 · 1 评论 -
计算机视觉---常见的颜色空间
RGB最常见的面向硬件设备的彩色模型,它是人的视觉系统密切相连的模型,根据人眼结构,所有的颜色都可以看做是3种基本颜色——红r、绿g、蓝b的不同比例的组合。HSVHSV颜色空间是孟塞尔彩色空间的简化形式,是一种基于感知的颜色模型。它将彩色信号分为3种属性:色调(Hue,H),饱和度(Saturation,S),亮度(Value,V)。色调表示从一个物体反射过来的或透过物体的光波长,也就是说,色调是由颜色的名称来辨别的,如红、黄、蓝;亮度是颜色的明暗程度;饱和度是颜色的深浅,如深红、浅红。 HSV颜原创 2020-06-29 18:03:53 · 2359 阅读 · 0 评论 -
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet论文地址:https://ieeexplore.ieee.org/document/9044386提出了基于骨干Alexnet体系结构的DMS-Robust Alexnet用于玉米叶片图像识别和分类的方法,结合了膨胀卷积和多尺度卷积以提高特征提取的能力。识别准确率高达98.62%。1、图像增强算法WT-DIR首先,将玉米病害图像从R原创 2020-05-21 21:06:36 · 433 阅读 · 0 评论
分享