
Computer vision
张博208
知识搬运工
展开
-
Segment Anything(SAM) & FastSAM
一篇文章搞懂Segment Anything(SAM)Segment Anything(sam)项目整理汇总【SAM】SAM & Fast SAM & Mobile SAM原创 2024-08-21 17:21:38 · 128 阅读 · 0 评论 -
DeiT:ViT&模型蒸馏
人工智能原创 2024-07-16 10:14:12 · 150 阅读 · 0 评论 -
全局响应归一化GRN解析
这就是一个特征重标定的过程,特征归一化输出的其实是一个权重值,这个值载荷输入x相乘就能获得每个通道的重要程度,GRN中还加入了两个可学习参数weight和bias用于优化。通过在H和W维度上使用L2范数,把空间特征聚合成为一个向量,其实也可以使用类似SE里的全局平均池化层,主要用于获取全局性的通道信息。用于计算当前通道相对于其他通道的相对重要性,其值在0~1之间,该方法类似于SE里的sigmoid输出。中提出的一种归一化方法,其实也就是一种注意力机制,跟视觉中常用的。转载 2024-07-15 16:55:59 · 722 阅读 · 0 评论 -
PixelShuffle上采样原理
PixelShuffle是目前通用上采样upsample技术中性能最好的。PixelShuffle现已广泛应用在如图像分割等计算机视觉问题上,和。一起成为了神经网络中最常用的两种上采样技术。原创 2023-04-12 11:36:45 · 350 阅读 · 0 评论 -
Swin-Transformer网络结构详解
swin-transformer原创 2023-03-14 16:24:48 · 117 阅读 · 0 评论 -
计算机视觉 神经网络基础理论
基础问题原创 2022-12-09 14:56:35 · 1260 阅读 · 0 评论 -
经典论文阅读笔记——VIT、Swin Transformer、MAE、CILP
学习转载 2022-09-01 21:59:27 · 115 阅读 · 0 评论 -
关于「Inception」和「Xception」的那些事
https://zhuanlan.zhihu.com/p/33999416原创 2020-09-30 16:24:31 · 188 阅读 · 0 评论 -
IoU、GIoU、DIoU、CIoU损失函数的那点事儿
https://zhuanlan.zhihu.com/p/94799295转载 2020-09-27 17:51:56 · 977 阅读 · 0 评论 -
Global Average Pooling、Global Max Pooling
https://www.zhihu.com/question/358913301https://blog.youkuaiyun.com/qq_16234613/article/details/79520929https://www.cnblogs.com/hutao722/p/10008581.html原创 2020-09-26 18:27:09 · 599 阅读 · 0 评论 -
Deformable Convolutional Networks
1 空洞卷积1.1 理解空洞卷积在图像分割领域,图像输入到CNN(典型的网络比如FCN)中,FCN先像传统的CNN那样对图像做卷积再pooling,降低图像尺寸的同时增大感受野,但是由于图像分割预测是pixel-wise的输出,所以要将pooling后较小的图像尺寸upsampling到原始的图像尺寸进行预测,之前的pooling操作使得每个pixel预测都能看到较大感受野信息。因此图像分割FCN中有两个关键,一个是pooling减小图像尺寸增大感受野,另一个是upsampling扩大图像尺寸。在先转载 2020-09-15 19:06:10 · 1151 阅读 · 0 评论 -
DenseNet:密集连接卷积网络
https://www.jianshu.com/p/0b8fc900abefhttps://blog.youkuaiyun.com/u014380165/article/details/75142664原创 2020-09-14 09:56:49 · 261 阅读 · 0 评论 -
MobileNet
https://blog.youkuaiyun.com/mzpmzk/article/details/82976871https://www.cnblogs.com/yanshw/p/12563872.htmlhttps://www.cnblogs.com/dengshunge/p/11334640.html原创 2020-09-13 18:20:25 · 105 阅读 · 0 评论 -
Depthwise Separable Convolution详解
https://blog.youkuaiyun.com/sinat_26114733/article/details/89076714转载 2020-09-13 17:55:28 · 190 阅读 · 0 评论 -
标签平滑Label Smoothing
https://blog.youkuaiyun.com/qq_43211132/article/details/100510113https://blog.youkuaiyun.com/sinat_36618660/article/details/100166957原创 2020-09-13 16:57:22 · 163 阅读 · 0 评论 -
数据增强——mixup
https://blog.youkuaiyun.com/u013841196/article/details/81049968转载 2020-09-13 16:46:08 · 298 阅读 · 0 评论 -
上采样和PixelShuffle
https://blog.youkuaiyun.com/g11d111/article/details/82855946转载 2020-08-28 12:14:02 · 160 阅读 · 0 评论 -
BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结
https://blog.youkuaiyun.com/liuxiao214/article/details/81037416转载 2020-08-26 11:43:05 · 162 阅读 · 0 评论 -
deconvolution;Atrous convolution;Depthwise separable convolution是什么?
文章目录 转置卷积(deconvolution) 微步卷积 空洞卷积(Atrous Convolution)/膨胀卷积 深度可分离卷积(Depthwise separable convolution) 转置卷积(deconvolution)转置卷积是一个将低维特征转换到高维特征。为什么叫做转置卷积呢?其实就是引入了转置的思想。假设我们现在有一个p维的向量Z,然后有个d维的向量X,p<d. 这样就会出现 Z = W·X,其中W的维度为(p,d),叫做转换矩阵. 现.转载 2020-08-24 19:16:45 · 299 阅读 · 0 评论 -
Neural Style Transfer 神经风格迁移详解
Neural Style Transfer 神经风格迁移详解今天和大家分享一个比较有意思的东西,Neural Style Transfer,神经风格迁移,简单说就是我们将一张普通的照片赋予它艺术作品风格。大家应该都知道风靡一时的prisma应用,这个应用背后的原理就是这个。我们选择一张普通的照片,再选择一张艺术作品,同时输入,经过神经风格转换,就能给这张照片赋予艺术的风格。那么是如何做到的呢?接下来看最早提出来神经风格迁移的是 Leon A. Gatys,他先后在2015年和2016年发表了两篇转载 2020-08-24 11:10:42 · 1731 阅读 · 0 评论 -
超分损失函数小结
原论文:Deep Learning for Image Super-resolution: A Survey1.Pixel Loss:用来度量生成图片和目标图片的像素级的差异1.1 L1 loss1.2 L2 loss1.3 Charbonnier loss:L1 Loss的变体,最后参数是一个很小常量(e.g., 1e − 3),为了使数值稳定像素损失是最常见的损失,通常L2损失能够对大的损失进行惩罚,但是在小的损失上无能为力,效果不如L1,像素损失实际上并没...转载 2020-08-24 10:53:54 · 4824 阅读 · 0 评论 -
格拉姆矩阵(Gram matrix)详细解读
目录基础知识-向量的内积 Gram matrix介绍 Gram matrix的应用-风格迁移一、基础知识-向量的内积1.1向量的内积定义:也叫向量的点乘,对两个向量执行内积运算,就是对这两个向量对应位一一相乘之后求和的操作,内积的结果是一个标量。1.2实例:a和b的内积公式为:1.3作用:内积判断向量a和向量b之间的夹角和方向关系a·b>0 方向基本相同,夹角在0°到90°之间 a·b=0 正交,相互垂直 a·b<0 方向...转载 2020-08-24 10:52:25 · 21973 阅读 · 4 评论 -
上采样和PixelShuffle
0、前言上采样:可以简单的理解为任何可以让你的图像变成更高分辨率的技术。 最简单的方式是重采样和插值:将输入图片input image进行rescale到一个想要的尺寸,而且计算每个点的像素点,使用如双线性插值bilinear等插值方法对其余点进行插值。 Deconvolution(反卷积)在CNN中常用于表示一种反向卷积 ,但它并不是一个完全符合数学规定的反卷积操作。 反卷积也被称为分数步长卷积(convolution with fractional strides)或者转置卷积(transpo转载 2020-06-29 10:05:18 · 1131 阅读 · 0 评论 -
目标检测中的样本不平衡处理方法——OHEM, Focal Loss, GHM, PISA
https://www.jianshu.com/p/f305b573df8f转载 2020-05-13 09:28:22 · 386 阅读 · 0 评论 -
Self-critical Sequence Training for Image Captioning
https://blog.youkuaiyun.com/sinat_26253653/article/details/78458894转载 2020-05-06 09:48:54 · 281 阅读 · 0 评论 -
什么是多模态机器学习?
首先,什么叫做模态(Modality)呢?每一种信息的来源或者形式,都可以称为一种模态。例如,人有触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。同时,模态也可以有非常广泛的定义,比如我们可以把两种不同的语言当做是两种模态,甚至在两种不同情况下采集到的数据集,亦可认为是两种模态。因此,多模态机器学习,...转载 2020-04-13 09:52:11 · 1598 阅读 · 1 评论 -
FaceNet
FaceNet解读整理https://blog.youkuaiyun.com/gubenpeiyuan/article/details/80470811Facenet 原理介绍https://blog.youkuaiyun.com/lq126126/article/details/80776105原创 2020-04-06 12:49:25 · 173 阅读 · 0 评论 -
Contrastive Loss ,Triplet loss (对比损失)
https://blog.youkuaiyun.com/autocyz/article/details/53149760https://blog.youkuaiyun.com/kklots/article/details/48969533原创 2020-04-02 09:23:17 · 1379 阅读 · 0 评论 -
Atrous Convolution详解
https://blog.youkuaiyun.com/ywcpig/article/details/79792399转载 2020-04-02 09:15:46 · 363 阅读 · 0 评论 -
视觉网络
深入理解深度学习分割网络Unet——U-Net: Convolutional Networks for Biomedical Image Segmentationhttps://blog.youkuaiyun.com/Formlsl/article/details/80373200Mask RCNN笔记https://blog.youkuaiyun.com/xiamentingtao/article/det...原创 2020-04-02 09:05:17 · 573 阅读 · 0 评论 -
谷歌——DeepLab v1
https://blog.youkuaiyun.com/gzq0723/article/details/79634443转载 2020-03-16 20:50:52 · 164 阅读 · 0 评论 -
Hough transform(霍夫变换)
主要内容:1、Hough变换的算法思想2、直线检测3、圆、椭圆检测4、程序实现一、Hough变换简介 Hough变换是图像处理中从图像中识别几何形状的基本方法之一。Hough变换的基本原理在于利用点与线的对偶性,将原始图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点。这样就把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题。也即把检测整体特性转...转载 2020-01-07 17:43:43 · 608 阅读 · 0 评论 -
Canny边缘检测
声明:阅读本文需要了解线性代数里面的点乘(图像卷积的原理),高等数学里的二元函数的梯度,极大值定义,了解概率论里的二维高斯分布1.canny边缘检测原理和简介2.实现步骤3.总结一、 Canny边缘检测算法的发展历史 Canny算子是28岁的JohnCanny在1986年提出的,该文章发表在PAMI顶级期刊(1986.A computational approach...转载 2020-01-07 17:39:48 · 377 阅读 · 0 评论 -
【语义分割】--SegNet理解
https://blog.youkuaiyun.com/zhuzemin45/article/details/79709874原创 2019-12-05 15:12:57 · 263 阅读 · 0 评论 -
Dilated/Atrous conv 空洞卷积/多孔卷积
https://blog.youkuaiyun.com/silence2015/article/details/79748729原创 2019-12-05 15:11:35 · 119 阅读 · 0 评论 -
simhash原理及使用
https://blog.youkuaiyun.com/qq_16912257/article/details/72156277转载 2019-12-03 09:54:54 · 154 阅读 · 0 评论 -
DenseNet算法详解
https://blog.youkuaiyun.com/u014380165/article/details/75142664/转载 2019-12-03 09:53:38 · 191 阅读 · 0 评论 -
(RegionProposal Network)RPN网络结构及详解
RPN(RegionProposal Network)区域生成网络Faster-RCNN的核心。在这里整理。1.anchors。特征可以看做一个尺度51*39的256通道图像,对于该图像的每一个位置,考虑9个可能的候选窗口:三种面积{128,256,512}×{128,256,512}×三种比例{1:1,1:2,2:1}{1:1,1:2,2:1}。这些候选窗口称为anchors...转载 2019-12-02 16:17:20 · 308 阅读 · 0 评论 -
目标检测网络之 YOLOv3
yolo-idea本文逐步介绍YOLO v1~v3的设计历程。YOLOv1基本思想YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体。yolo-grid-predict每个格子预测B个bounding box及其置信度(confidence score),以及C个类别概率...转载 2019-12-02 16:16:19 · 325 阅读 · 0 评论 -
目标检测算法之一 YOLO初步讲解
目前目标检测算法有很多,譬如:R-CNN,Faster R-CNN,DPM,RPN等等,YOLO也是其中之一,YOLO是当前目标检测算法中发展最为迅速的一个。YOLO结合了GooleNet modification和卷积神经网络的知识,可以对图像中的物体进行分类和定位。卷积神经网络对于物体分类来说效果是很好的,YOLO利用卷积层提取物体特征,通过全连接层进行分类和定位。接下来,我将大概讲一下YOL...转载 2019-12-02 16:14:32 · 552 阅读 · 0 评论