
计算机视觉
文章平均质量分 94
计算机视觉领域的各种技术
Sophia$
算法
展开
-
MobileNet系列1:MobileNetV1论文解读
一.引言卷积神经网络(CNN)已经普遍应用在计算机视觉领域,并且已经取得了不错的效果。图1为近几年来CNN在ImageNet竞赛的表现,可以看到为了追求分类准确度,模型深度越来越深,模型复杂度也越来越高,如深度残差网络(ResNet)其层数已经多达152层。图1 CNN在ImageNet上的表现(来源:CVPR2017)然而,在某些真实的应用场景如移动或者嵌入式设备,如此大而复杂的模型是难以被应用的。首先是模型过于庞大,面临着内存不足的问题,其次这些场景要求低延迟,或者说响应速度要快,想象一.转载 2021-09-27 14:44:44 · 989 阅读 · 0 评论 -
数据增强mixup技术
目录一. mixup1. mixup方法2. mixup的讨论2.1 mixup效果如何2.2 为什么使用Beta分布2.3 参数有何影响,如何选择2.4 是否可以使用多个样本混合2.5 为什么要使用凸组合二. mixup的改进1.多种改进方法简介1.1 cutMix1.2 manifold mixup1.3 patchUp1.4 puzzleMix1.5 saliency Mix1.6 fMix1.7 co-Mix2.改进方法对比.转载 2021-09-23 15:41:33 · 29838 阅读 · 6 评论 -
Image Caption 常用评价指标
BLEU、Meteor、ROUGE、CIDEr 和 SPICE。前两个是评测机器翻译的,第三个是评测自动摘要的,最后两个评价 caption 的。1. PerplexityPerplexity其中,L是句子的长度,PPL(w_{1:L}|I) 就是根据图像 I 给出的描述句子 w_{1:L} 的 perplexity。而P(w_n|w_{1:n-1},I) 是根据图像 I 和前面的单词序列 w_{1:n-1} 生成下一个单词 w_n 的概率。一句话:Perplexity .转载 2021-03-18 16:02:52 · 3098 阅读 · 0 评论 -
使用深度学习自动给图片生成文字描述
给图像加文字描述,涉及在给定的图像(例如照片)的情况下生成人类可读的文本描述。对于人类而言,这是一个容易解决的问题,但对于机器而言却非常具有挑战性,因为它既需要理解图像的内容,又需要将这种理解转化为自然语言。近年来,深度学习方法已经取代了传统方法,并针对自动生成图像描述(称为“字幕”)的问题取得了最新技术成果。在本文中,你将发现如何使用深度神经网络模型来自动生成图像描述。完成这篇文章后,你将了解:关于为图像生成文本描述所面临的挑战以及将计算机视觉和自然语言处理方面的突破相结合的需求。转载 2021-03-18 10:21:24 · 10805 阅读 · 1 评论 -
Win 10安装和使用OpenVINO指南-详细版
1. 安装OpenVINO安装包使用的是w_openvino_toolkit_p_2021.2.185.exe。资源可在这里下载。1.1 软件配置要求Microsoft Visual Studio* with C++ 2019, 2017, or 2015 with MSBuild CMake 3.4 or higher 64-bit Python 3.6 or higher这里我使用Python 3.7.9,Visual Studio 2019。这里要提醒,Python不要使用...原创 2021-01-17 21:31:33 · 1247 阅读 · 0 评论 -
注意力机制基本原理详解及应用
注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。1. 人类的视觉注意力从注意力模型的命名方式看,很明显其借鉴了人类的注意力机制,因此,我们首先简单介绍人类视觉的选择性注意力机制。图1 人类的视觉注意力视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是一般转载 2020-08-10 14:41:03 · 31203 阅读 · 10 评论 -
图像处理概述
1. 数字图像的基本概念1.1 基本概念“图像”为“事件或事物的一种表示、写真或临摹,或一个生动的或图形化的描述”。 “图”是物体透射光或反射光的分布; “像”是人的视觉系统对图的接收在大脑中形成的印象或认识; “图像”是两者的结合;图像是客观景物通过某种系统的一种映射;从广义上说,是自然界景物的客观反映。1.1.1 图像分类1)模拟图像(物理图像):直接从观测系统(输入系统)获得、未经采样和量化的图像;模拟图像在空间分布和亮度取值上均为连续分布。2)数字图像:图像的数字表示转载 2020-07-30 14:50:47 · 1432 阅读 · 0 评论