
计算机视觉
文章平均质量分 62
-circle-
这个作者很懒,什么都没留下…
展开
-
PicoDet代码学习记录
paddle detection的推理代码粗略学习原创 2022-12-12 19:44:28 · 651 阅读 · 2 评论 -
【CVPR2018】Group Normalization
作者摘要BN是一个深度学习发展的里程碑,给多种网络训练赋能。但当batch变小,由于不准确的batch统计估计,BN的错误率会快速增加。这限制了BN在大模型的应用。本文提出Group Normalization(GN),作为BN的一个简单替换。GN将通道数分成多个组,在每个组计算均值和方差来归一化,计算独立于batch size,且在batchsize的大变化范围内性能稳定。在ImageNet训练的ResNet-50,batch size为2时GN的错误率比BN低10.6%;在batch size.原创 2020-08-06 15:42:17 · 525 阅读 · 0 评论 -
【CVPR2020】Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a Ne
【CVPR2020】Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy作者摘要数据增广能有效提升深度网络性能,本文对现有的超分数据增广进行了一套综合分析。对于图像重建,像素空间关系很重要。本文提出CutBlur,即将高/低分辨率patch剪切到对应位置,使得模型学习不止学习如何重建,还学习到重建的具体位置。本方法能提升性能,而且在一些low-lev原创 2020-07-24 20:09:31 · 1430 阅读 · 1 评论 -
Batch Normalization 学习笔记
原文地址:http://blog.youkuaiyun.com/hjimce/article/details/50866313作者:hjimce一、背景意义本篇博文主要讲解2015年深度学习领域,非常值得学习的一篇文献:《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate转载 2017-06-16 17:56:19 · 292 阅读 · 0 评论 -
一文读懂卷积神经网络CNN
转自:http://www.cnblogs.com/nsnow/p/4562308.html作者:张雨石自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convnet2。为了增进CNN的理解和使用,特写此博文,以其与人交流,互有增益。正文之前转载 2017-06-16 14:23:41 · 519 阅读 · 0 评论 -
如何理解卷积:信号处理、图像处理中的应用
信号与系统中的卷积解释作者:张俊博链接:https://www.zhihu.com/question/22298352/answer/34267457来源:知乎著作权归作者所有,转载请联系作者获得授权。不推荐用“反转/翻转/反褶/对称”等解释卷积。好好的信号为什么要翻转?导致学生难以理解卷积的物理意义。这个其实非常简单的概念,国内的大多数教材却没有讲透。直接转载 2016-12-08 11:08:48 · 11653 阅读 · 2 评论 -
UFLDL自编码算法详细理解与代码实现
转载自:http://www.cnblogs.com/happylion/p/4209570.html写的很详细,解释的很好,最近正在看UFLDL,在编程实现过程中有一些不明白的地方,对MATLAB用的也不是很熟练,这篇文章为我解决了很多困惑。在有监督学习中,训练样本是有类别标签的。现在假设我们只有一个没有带类别标签的训练样本集合 ,其中 。自编码神经网络是一种无监督学转载 2017-04-06 16:21:26 · 730 阅读 · 0 评论 -
CNN:通俗理解卷积神经网络
转载自:http://www.2cto.com/kf/201607/522441.html1 前言2012年我在北京组织过8期machine learning读书会,那时“机器学习”非常火,很多人都对其抱有巨大的热情。当我2013年再次来到北京时,有一个词似乎比“机器学习”更火,那就是“深度学习”。本文内写过一些机器学习相关的文章,但上一篇技术文章“LDA主转载 2017-03-22 15:25:49 · 1163 阅读 · 0 评论 -
OpenPR开源代码项目
欢迎大家访问OpenPR主页: http://www.openpr.org.cn, 并提出意见和建议!同时,OpenPR也期待您分享您的代码!OpenPR, stands for Open Pattern Recognition project and is intended to be an open source platform for sharing algorithms of转载 2016-12-27 09:34:25 · 2063 阅读 · 0 评论 -
图像处理之Zhang Suen细化算法
转载自:http://blog.youkuaiyun.com/jia20003/article/details/52142992在二值图像处理特别是OCR识别与匹配中,都要通过对字符进行细化以便获得图像的骨架,通过zhang-suen细化算法获得图像,作为图像的特征之一,常用来作为识别或者模式匹配。一:算法介绍Zhang-Suen细化算法通常是一个迭代算法,整个迭代过程分为转载 2016-11-28 12:17:01 · 17735 阅读 · 5 评论 -
Histogram of Oriented Gridients(HOG) 方向梯度直方图
最近在做Script Identification(SI),目标是中、英、维文的场景文本行分类,尝试使用HOG+SVM进行中/英分类。转载自:http://www.cnblogs.com/hrlnw/archive/2013/08/06/2826651.htmlHistogram of Oriented Gridients,缩写为HOG,是目前计算机视觉、模式识别领域很常用转载 2016-12-07 21:39:21 · 584 阅读 · 0 评论 -
浅析人脸检测之Haar分类器方法:Haar特征、积分图、 AdaBoost 、级联
转自:http://www.cnblogs.com/ello/archive/2012/04/28/2475419.html一、Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来。 目前的人脸检测转载 2016-03-21 12:10:26 · 843 阅读 · 0 评论 -
LBP描述算子简介
作者:小村长 出处:http://blog.youkuaiyun.com/lu597203933 。 (新浪微博:小村长zack, 欢迎交流!)参考文献:文章:Multiresolution Gray-Scale and Rotation Invariant Texture Classificationwith Local Binary Patterns LBP(local bina转载 2016-03-17 17:24:16 · 2505 阅读 · 0 评论 -
ccv:一个现代的开源计算机视觉函数库
http://libccv.org/post/with-a-sub-10-image-classifier-a-decent-face-detector-here-comes-ccv-0.7/是一个利用此函数库进行人脸识别的应用实例。ccv的开发以应用为驱动,集成了视觉处理最现代的算法。GitHub托管地址:https://github.com/liuliu/ccv抽空好好研究翻译 2015-02-11 10:11:31 · 1858 阅读 · 0 评论