
每周计划
文章平均质量分 56
CHNguoshiwushuang
这个作者很懒,什么都没留下…
展开
-
BN层学习
BN层,顾名思义嘛,就是归一化的作用,在深度学习里很常用,这里来简要梳理一下BN层的相关知识.1 BN层引出的目的 神经网络在进行训练时,主要是用来学习数据的分布规律,如果数据的训练部分和测试部分分布不一样,那么网络的泛化能力会变得非常差.而且对于训练的数据,每批分布也是不一样的,那么网络在迭代的过程中也要学习和适应不同的分布.这会大大降低网络的训练速度.此外,数据的分布对于...原创 2018-05-22 20:32:56 · 1921 阅读 · 0 评论 -
tensorflow的mnist改写成pytorch
最近公司使用算法要用pytorch,所以本人暂时放弃使用tensorflow,为了练手pytorch,本人首先使用pytorch将tensorflow版本的mnist转换成pytorch版本,tensorflow原版本如下所示:from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.r...原创 2018-06-17 23:01:44 · 2091 阅读 · 0 评论 -
几种GAN
最近听几场讲座都听到了一些有关GAN的应用,今年GAN更是刷了很多会议论文,了解一些常用的GAN网络,对于后面做科研还是做工程项目都很有帮助。一般的GAN网络存在着以下一些问题:训练不稳定,需要平衡生成器和判别器之间的训练;缺乏相应指示GAN训练好坏的指标等。下面依次简要介绍目前常用的几种GAN:WGAN,LSGAN,DCGAN。WGAN WGAN是Wasserstein G...原创 2018-06-30 19:41:38 · 2363 阅读 · 0 评论 -
常见图像格式了解
通常相机获取的raw图像就是原始的图像,对raw图像进行处理后可以得到很多种类型的图像,如png,jpg等等,因为做Low-level问题的图像处理经常接触这些格式,感觉有必要了解一下。jpg格式 jpg格式是一种有损压缩的图像,且压缩后恶化的图像无法还原,一般来说占用内存小,且对色彩信息保留较好。jpeg格式 与jpg比较类似,文件相对jpg格式大一些,主要...原创 2018-06-30 22:42:31 · 800 阅读 · 0 评论 -
tf.depth_to_space和torch.nn.pixel_shuffle
最近做项目用到了这两个函数,本人经过仔细对比,认为它们的功能应该是完全一样的,都是将一个较多通道的特征变成较少通道的特征,具体定义如下:def depth_to_space(input, block_size, name=None): block_size用来说明数据移动的方式。该函数的操作是将block_size x block_size数目的特征图转换成一个不重叠的特征,...原创 2018-07-01 22:49:51 · 12059 阅读 · 3 评论 -
阅读论文《LOW-LIGHT IMAGE ENHANCEMENT USING CNN AND BRIGHT CHANNEL PRIOR》
这是2017年ICIP的一篇论文,使用一个联合架构对图像进行增强。首先,是一个去噪网络;然后使用可以自动根据通道亮度优先设置转换函数的增强网络;此外,还设定了一个额外的估测周围环境亮度的过滤器。 过去的方法包括基于retinex理论的方法,这个方法假定去除光照影响可以增强低照图像,但是这种方法是对RGB图像进行处理的,容易造成颜色失真;基于直方图均衡化的处理,主要用来增加图像的对比度,但...原创 2018-07-01 23:02:23 · 3940 阅读 · 3 评论 -
WGAN-GP
最近做项目用到了GP-WGAN,所以感觉有必要了解一下,这里简要参考别人的博客自己做一个总结吧。 GAN通过训练判别器和生成器来使得生成器生成的数据分布上尽可能和真实样本的分布完全一致。但是在GAN训练的过程中常常会存在训练不稳定的现象。因此蒙特利尔大学的研究者对WGAN进行改进,提出了一种替代WGAN判别器中权重剪枝的方法,即具有梯度惩罚的WGAN,从而避免训练不稳定的情况。 ...原创 2018-07-08 23:16:03 · 3569 阅读 · 2 评论 -
图像采样方法
最邻近插值(Nearest Neighbour Resampling) 这种插值方法根据源图像和目标图像之间的相对位置来将目标图像上像素确定为相对源图像上相对位置的像素值,对于任意一幅源图像来说,假设放大后目标图像的宽为Dw高为Dh,任意目标像素点(Dx, Dy)在源图像上的位置为: Sx=Dx∗(Sh/Dh)//rowSx=Dx∗(Sh/Dh)//rowSx= Dx * (Sh/Dh...原创 2018-06-27 21:39:56 · 9305 阅读 · 0 评论 -
阅读论文《LLCNN: A convolutional neural network for low-light image enhancement》
这是2017年VCIP的一篇论文,使用神经网络对暗光下的图像作增强。使用的网络基本结构如下图所示: 网络由一个卷积层输入,一个卷积层输出,中间由若干卷积模块组成,特征数均为64。卷积模块参考残差网络和inception的结构,先分成两路送入,然后将两路输出直接相加,相加后结果再通过一个残差相加。如下所示: 网络使用SSIM-Loss,正常的MSE...原创 2018-06-27 23:04:30 · 3478 阅读 · 4 评论 -
Instance norm
本来这周已经写好了轻量级网络的总结(mobilenet和shufflenet),可是没有来得及保存然后电脑就关机了,写博客也是为了学习东西,所以也不打算重新再写了。还是简要写一下最近用到的instance norm。 在目前的GAN和style transfer的任务中,目前的IN norm要好于BN,IN主要用于对单张图像的数据做处理,而BN主要是对Bacth的数据做处理。由于BN...原创 2018-07-20 21:18:37 · 6426 阅读 · 1 评论 -
从图像转换到txt和从txt读取图片,并使用tensorflow实现epoch无重复迭代
闲话少说,从图像转换成txt非常简单,直接附代码,如下所示:import osimport randomdef generate(dir): files = os.listdir(dir) print('****************') print('input :',dir) print('start...') listText =...原创 2018-07-21 23:22:59 · 1178 阅读 · 0 评论 -
Dncnn,U-net了解
最近做公司的项目接触到了这些,因此了解一下U_net U-net,顾名思义,是一个U型的网络,最初用来做图像分割。是一种编码器-解码器结构。编码器逐渐减少池化层的空间维度,解码器逐步修复物体的细节和空间维度。编码器和解码器之间通常存在快捷连接,因此能帮助解码器更好地修复目标的细节。U-Net 是这种方法中最常用的结构,结构如下图所示: 左侧为一个下采样过程...原创 2018-06-17 22:35:48 · 4064 阅读 · 0 评论 -
图像raw数据
bayer格式数据 bayer格式数据,其一般格式是,奇数行为RGRG,偶数行一般为GBGB。在获取图像时,如果采集rgb数据,需要三块滤镜且完全对齐,这无疑是非常麻烦的一件事。在实际中发现人眼对绿色更敏感,bayer格式图片在一个滤镜上设置不同颜色,绿色格式数目是r和g像素之和。如下图所示: 每一个像素仅仅包括光谱的一部分,所以可以通过插值的方法去恢复像素的RGB...原创 2018-06-17 22:33:19 · 7178 阅读 · 0 评论 -
阅读论文《Learning to See in the Dark》
这是2018CVPR的一篇论文,旨在说明使用深度学习的方法使得暗光条件下的图像更明显。一般来说低光照条件下的图像噪点更多,使用一些方法增强图像或是引入更多的噪点,或是由于曝光时间过长导致抖动产生图像上的模糊。而目前增强暗光图像的方法还不试用于非常暗光和非常短曝光时间的图像,所以文章认为可以充分利用raw类型的数据进行图像增强。如下图所示,一般增强后的图像中噪点非常多: ...原创 2018-06-17 22:32:25 · 2410 阅读 · 2 评论 -
阅读论文《The Perception-Distortion Tradeoff》
这是2018CVPR的一篇论文(原论文地址:https://arxiv.org/abs/1711.06077),论文主要说明感知质量和图像失真程度并不是完全对应的。基于深度网络的特征失真可能更好的表示图像感知质量的好坏,而使用GAN网络可以获得具有较好感知质量效果的图像。失真-感知之间存在一个可以实现的区域,在这个可以实现的区域里失真程度和感知质量并不是完全的相关,也就是失真较大时感知质量也...原创 2018-06-03 14:26:29 · 2958 阅读 · 0 评论 -
双边滤波
最近学习的过程中接触到了双边滤波这个操作,之前在看hdrnet的时候就已经看到过这样的概念,一直没有认真领会双边滤波这个操作,现在好好看一看。 双边滤波中的双边是指同时考虑两条边,即空间域和值域。对空间域的处理和高斯滤波一样,根据距离远近的不同给予不同的权值。值域则是考虑邻域范围内像素的差值计算出滤波系数,类似于αα\alpha截尾均值滤波器。其公式如下: g(i,j)=Σk,lw...原创 2018-05-27 16:37:58 · 791 阅读 · 0 评论 -
使用tensorflow实现logistic回归
逻辑回归原理很简单,这里不再赘述,我使用tensorflow的思路和前面一样,还是利用Supervisor模块(这个确实好用啊),argparser和logging日志模块。实现代码如下:import sysreload(sys)sys.setdefaultencoding('utf-8')import tensorflow as tfimport loggingimport...原创 2018-06-05 17:24:24 · 776 阅读 · 0 评论 -
opencv操作(2):一些杂知识
本周事情较多,所以在这个上面画的时间少了一点,主要是更改了一个C++源码,链接:https://blog.youkuaiyun.com/qq_35724402/article/details/60466536。更改后如下所示:import cv2import argparseimport numpy as npdef main(args): img = cv2.imread(a...原创 2018-06-05 22:29:09 · 236 阅读 · 0 评论 -
softmax和logistic回归的区别和联系
首先先说结论,两者的主要不同体现在(1)softmax用来解决多分类问题,lr解决二分类问题(2)softmax输出每一类的概率值,并确定概率最大的类是正确的,lr只区别是还是不是。事实上softmax是lr的一般情况。下面具体来看。1.Logistic回归 一般线性分类器的是通过输入一系列的样本数据,学习一组权重系数w0w0w_0,w1w1w_1…wnwnw_n来进行分类,...原创 2018-05-30 19:17:47 · 5132 阅读 · 0 评论 -
准确率,精确度,召回率的概念
时间较紧,所以本周复习以下前两周面试问过的这些概念,简要说一说: 下面的符号含义:TP-将正预测为真,FN-将正预测为假,FP-将反预测为真,TN-将反预测为假。准确率 准确率是对给定数据集,分类正确样本个数和总样本数的比值。即: Precision=TP+TNTP+FN+FP+TNPrecision=TP+TNTP+FN+FP+TNPrecision=\frac{T...原创 2018-06-07 23:43:15 · 15365 阅读 · 3 评论 -
opencv操作(1):一些杂知识
代码转换 原文地址为https://blog.youkuaiyun.com/dcrmg/article/details/53677739 。本人使用opencv的python版本这里面的操作进行了一下转换。代码如下所示:import cv2import numpy as npimport math# Histogram Equalizationimg1 = cv2.imread('i...原创 2018-05-31 21:07:11 · 321 阅读 · 0 评论 -
使用tensorflow实现线性回归
线性回归的原理很简单,这里不赘述。使用tensorflow实现线性回归这个功能,麻雀虽小,五脏俱全。主要包括以下几个部分: 1、产生数据。 2、声明输入变量和待学习的变量。 3、定义运算节点,也就是如何得到预测值。 4、定义损失函数loss。 5、对损失函数进行优化。 和网上一般的教程不一样,这一次我使用tensorflow的supervisor功能进行迭代训练,在迭代过程...原创 2018-06-01 20:36:16 · 451 阅读 · 0 评论 -
阅读论文《Loss Functions for Image Restoration With Neural Networks》
这是去年计算成像学领域的一篇论文(链接:https://ieeexplore.ieee.org/document/7797130/ ),重在讨论如何损失函数对图像恢复的影响。在目前的图像恢复任务中主要使用的还是L2损失函数,L2损失的好处有很多,例如可以直接提高PSNR等指标。但是L2指标与人类感知的图像质量相关性较差,例如其假设噪声与图像的局部区域无关。在有些情况下,L1损失函数获得的图像...原创 2018-06-08 20:42:59 · 6644 阅读 · 0 评论 -
反卷积
反卷积又被称为转置卷积(transpose convolution),一般被认为是卷积的逆过程,这样我们首先来看一下卷积的过程: 令:input-size:i,kener-size:k,stride:s,padding-size:p,那么output-size为: o=[i+2p−ks]+1o=[i+2p−ks]+1o=[\frac{i+2p-k}{s}]+1 same padding...转载 2018-06-24 22:20:04 · 975 阅读 · 0 评论 -
亚像素
最近接触到一些和subpixel相关的操作,对亚像素相关基本概念还不是很了解,所以这里想了解一下。 在相机成像的过程中,获得的图像数据是将图像进行了离散化的处理,由于感光元件本身的能力限制,到成像面上每个像素只代表附近的颜色。例如两个感官原件上的像素之间有4.5um的间距,宏观上它们是连在一起的,微观上它们之间还有无数微小的东西存在,这些存在于两个实际物理像素之间的像素,就被称为“亚...原创 2018-07-22 15:52:06 · 14001 阅读 · 3 评论