- 博客(19)
- 收藏
- 关注
原创 聚类算法整理
文章目录有效性指标原型聚类k-means 算法k值的选择k-means的变种学习向量量化高斯混合聚类密度聚类DBSCAN算法Mean-Shift 算法层次聚类AGNES 算法DIANA 算法BIRCH 算法谱聚类无监督学习希望通过对无标记训练样本的学习来揭露数据的内在性质以及规律,而其中应用最广泛的就是聚类算法(clustering):给定数据集,聚类试图将数据集中的样本划分为 K 个不相交的子...
2019-10-23 16:40:18
1973
1
原创 base64 编码原理实例分析
介绍图片预处理时经常会用到base64的编码方式,但其实base64能基于64个可打印字符来表示任意二进制数据,其过程是可逆的。原理根据一个实例来表示编码过程,比如单词:image1、首先,我们根据ASCII码对应表格找到每个字母对应的值:i : 01101001m : 01101101a : 01100001g : 01100111e : 011001012、因为base6...
2019-08-26 18:10:58
892
原创 Self-Attention Generative Adversarial Networks(SAGAN)理解
介绍Self-Attention Generative Adversarial Networks(SAGAN)是Han Zhang, Ian Goodfellow等人在去年提出的一种新的GAN结构,网络主要引入了注意力机制,不仅解决了卷积结构带来的感受野大小的限制,也使得网络在生成图片的过程中能够自己学习应该关注的不同区域。从结果上来看,SAGAN相比于之前最好的结构,在 Inception s...
2019-08-15 16:39:14
7996
2
原创 BigGAN、BiGAN、BigBiGAN简单介绍
介绍上一篇文章在介绍GAN的评价标准的时候提到了 BigGAN 在Inception Score上取得了巨大的进步,而最近 DeepMind 又基于 BiGAN 提出了 BigBiGAN,它在 ImageNet 上的无监督表示学习和无条件图像生成方面都取得了极为优秀的成绩。本文主要对BigGAN和BiGAN的思想进行简单介绍,BigBiGAN 在结构上并没有对 BiGAN 做什么改变,原理也基...
2019-08-06 14:00:13
22136
1
原创 GAN的几种评价指标
文章目录介绍考虑因素Inception Score (IS)基本原理局限性总结Fréchet Inception Distance(FID)基本原理局限性总结其它评价标准Mode ScoreKernel MMD (Maximum Mean Discrepancy)Wasserstein distance1-Nearest Neighbor classifier分析总结介绍前段时间 DeepMi...
2019-08-05 14:46:33
21123
4
原创 RPN(Region Proposal Network)和 Anchor 理解
介绍上一篇博客介绍了Fast RCNN中的ROI Pooling原理,网络只需一次特征提取过程,不同尺寸的候选框映射到feature map对应位置上,经过该结构后可变成相同大小的特征向量作为全连接层的输入。但是对于候选框的选取仍然保留了RCNN中的Selective Search策略,这显然限制了网络的速度,因此RPN(Region Proposal Network)被提出作为候选框的提取网络...
2019-08-01 15:11:00
14727
1
原创 ROI Pooling 与 SPP 理解
介绍ROI(Region of Interest) Pooling是Pooling的一种。在传统CNN中,Pooling层的作用主要有三个:1、特征不变性,使模型更加关注是否存在某些特征而不是特征具体的位置,对于一些旋转和平移具有不变性2、特征降维,使模型可以抽取更广泛围的特征,减小了下一层输入大小,进而减小计算量和参数个数3、在一定程度防止过拟合,更方便优化ROI Pooling是针对...
2019-07-31 17:41:06
11469
2
原创 Neural Style 中 Spatial Control 的代码实现
在之前的博客Controlling Perceptual Factors in Neural Style Transfer阅读笔记中介绍了风格迁移中对spatial location、 colour information and spatial scale的控制原理,本文主要是对TensorFlow (Python API) implementation of Neural Style中实现Sp...
2019-07-24 15:08:37
642
4
转载 多种生成式模型间的对比
主要是对Pawel.io在GitHub上的tensorflow-generative-model-collections进行的整理,分别介绍了两种生成式模型GAN与VAE各自多种的不同实现方法。文章目录Generative Adversarial Networks (GANs)GANLSGANWGANWGAN-GPDRAGANCGANinfoGANACGANEBGANBEGANResults f...
2019-07-23 11:13:47
1730
原创 Stacked Hourglass Networks 理解
文章目录介绍原理结构残差模块单沙漏模块一阶Hourglass二阶HourglassN阶Hourglass堆叠沙漏模块中间监督Volumetric Regression Network(VRN)介绍Stacked Hourglass(Stacked HG, 堆叠沙漏)网络最早出现在2016年的Stacked Hourglass Networks forHuman Pose Estimation...
2019-07-22 16:59:10
5571
原创 Spatial Transformer Networks(STN)理解
文章目录STN的作用STN的基本结构前向过程Tensorflow部分实现代码实验结果Distorted MNISTGerman Traffic Sign Recognition Benchmark (GTSRB) datasetSTN的作用之前参加过一个点云数据分类的比赛,主要借鉴了PointNet的网络结构,在PointNet中使用到了两次STN。点云数据存在两个主要问题:1、无序性:点云本...
2019-07-22 12:00:39
3405
4
转载 风格迁移综述Neural Style Transfer: A Review
浙江大学和亚利桑那州立大学的几位研究者在 arXiv 上发布了一篇「神经风格迁移(Neural Style Transfer)」的概述论文,对当前神经网络风格迁移技术的研究、应用和难题进行了全面的总结:Neural Style Transfer: A Review v7版作者自己写了中文的精简版本,对整个技术的发展和难点都总结的很好。最早了解风格迁移的时候看过转载的中文版本,很多地方不是很明白,...
2019-07-09 11:07:22
4690
原创 Universal Style Transfer via Feature Transforms 论文理解
文章目录摘要介绍和相关工作主要内容Reconstruction decoderWhitening and coloring transformsWhitening transformColoring transformMulti-level coarse-to-fine stylization实验结果补充尺度、权重以及空间的控制纹理生成摘要提出了一种基于特征变化的通用的风格迁移模型。方法的关键...
2019-07-08 18:15:54
1856
1
原创 Controlling Perceptual Factors in Neural Style Transfer阅读笔记
文章目录摘要介绍相关工作Spatial ControlGuided Gram MatricesGuided SumsColour ControlLuminance-only transferColour histogram matchingComparisonScale ControlScale control for style mixingScale control for efficient ...
2019-07-05 18:03:11
1517
1
原创 Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization论文理解
文章目录摘要介绍和相关工作背景Batch NormalizationLayer NormalizationInstance NormalizationGroup NormalizationConditional Instance Normalization解释INAdaptive Instance Normalization实验网络结构训练过程结果QuantitativeSpeedAddition...
2019-07-04 17:55:14
1748
原创 fast neural style与style swap
文章目录介绍fast neural style介绍neural style不需要额外的网络结构,针对每一次迁移过程只在两张图片上进行训练;而fast neural style是在VGG19前增加了一个较复杂的生成网络,训练时VGG的参数也不会改变,可以看作是生成器和判别器的结构。通过大量数据集的训练,一个模型可以学习到任意图片向一种风格的转换;style swap则是使用了叫做inverse ...
2019-07-04 17:55:01
1681
原创 Neural-style-tf
Pretrained VGG-19 ModelVGG在2014年的 ILSVRC localization and classification 两个问题上分别取得了第一名和第二名。VGG-19是其中的一个模型,官网上提供了预先训练好的系数,经常被业界用来做原始图片的特征变换。VGG-19共有19层,基本结构如下:前几层为卷积和maxpool的交替,每个卷积包含多个卷积层,最后面再紧跟三个...
2019-07-04 17:54:46
655
原创 GAIL生成对抗模仿学习的简单理解
文章目录强化学习模仿学习模仿学习的三种方法行为克隆逆向强化学习GAIL生成对抗模仿学习强化学习强化学习需要一个合适的reward函数去求解最优行动策略,但很多情况下不容易设以一个足够全面和优秀的reward函数,特别是在一些复杂的应用场景中,例如自动驾驶中撞人、撞车和闯红绿灯三者的reward值很难有一个合理的比例和设定,当面对的周围环境更加复杂就更难去定量。模仿学习模仿学习希望机器能够通...
2019-07-04 17:54:16
6037
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人