
AI
文章平均质量分 55
DreaMaker丶
这个作者很懒,什么都没留下…
展开
-
CASIA Gait Database
点击打开链接原创 2018-03-23 20:59:48 · 1167 阅读 · 0 评论 -
NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS
摘要:循环的seq2seq特征预测网络将嵌入式字符向量映射到梅尔刻度声谱图声码器:改良版WaveNet负责合成时域波形使用这个紧凑的声学中间特征可以显著简化WaveNet的结构介绍:Concatenative synthesis with unit selection(单元挑选和拼接式合成技术)把预先录制的语音波形的小片段缝合在一起Statistical para...原创 2019-04-16 11:50:39 · 1127 阅读 · 0 评论 -
Jensen–Shannon divergence
Jensen–Shannon divergence(J-S散度) is a method of measuring the similarity between two probability distributions.It is based on the Kullback–Leibler divergence(K-L散度), with some notable(and useful)...原创 2018-07-19 17:17:43 · 7117 阅读 · 0 评论 -
epoch, iteration, batchsize相关说明
batchsize:中文翻译为批大小(批尺寸)。简单点说,批量大小将决定我们一次训练的样本数目。batch_size将影响到模型的优化程度和速度。为什么需要有 Batch_Size :batchsize 的正确选择是为了在内存效率和内存容量之间寻找最佳平衡。 Batch_Size的取值:全批次(蓝色)如果数据集比较小我们就采用全数据集。全数据集确定的方向能够更好地代表样本总体,从而更准确地朝向极值...原创 2018-04-04 20:42:32 · 248 阅读 · 0 评论 -
Rectified Linear Unit (ReLU)
在神经网络中,常用到的激活函数有sigmoid函数,双曲正切(hyperbolic tangent)函数f(x) = tanh(x)。今天要说的是另外一种activation function,rectified linear function线性整流函数(Rectified Linear Unit, ReLU),又称修正线性单元, 是一种人工神经网络中常用的激活函数(activation fun...转载 2018-04-04 14:55:38 · 10228 阅读 · 1 评论 -
Pixel Level Domain Transfer GAN
https://github.com/fxia22/PixelDTGAN原创 2018-04-03 19:43:27 · 581 阅读 · 0 评论 -
神经网络与深度学习( Neural Networks and Deep Learning)
http://neuralnetworksanddeeplearning.com/原创 2018-03-26 17:53:25 · 269 阅读 · 0 评论 -
监督学习方法
监督学习方法分类:生成方法与判别方法的区别:假如你的任务是识别一个语音属于哪种语言。对面一个人走过来,和你说了一句话,你需要识别出她说的到底是汉语、英语还是法语等。那么你可以有两种方法达到这个目的:1、学习每一种语言,你花了大量精力把汉语、英语和法语等都学会了,我指的学会是你知道什么样的语音对应什么样的语言。然后再有人过来对你哄,你就可以知道他说的是什么语音。2、不去学习每一种语言,你只学习这些语...原创 2018-03-21 16:05:22 · 2079 阅读 · 0 评论 -
dcgan.torch/main.lua
require 'torch' require 'nn' require 'optim' opt = { dataset = 'lsun', -- imagenet / lsun / folder batchSize = 64, loadSize = 96, fineSize = 64, nz = 100, -- # of dim for Z ngf ...原创 2018-04-07 22:34:57 · 641 阅读 · 1 评论 -
分类器的两类形式
在对GAN进行学习的过程中参考了一些好的文章,在此总结出来自己认为有意义的学习笔记。参考原文:http://blog.youkuaiyun.com/zouxy09/article/details/8195017一 决策函数Y=f(X)输入一个X,它就输出一个Y,Y与一个阈值比较,根据比较结果判定X属于哪个类别。例如两类(w1和w2)分类问题,如果Y大于阈值,X就属于类w1,如果小于阈值就属于类w2。二 条...转载 2018-03-21 15:12:30 · 1038 阅读 · 0 评论 -
GANs简介
在对GAN进行学习的过程中参考了一些好的文章,在此总结出来自己认为有意义的学习笔记。参考原文:http://blog.youkuaiyun.com/zouxy09/article/details/8195017http://blog.youkuaiyun.com/on2way/article/details/72773771Generative Adversarial NetsGAN的鼻祖之作是2014年NIPS一篇文章...转载 2018-03-21 15:01:29 · 536 阅读 · 0 评论 -
神经网络中,加上bias是如何让网络变得更灵活
reference:https://www.zhihu.com/question/68247574实际上,bias相当于多了一个参数。在增加网络少量拟合能力的情况下,bias和其它普通权值相比无论前向还是后向,计算上都要简单,因为只需要一次加法。同时,bias与其它权值的区别在于,其对于输出的影响与输入无关,能够使网络的输出进行整体地调整,算是另一维自由度吧。放在二维上,权值相当于直线的斜率,而b...转载 2018-04-07 22:11:11 · 8283 阅读 · 0 评论 -
Deep Learning with Torch
Reference:https://github.com/soumith/cvpr2015/blob/master/Deep%20Learning%20with%20Torch.ipynbDeep Learning with Torch: the 60-minute blitzGoal of this talkUnderstand torch and the neural networks pac...转载 2018-04-03 20:51:35 · 359 阅读 · 0 评论 -
TACONTRON: A Fully End-to-End Text-To-Speech Synthesis Model
Generate speech at the frame level统计参数TTS: 文本前端:提取语言特征 声学特征预测模型 基于信号处理的声音合成器优点: 减轻了复杂的工作 可以应对复杂的条件和多种情况(语者,语种,情感) 相较多阶段模型,鲁棒性更高TTS:解压(文字->声音),输出是连续的,输出序列会比输入序列要长的多Ta...原创 2019-04-15 13:08:54 · 1009 阅读 · 0 评论