
深度学习
文章平均质量分 95
MoussaTintin
@美团语音AI
展开
-
【Learning Notes】变分自编码器(Variational Auto-Encoder,VAE)
简单介绍变分自编码器(Variational Auto-Encoder,VAE)实现和原理。原创 2016-12-14 17:48:49 · 70290 阅读 · 20 评论 -
神经网络端到端序列学习(一)
许多重要问题都可以抽象为变长序列学习问题(sequence to sequence learning),如语音识别、机器翻译、字符识别。这类问题的特点是,1) 输入和输入都是序列(如连续值语音信号/特征、离散值的字符),2) 序列长度都不固定,3)并且输入输出序列长度没有对应关系。因此,传统的神经网络模型(DNN, CNN, RNN)不能直接以端到端的方式解决这类问题的建模和学习问题。解决变长序列的原创 2016-11-26 15:33:49 · 17679 阅读 · 1 评论 -
【Learning Notes】基于 boosting 原理训练深层残差神经网络
Huang et al. Learning Deep ResNet Blocks Sequetially using Boosting Theory.文章指出一种基于 boosting(提升)原理,逐层训练深度残差神经网络的方法,并对性能及泛化能力给出了理论上的证明。1. 背景1.1 BoostingBoosting[1] 是一种训练 Ensemble 模型的经典方法,其中一种具体实现 GBDT原创 2017-06-17 00:28:00 · 3676 阅读 · 0 评论 -
pytorch 学习笔记之自定义 Module
pytorch 是一个基于 python 的深度学习库。pytorch 源码库的抽象层次少,结构清晰,代码量适中。相比于非常工程化的 tensorflow,pytorch 是一个更易入手的,非常棒的深度学习框架。对于系统学习 pytorch,官方提供了非常好的入门教程 ,同时还提供了面向深度学习的示例,同时热心网友分享了更简洁的示例。1. overview不同于 theano,te...原创 2017-04-22 14:42:39 · 10380 阅读 · 2 评论 -
模型压缩之 BinaryNet
1. 动机深度学习在图像、语音、文本等领域都取得了巨大的成功,推动了一系列智能产品的落地。但深度模型存在着参数众多,训练和 inference 计算量大的不足。目前,基于深度学习的产品大多依靠服务器端运算能力的驱动,非常依赖良好的网络环境。很多时候,出于响应时间、服务稳定性和隐私方面的考虑,我们更希望将模型部署在本地(如智能手机上)。为此,我们需要解决模型压缩的问题——将模型大小、内存占用...原创 2016-12-03 16:13:02 · 14786 阅读 · 3 评论 -
【Learning Notes】Quasi-recurrent Neural Networks
Quasi-recurrent Neural Networks (QRNN)原创 2017-09-12 20:02:14 · 5406 阅读 · 0 评论 -
AMD ROCm 平台简介
介绍 AMD 的 ROCm GPU 计算平台。原创 2017-07-08 14:26:36 · 40193 阅读 · 3 评论 -
【Learning Notes】CTC 原理及实现
CTC( Connectionist Temporal Classification,连接时序分类)是一种用于序列建模的工具,其核心是定义了特殊的目标函数/优化准则[1]。 jupyter notebook 版见 repo.1. 算法这里大体根据 Alex Graves 的开山之作[1],讨论 CTC 的算法原理,并基于 numpy 从零实现 CTC 的推理及训练算法。...原创 2018-03-05 09:47:32 · 25229 阅读 · 21 评论