
deep learning
文章平均质量分 87
xiewenbo
互联网广告行业呆过几年,旅游公司呆过几年,对机器学习,自然语言处理,图像识别,个性化推荐 有兴趣
展开
-
Deep Learning Papers Reading Roadmap
The roadmap is constructed in accordance with the following four guidelines:From outline to detailFrom old to state-of-the-artfrom generic to specific areasfocus on state-of-the-artYou will fi转载 2016-10-20 20:24:34 · 1786 阅读 · 0 评论 -
一文看懂 Attention 机制,你想知道的都在这里了。Enjoy
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林 要是关注深度学习在自然语言处理方面的研究进展,我相信你一定听说过Attention Model(后文有时会简称AM模型)这个词。AM模型应该说是过去一年来NLP领域中的重要进展之一,在很...转载 2018-02-26 22:59:14 · 14847 阅读 · 7 评论 -
简单理解LSTM神经网络
Recurrent networks (Elman, 1990) are designed to model sequences, while recursive networks (Goller & Küchler, 1996) are generalizations of recurrent networks that can handle trees. ---Yoav Goldber...转载 2018-02-13 11:47:11 · 1438 阅读 · 0 评论 -
循环神经网络(一般RNN)推导
本文章的例子来自于WILDMLvanillaRNN是相比于LSTMs和GRUs简单的循环神经网络,可以说是最简单的RNN。RNN结构RNN的一个特点是所有的隐层共享参数(U,V,W),整个网络只用这一套参数。RNN前向传导st=tanh(Uxt+Wst−1) ot=softmax(Vst)st为t时刻隐层的状态值,为向量。 ot为t时刻输出的值(这里是输入一个xt就有一个输出ot,这个是不必要的,...转载 2018-02-13 14:40:07 · 1137 阅读 · 0 评论 -
一些讲RNN-lstm比较好的博客
Understanding LSTM Networkshttp://colah.github.io/posts/2015-08-Understanding-LSTMs/ An overview of gradient descent optimization algorithmshttp://sebastianruder.com/optimizing-gradient-descent/The Un...原创 2017-07-05 20:18:44 · 1557 阅读 · 0 评论 -
利用GAN生成MNIST-demo
转自:https://github.com/NELSONZHAO/zhihu/blob/master/mnist_gan/gan_mnist.ipynb本篇代码将使用GAN来学习MNIST数据集的生成,仅仅作为一个demo演示,后面会更新更加复杂的GAN模型In [2]:import tensorflow as tfimport numpy as npimport pickleimport ...转载 2018-02-23 16:46:05 · 4797 阅读 · 0 评论 -
十分钟教程:用Keras实现seq2seq学习
原文:A ten-minute introduction to sequence-to-sequence learning in Keras 作者:Francois Chollet 译者:雁惊寒摘要:序列到序列学习(seq2seq)是一种把序列从一个域(例如英语中的句子)转换为另一个域中的序列(例如把相同的句子翻译成法语)的模型训练方法。目前有多种方法可以用来处理这个任务,可以使用RNN,也可以使...转载 2018-03-03 00:39:59 · 1718 阅读 · 0 评论 -
keras 对于大数据的训练,无法一次性载入内存,使用迭代器
转处:http://blog.youkuaiyun.com/lujiandong1/article/details/54869170说明:我是在keras的官方demo上进行修改https://github.com/fchollet/keras/blob/master/examples/imdb_cnn.py1、几点说明,从文件中读入数据,会降低GPU的使用率,如果能够直接将数据载入内存,GPU的使用率会比较...转载 2018-03-04 00:08:59 · 6291 阅读 · 1 评论 -
keras 指定GPU
计数下标从1开始例:CUDA_VISIBLE_DEVICES=2 python3 predict_3.pyHow can I run a Keras model on multiple GPUs?We recommend doing so using the TensorFlow backend. There are two ways to run a single model on multip...原创 2018-03-04 23:08:43 · 1574 阅读 · 0 评论 -
TensorFlow入门(五)多层 LSTM 通俗易懂版
https://blog.youkuaiyun.com/Jerr__y/article/details/61195257https://blog.youkuaiyun.com/u014595019/article/details/52759104@author: huangyongye @creat_date: 2017-03-09 前言: 根据我本人学习 TensorFlow 实现 LSTM 的经历,发现网上虽然也有不...转载 2018-05-03 19:44:16 · 355 阅读 · 0 评论 -
论文笔记:Deep Residual Learning
转处:https://www.cnblogs.com/jermmyhsu/p/8228007.html之前提到,深度神经网络在训练中容易遇到梯度消失/爆炸的问题,这个问题产生的根源详见之前的读书笔记。在 Batch Normalization 中,我们将输入数据由激活函数的收敛区调整到梯度较大的区域,在一定程度上缓解了这种问题。不过,当网络的层数急剧增加时,BP 算法中导数的累乘效应还是很容易让梯...转载 2018-05-25 16:25:18 · 310 阅读 · 0 评论 -
seq2seq里在chatbot的一些用法
转处:https://blog.youkuaiyun.com/liuchonge/article/details/79021938上篇文章我们使用tf.contrib.legacy_seq2seq下的API构建了一个简单的chatbot对话系统,但是我们已经说过,这部分代码是1.0版本之前所提供的API,将来会被弃用,而且API接口并不灵活,在实际使用过程中还会存在版本不同导致的各种个样的错误。所以我们有必要...转载 2018-05-16 13:27:06 · 1391 阅读 · 0 评论 -
clip gradient
作者:Gein Chen链接:https://www.zhihu.com/question/29873016/answer/77647103来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。clip_gradient 的引入是为了处理gradient explosion的问题。当在一次迭代中权重的更新过于迅猛的话,很容易导致loss divergence。clip_gr...转载 2018-05-16 14:37:52 · 2045 阅读 · 0 评论 -
tensorflow nmt 源码结构梳理
nmt.py main()->run_main(train_fn, inference_fn) 其中,train_fn指train.py中的train() run_main中,根据参数:flags.inference_input_file决定是走train逻辑还是走infer逻辑 如果是infer,则取最新的checkpoint,执行inference_fn 如果是train,则走train...原创 2018-06-05 20:22:01 · 1476 阅读 · 0 评论 -
反卷积 Transposed Convolution, Fractionally Strided Convolution or Deconvolution
https://buptldy.github.io/2016/10/29/2016-10-29-deconv/反卷积(Deconvolution)的概念第一次出现是Zeiler在2010年发表的论文Deconvolutional networks中,但是并没有指定反卷积这个名字,反卷积这个术语正式的使用是在其之后的工作中(Adaptive deconvolutional networks for ...转载 2018-06-20 20:47:16 · 456 阅读 · 0 评论 -
特征哈希(Feature Hashing)
转处:http://breezedeus.github.io/2014/11/20/breezedeus-feature-hashing.html#fn:fhash在特征处理(Feature Processing)中我介绍了利用笛卡尔乘积的方法来构造组合特征。这种方法虽然简单,但麻烦的是会使得特征数量爆炸式增长。比如一个可以取N个不同值的类别特征,与一个可以去M个不同值的类别特征做笛卡尔乘转载 2018-02-01 15:33:07 · 1258 阅读 · 0 评论 -
理解长短期记忆网络(LSTM NetWorks)
colah 写了一篇介绍LSTM的博客,写的非常的好。为了能够是自己更加深入的了解。特此,将它翻译了过来。原文地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/转自:http://blog.youkuaiyun.com/shinanhualiu/article/details/49864219递归神经网络(Recurrent Neural ...转载 2016-12-22 17:30:42 · 5599 阅读 · 0 评论 -
闲聊DNN CTR预估模型
转处:http://www.52cs.org/?p=1046作者:Kintocai, 北京大学硕士, 现就职于腾讯。伦敦大学张伟楠博士在携程深度学习Meetup[1]上分享了Talk《Deep Learning over Multi-field Categorical Data – A Case Study on User Response Prediction in转载 2017-03-23 17:41:53 · 2039 阅读 · 0 评论 -
深度学习:keras 学习笔记
转自:http://blog.youkuaiyun.com/philosophyatmath/article/details/52774666python向量:import numpy as npa = np.array([[1,2],[3,4],[5,6]])sum0 = np.sum(a, axis=0)sum1 = np.sum(a, axis=1)print sum0print...转载 2017-04-20 14:22:26 · 1389 阅读 · 0 评论 -
基于keras的二分类的网络训练代码
Data prepare:将liblinear格式的数据,转化成keras下的向量格式的文件raw_train_data = open("/mnt/software/train_data")f = file("train_data","w+")cnt = 0for t_data in raw_train_data: farr = t_data.split(" ")原创 2017-04-20 19:40:39 · 8800 阅读 · 0 评论 -
Usage of loss functions
转自:https://keras.io/losses/A loss function (or objective function, or optimization score function) is one of the two parameters required to compile a model:model.compile(loss='mean_squared_err转载 2017-04-20 22:27:50 · 639 阅读 · 0 评论 -
Text Generation With LSTM Recurrent Neural Networks in Python with Keras
Recurrent neural networks can also be used as generative models.This means that in addition to being used for predictive models (making predictions) they can learn the sequences of a problem and then ...转载 2017-04-26 23:45:11 · 1199 阅读 · 0 评论 -
用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践
转处:https://zhuanlan.zhihu.com/p/25928551用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践清凇2 个月前近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总结下文本分类领域特别是应用深度学习解决文本分类的相关的思路、转载 2017-05-31 20:29:12 · 6856 阅读 · 0 评论 -
[code review] lstm - sentiment analysis
Long short-term memory (LSTM) is a recurrent neural network (RNN) architecture (an artificial neural network) published in 1997 by Sepp Hochreiter and Jürgen Schmidhuber. Like most RNNs, an LSTM netwo原创 2017-07-06 17:12:30 · 1007 阅读 · 0 评论 -
Convolutional Neural Networks卷积神经网络 Contents 一:前导 Back Propagation反向传播算法 网络结构 学习算法 二:Convolutional N
转自:http://www.gageet.com/2014/0878.phpContents一:前导 Back Propagation反向传播算法网络结构学习算法二:Convolutional Neural Networks卷积神经网络三:LeCun的LeNet-5四:CNNs的训练过程五:总结本文是我在20140822的周报,其中部转载 2017-07-31 16:38:43 · 592 阅读 · 0 评论 -
Save and Load Your Keras Deep Learning Models
出自:https://machinelearningmastery.com/save-load-keras-deep-learning-models/Keras is a simple and powerful Python library for deep learning.Given that deep learning models can take hours,转载 2017-08-30 19:49:16 · 607 阅读 · 0 评论 -
机器学习算法的调试 —— 梯度检验(Gradient Checking)
http://blog.youkuaiyun.com/lanchunhui/article/details/51279293http://ufldl.stanford.edu/wiki/index.php/%E6%A2%AF%E5%BA%A6%E6%A3%80%E9%AA%8C%E4%B8%8E%E9%AB%98%E7%BA%A7%E4%BC%98%E5%8C%96反向传播转载 2017-09-19 00:01:15 · 823 阅读 · 0 评论 -
使用CNN进行文本分类
1.卷积神经网络简介卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(alternating convolutional layer)和池层(pooling layer)。卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。20原创 2017-09-06 23:08:33 · 8410 阅读 · 14 评论 -
TensorFlow Wide And Deep 模型详解与应用(二)
转处:http://geek.youkuaiyun.com/news/detail/235471作者简介:汪剑,现在在出门问问负责推荐与个性化。曾在微软雅虎工作,从事过搜索和推荐相关工作。 责编:何永灿(heyc@youkuaiyun.com) 本文首发于优快云,未经允许不得转载。TensorFlow Wide And Deep 模型详解与应用(一)前面讲了模型输入的特征,下面谈谈模型本转载 2018-02-01 15:27:17 · 1544 阅读 · 0 评论 -
The Wide and Deep Learning Model(译文+Tensorlfow源码解析)
转处:http://blog.youkuaiyun.com/sxf1061926959/article/details/78440220?readlogAuthor: DivinerShi本文主要讲解Google的Wide and Deep Learning 模型。本文先从原始论文开始,先一步步分析论文,把论文看懂。再去分析官方开源的Tensorflow源码,解析各个特征的具体实现方法,以及模转载 2018-02-01 15:29:14 · 776 阅读 · 0 评论 -
Open Sourcing a Deep Learning Solution for Detecting NSFW Images
By Jay Mahadeokar and Gerry PesaventoAutomatically identifying that an image is not suitable/safe for work (NSFW), including offensive and adult images, is an important problem which researchers hav...转载 2018-10-11 16:42:06 · 1040 阅读 · 0 评论