- 博客(15)
- 资源 (1)
- 收藏
- 关注

原创 深度学习--防止过拟合的几种方法
本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。 在机器学习和深度学习中,过拟合是一个十分常见的问题,一旦模型过拟合了,可能这个模型就无法适用于业务场景中了。所以为了降低产生过拟合的风险,机器学习中的大牛们提出了以下几种方法供大家使用:引入正则化Dropout提前终止训练增加样本量 本文将对这5种方法进行简单的讲解分析。1. 正则化 正则化的思
2017-08-29 18:05:37
25004
1

原创 语音识别:深入理解CTC Loss原理
最近看了百度的Deep Speech,看到语音识别使用的损失函数是CTC loss。便整理了一下有关于CTC loss的一些定义和推导。由于个人水平有限,如果文章有错误,还恳请各位指出,万分感谢~附上我的github,欢迎各位的follow~~~献出小星星~1. 背景介绍 在传统的语音识别的模型中,我们对语音模型进行训练之前,往往都要将文本与语音进行严格的对齐操作。这样就有两点不太好:严格对齐要
2017-07-30 09:58:47
57483
19

原创 TACOTRON:端到端的语音合成
由于最近在学习语音识别和语音合成方面的内容,整理了一些东西,本文为论文tacotron的笔记。tacotron主要是将文本转化为语音,采用的结构为基于encoder-decoder的Seq2Seq的结构。其中还引入了注意机制(attention mechanism)。在对模型的结构进行介绍之前,先对encoder-decoder架构和attention mechanism进行简单的介绍。其中纯属个人
2017-07-09 20:50:53
18785
2
原创 numpy入门100题
本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。此文中的题目均来自GitHub,完整代码请参考我的GitHub。期待各位的小心心~~~1.初级导入numpy包,并重命名为np (★☆☆)打印numpy库的版本 (★☆☆)输出numpy矩阵的大小 (★☆☆)如何获取numpy库中某一个函数(如add)的帮助文档 (★☆☆)创建一个0向量,向量长度为10
2017-09-28 15:23:40
2045
原创 Tensorflow学习(一)--使用TensorFlow实现线性回归
本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。 最近发现自己都没有真正好好学习过TensorFlow,只是看看别人project的代码,然后能跑起来就行,实际自己想要去搭建一些网络还是很困难,因此准备写一个使用TensorFlow实现一些网络的系列。这是第一篇,因此就从最简单的线性回归开始。 首先简单介绍一下线性回归。线性回归的表达式为: y=wx+b
2017-09-22 12:36:34
3319
原创 深度学习--激活函数的对比分析
本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。 在学习神经网络的时候,你会经常听到一个词:激活函数。在最开始学习的时候,对激活函数总是有很多的疑惑。在日常搭建网络的时候选择激活函数也是很随意,看到大家都说ReLU效果好,就一股脑使用ReLU。通常没去深究一些问题:激活函数到底是什么?为什么要使用激活函数?常用的激活函数有哪些?这些常用的激活函数有什
2017-08-29 09:29:06
2667
1
原创 深入理解支持向量机-SVM
秋招在即,发现最近一直在做的都是深度学习里的一些项目。机器学习里的一些经典算法快忘光了。想重新再对一些经典的算法整理下,更好的面对即将到来的秋招。今天要总结的是机器学习里比较火的一种算法:支持向量机(Support Vector Machine)。1. 结构风险最小原理 在对支持向量机算法介绍之前,我们需要了解一下在传统的统计学里的一个概念“结构风险最小原理”。 首先我们回想一下,在机器学习中,
2017-08-05 17:02:04
2223
原创 Logistic回归
众所周知,线性回归主要是用于预测,而当我们所研究的问题是一个分类问题,这里简化为一个二分类(假定两类为0和1)问题的话,由于线性回归目标函数y的输出域为负无穷到正无穷,因此线性回归就无法满足我们的需求。因此,我们就想到要将一般线性回归模型的输出从负无穷到正无穷映射至0到1之间(这里假定为输出的是将样本划分为1的概率),这样当目标函数的输出大于0.5时,我们将该样本划分为1;当目标函数小于0.5时,我
2017-07-24 09:06:31
1039
原创 Deep Speech:端到端的语音识别
本文为百度的Deep Speech的论文笔记,本人为深度学习小白,文章内如有错误,欢迎请各位指出~ 附上我的github主页,欢迎各位的follow~~~献出小星星~什么是端到端? 对于传统的语音识别,通常会分为3个部分:语音模型,词典,语言模型。语音模型和语言模型都是分开进行训练的,因此这两个模型优化的损失函数不是相同的。而整个语音识别训练的目标(WER:word error rate)与
2017-07-20 20:37:30
13181
原创 spark中查询PG数据库老是报无法找到该列
最近学习spark的过程中,发现在使用spark中的sql语句查询数据的时候老是报错: 16/11/30 19:38:42 ERROR Executor: Exception in task 0.0 in stage 2.0 (TID 2) org.postgresql.util.PSQLException: ERROR: column “studentid” does not exist
2016-11-30 19:46:50
2077
原创 scala学习-trait学习
trait是scala中代码复用的基础单元。特质中封装了一些方法和字段,可以通过混入到类中来重用他们。定义trait的方法:trait ConsoleLogger{ def logger(msg: String) = {println(msg)} }与类的继承不同,一个子类只能继承自唯一的超类,而一个类中可以混入多个特质。特质的定义与类定义除关键字不同以外,基本无大的差异。特质同样
2016-09-14 18:07:02
490
原创 scala学习
关于构造器在scala中,构造器存在于类中,是整个类体。而构造器所需的所有参数都在类名称之后。看scala编程一书中的一个例子: class Ration(a:Int, b:Int){ require(b != 0) override def toString: String = {a + " / " + b} def add(p: Ration): R
2016-09-10 17:23:36
477
原创 R语言__数据处理2列表
列表 R语言中的列表与向量不同,在单个向量中所存放的数据类型必须一致,而列表却不同,它可以组合多种不同类型的对象,且列表的每一个组件可以是不同的长度。 1.创建列表: 通过list函数进行创建列表 2.列表的索引: 在列表a中索引age这一列: a.通过列表+组件名进行索引 b.通过列表+
2015-01-05 13:46:14
2242
原创 R语言___数据处理1向量
一.向量1.构造向量 在R语言里,通过函数c来建立一个向量。(注意:向量内的数据类型必须一致。) example:a (1)查看向量的类型,用mode(向量名) (2)在向量中实现索引 在向量a中得到大于等于3的数 a.用subset函数. subset函数的第一个参数是要索引的向量,第二个参数是索引条件。
2014-12-23 18:09:06
2765
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人