
语音识别rnn
德西
天降大任于斯人也,必先苦其心志,劳其筋骨,饿其体肤,空乏其身,行指乱其所为,所以动心忍性,曾益其所不能
展开
-
自顶向下分析一个简单的语音识别系统(一)
RNN处理带有时间序列的数据时具有很大的优势,接下来几篇文章将介绍如何使用RNN训练一个简单的语音识别系统。 主要参考该GitHub项目,https://github.com/silicon-valley-data-science/RNN-Tutorial以及这篇文章http://www.tuicool.com/articles/JvQb2iV 该项目使用tensorflow1.0.1构建(py原创 2017-04-03 10:02:52 · 2653 阅读 · 9 评论 -
自顶向下分析一个简单的语音识别系统(九)
前面几回,我们分析完了run_model函数的configuration过程以及数据的输入输出向量的生成,本回我们继续分析一下接下来具体的训练过程。原创 2017-04-05 16:51:09 · 1089 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(八)
上回我们说到了get_audio_and_transcript函数、pad_sequences函数和sparse_tuple_from函数等3个函数,本回我们分析这3个函数分别实现了哪些功能。原创 2017-04-05 10:09:37 · 1840 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(七)
上回我们分析了系统网络的基本结构,那么我们的网络又是如何训练的呢?要回答这个问题,我们先得回答我们的数据是如何获得的,这回我们就来分析一下这个过程。原创 2017-04-04 17:29:52 · 758 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(六)
上回分析了run_model函数的configuration过程,其中load_placeholder_into_network函数用于构建该语音识别系统中RNN网络的基本结构,本回将分析以下该网络。原创 2017-04-03 20:28:52 · 2957 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(五)
本回我们主要分析run_model中的configuration过程的相关函数。1.run_model函数第二回我们简单介绍了run_model函数的结构,现在我们贴出代码如下所示: def run_model(self): self.graph = tf.Graph() with self.graph.as_default(), tf.device('/cpu原创 2017-04-03 17:04:22 · 894 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(四)
上回我们分析了模型的初始化,花开两朵各表一枝,本回我们说一下上回提到的set_dirs.py。该文件结构如下图所示:Created with Raphaël 2.1.0get_home_dirget_data_dir/get_conf_dir/get_model_dirget_relevant_directories其中, get_home_dir返回RNN-Tutorial所在目录,代码如下:d原创 2017-04-03 17:01:07 · 723 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(三)
上一回我们简要分析了Tf_train_ctc这个类的主要结构,本回我们主要讲Tf_train_ctc的__init__ 函数是如何初始化的。1. __init__ 函数代码如下: def __init__(self, config_file='neural_network.ini', model_name=None,原创 2017-04-03 15:20:15 · 1121 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(二)
上回咱们说到项目的目录以及各个文件的作用,这回我们自顶向下开始分析该项目。项目开始于tf_train_ctc.py文件。1. 训练的开始代码如下图所示:if __name__ == '__main__': import click # Use click to parse command line arguments @click.command() @click.op原创 2017-04-03 10:42:05 · 1432 阅读 · 0 评论 -
自顶向下分析一个简单的语音识别系统(十)
接着上回结束的地方,本回我们来分析sparse_tuple_to_texts函数和ndarray_to_text函数。原创 2017-04-05 20:48:48 · 890 阅读 · 0 评论