
语音
文章平均质量分 52
yanhe156
这个作者很懒,什么都没留下…
展开
-
使用Tensorflow进行语音识别 代码阅读笔记1
数据集 TIMITgithub工程源码阅读首先看一下shell脚本 /examples/timit/training/run_ctc.sh 使用示例 ./run_ctc.sh ../config/ctc/blstm_rmsprop_phone61.yml 0#!/bin/zsh# 使用的是zsh,据说zsh是最好用的shellMODEL_SAVE_PATH="...原创 2018-04-29 18:34:42 · 1953 阅读 · 0 评论 -
ubuntu安装scikits.audiolab
安装scikits.audiolab是为了读取timit中的 .WAV文件参考: 1 python 安装scikits.audiolab记录 2 安装scikits.audiolab安装步骤1 开始使用源码安装不行 2 直接 pip install scikits.audiolab...原创 2018-05-01 15:17:36 · 568 阅读 · 0 评论 -
使用GPU云服务器加速训练
2017.7.30限于经济条件,只有一台thinkpad的笔记本,8核1.6GHz cpu,8G内存,intel集成显卡在ubuntu中运行caffe 自带的mnist手写数字识别样例(使用CPU)时,大概需要900s,可以说比较慢了。前不久偶然看到腾讯云出了GPU云服务器,当时还没开始入门ML,现在想使用这个来提高一下速度,不想把时间花费在等待上,但是发现腾讯云的GPU服务器价格较贵,同时好像只...原创 2017-07-30 16:35:21 · 4167 阅读 · 0 评论 -
使用Tensorflow进行语音识别 代码阅读笔记2
看一下这个工程中的数据加载方式数据加载1 Dataset 类examples/timit/data/load_dataset_ctc.py#! /usr/bin/env python# -*- coding: utf-8 -*-"""Load dataset for the CTC model (TIMIT corpus). In addition, f...原创 2018-04-29 18:34:30 · 633 阅读 · 0 评论 -
CTC 论文阅读笔记
读语音识别的论文Towards End-to-End Speech Recognition with Recurrent Neural Networks时,看到了这个名词。Sayre’s paradox出现在1973年手写体识别的论文中:A standard statement of the paradox is that a cursively written word cannot ...原创 2018-05-15 01:47:24 · 906 阅读 · 0 评论 -
训练时dev set太大导致耗时过长
训练时,用dev set评估性能,但是开始是,可以不使用全部的dev set,而是随机选取叫少量,这样能节省时间。原创 2018-05-15 11:18:49 · 357 阅读 · 0 评论