
语音算法
shawncheer
这个作者很懒,什么都没留下…
展开
-
htk安装在ubuntu上的说明
htk3.4.1需要32位的X11,并且其中的Makefile稍微有点问题:以下为安装简要说明(32位的x11需要自行下载):sudo apt-get install -y gcc-multilibsudo apt-get install -y libx11-6 libxau-dev libxdmcp-dev libxcb1-dev lib32ncurses5 lib32z1sud...原创 2020-02-18 12:20:21 · 335 阅读 · 0 评论 -
递归处理文件夹内所有音频的范例
1、Python脚本功能:另有介绍可以参考:https://rollingstarky.github.io/2018/12/18/processing-audio-with-sox/该python脚本功能为递归处理文件夹下所有文件的,并递归输出到另一个文件夹,这里是格式转换,用sox把格式同样转换为单通道,8k16bit数据。#!/usr/bin/python ...原创 2019-12-05 11:39:05 · 270 阅读 · 0 评论 -
RNN和LSTM学习
对参考文献[1]进行的分析:参考文献:[1] 罗娜, 魏松杰, 时召伟, 吴高翔. 采用LSTM模型的Android应用行为一致性检测[J].浙江大学学报(工学版), 2018, 52(6): 1097-1106....原创 2019-11-26 20:26:19 · 254 阅读 · 0 评论 -
语音特征的理解
启发来自于文章:https://www.cnblogs.com/xingshansi/p/6621914.html更进一步的启发是来源与其中的一幅图:特征的目的是用一个不像频谱那样过于曲折的线条,勾勒频谱的轮廓。可以对比轮廓(传统方法)或记忆总结轮廓(深度学习方法)来做识别方面的工作。...原创 2018-12-12 17:20:31 · 1148 阅读 · 0 评论 -
语音信号前端处理代码解析
参考:https://haythamfayek.com/2016/04/21/speech-processing-for-machine-learning.html代码如下:import numpyimport scipy.io.wavfilefrom scipy.fftpack import dctsample_rate, signal = scipy.io.wavfile.r...原创 2019-01-02 20:09:51 · 670 阅读 · 0 评论 -
语音头文件解析
参考:http://truelogic.org/wordpress/2015/09/04/parsing-a-wav-file-in-c/本文只是做个记录,详情请参考上述链接。wave.h// WAVE file header formatstruct HEADER { unsigned char riff[4]; // RIFF string unsigned in...原创 2019-02-19 16:00:37 · 751 阅读 · 0 评论