- 博客(22)
- 资源 (1)
- 收藏
- 关注
原创 Win 10使用WSL2
这里写自定义目录Win 10使用WSL2新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入Win 10使用WSL2WSL(windows subset for linux)新的改变PS C:\WINDOWS\syste
2021-08-13 23:59:15
480
原创 基于TensorFlow的音频分析
基于TensorFlow的音频分析本文主要梳理一下使用机器学习的方法进行音频分析的基本操作,并且仅用TensorFlow 实现从特征提取到模型训练的整个过程。预计三月份之前完成。...
2019-02-25 16:08:21
1125
2
原创 游戏升级问题的解法_马尔科夫链与随机游动
游戏升级问题的解法_马尔科夫链与随机游动好久之前写好,因为没网发不上来,着实可笑。^_^问题背景:某款游戏升级到下一个段位需要攒够五颗星,赢一局加一星(非连胜状态),输一局掉一星。连胜加两颗星。假设某位玩家赢一局游戏的概率为p(此处假设p=1/2),任意两局之间的战果互不影响。求该玩家增长一个段位所需玩的局数的期望(不考虑掉段的情况)。分析这是一个随机过程问题,类似于经典的赌徒输光,但...
2018-09-22 16:31:21
1711
原创 windows平台上在matlabR2017a中编译LibSVM--VS2017
Matlab R2017a有个bug,就是在用mex编译c/c++程序的时候,如果要用vs2017的编译器(支持c++17)的时候需要打一个补丁,补丁是2017年5月才出的。 print('cpu version')
2017-09-06 16:50:11
12247
8
原创 一些资源以及读书总结
在这个网站可以下到好多书记的电子版:http://gen.lib.rus.ec/《解析深度学习语音识别时实践》 作者:俞栋、邓力 译者:俞凯 钱彦旻等 原作:英文,《Automatic Speech Recognition A Deep Learning Approach》 读书总结:
2017-07-14 20:22:56
484
原创 Ubuntu 16.04安装Kaldi详解
Ubuntu 16.04安装Kaldi详解感谢[luhuang的博客](https://huanglu.me/2017/01/01/ubuntu-install-kaldi-with-network/%20%E2%80%9Cluhuang%E7%9A%84%E5%8D%9A%E5%AE%A2%E2%80%9D)。不同的人在实际安装的过程中会遇到各种各样的问题,我也不例外。遇到了LuHuang的
2017-06-21 22:03:43
2846
5
原创 关于认可
人怎么才能不在意外部对自己的看法?我自己认可自己比别人认可自己是更有价值的,前提是我时时都要做到不自欺。这样便能督促自己,每一天都比前一天更加强大。犯了错误,就要吸取教训,智商税交够了,还是会有所长进的。最忌浅薄,说话也好,做事也罢,浅薄了,也就没有意思了。
2017-04-28 00:10:19
536
原创 win10+Anconda4.2.0(python3.5.2)+tensorflow1.0.1+opencv3.2.0环境配置
win10+Anconda4.2.0(python3.5.2)+tensorflow1.0.1+opencv3.2.0环境配置在win10下配置上述环境。安装Anconda3-4.2.0,集成python3.5.2。全程一键安装,遇到需要添加环境变量的,允许即可。点击这里下载,大概391.4M 验证:C:\Users\mayax\Downloads>pythonPython 3.5.2
2017-04-20 19:16:30
4089
原创 语音信号特征提取<二>时域特征(待续)
语音信号特征提取<二>时域特征(待续)事实上,因为语音信号的大多数处理都是在组帧之后进行的。组帧之后,帧序号就代表了时间先后。所以没有多少特征可以在时间域进行提取。常见的几个时域特征分别是:幅值、过零率以及直流偏置、能量以及线性预测编码系数。幅值(Amplitude)过零率(ZCR)&过均值率率(MCR)能量(Energy)线性预测编码系数(LPCC) 具体计算方法如下:幅值(Amplitu
2017-04-13 21:24:25
9721
原创 语音信号特征提取<一>预处理
语音信号是一种常见的时间序列,它以离散信号的形式被编码,然后使用一定的文件格式来存储,例如”.wav”。在当前与语音有关的应用中,出了单纯的录制、不做任何处理之后播放之外,几乎所有的应用都要涉及到语音特征的提取,例如语音文本转换、说话人识别、语音情感识别等等。此外,在进行音乐信息检索(MIR)的时候,也需要类似的处理。 语音特征提取就是从数字信号中提取出与我们所要得到的主要信息相关的内容,一般会从
2017-03-29 20:24:30
19561
6
原创 常用linux命令积累(备用)
创建/删除用户adduser username这个命令的参数是用户名,创建用户的时候会一并在/home下创建名为/username的目录。并且复制相关的配置文件,大部分是隐藏文件。userdel username会删除用户,加上-r的参数之后,会一并删除目录。2.添加搜索路径 命令行下运行export PATH=$PATH:/.../.../但是有效
2017-03-08 10:58:51
463
原创 C++中调用外部可执行程序的方法--创建子进程
在C++中,通过创建子进程的方法,可以在程序中像调用函数一样调用外部可执行程序。方法如下:使用fork()函数创建子进程;主进程暂停,通过execlp()在子进程中调用外部可执行文件;等待子进程完成之后,主进程继续。 代码如下://主进程代码#include<iostream>#include<sstream>#include<string>//创建子进程并在其中执行可执行文件,需
2017-03-06 14:42:27
4831
原创 Matlab 中伪随机数的生成以及可复现的不放回等概率随机抽样
Matlab 中伪随机数的生成以及可复现的不放回等概率随机抽样在一些统计分析和优化实验中,需要用到随机数,可是我们又无法得到真正的随机数。平时使用的都是伪随机数,是拿软件模拟的随机数。 比如,系统时间具有随机性,常常被用作位随机数种子。 利用matlab可以很方便的生成伪随机数,用来做统计抽样等各种实验。 比如,你要在1-100的整数中随机抽取42个不重复的样本。显然,这是一个典型的不放回抽样
2017-03-04 15:40:54
4010
1
原创 ubuntu主机配置FTP后解决无法接受文件上传的问题
服务器环境:ubuntu14.04lts win10下用的xftp进行文件传输: 刚开始只能下载,不能上传,这是权限问题,配置文件/etc/vsftpd.conf默认不接受写入,现在需要在root权限下做一下修改即可,找到,#write_enable=YES将注释取消即可。 文件全部内容如下:root@machuanli-All-Series:/etc# vi vsftpd.conf #
2016-12-09 15:46:04
6024
原创 LATEX写作——图片插入
latex插入图片,常用两种格式,PDF 或者EPS.如果用Latex编译,就用.eps的图片;如果用PDFLatex编译,就用.pdf 的图片。代码如下: \begin{figure} \centering % Requires \usepackage{graphicx} \includegraphics[scale = 0.1]{tupian.pdf} \caption{l
2016-10-14 22:43:43
761
原创 Matlab中以指定的概率生成伪随机数
Matlab中以指定的概率生成伪随机数Matlab提供了方便的随机数生成函数,能够以指定的概率生成伪随机矩阵。今天用到了randsrc()这个函数,下面是不同的参数形式对应的输出结果。(1).randsrc():得到的是等概率的两点分布{-1,1},每次出现1或-1的概率都是1/2。(2)randsrc(m): 得到的是m阶方阵,所有元素相互独立,且服从等概率的两点分布{-1,1}。(3)ra
2016-10-10 22:06:25
22711
1
原创 基于语音信号MFCC的情感识别
信号处理课程结束了,没有像期望的那样学到很多东西,买的书(Discrete-Time)也没怎么看,作业算是完成了,但是要达到该坑的国际领先水平,距离有些遥远。我只是抚摸了一下信号处理的皮毛,我只是用了一下支持向量机。然而,我对语音情感的实际使用价值却没一个月之前那么看好了,或许面部表情和生理信号更加靠谱,也或许……基于MFCC的语音情感识别在人类的面对面交流场景中,语音所传达的信息量占有很大的比重
2016-06-13 22:42:05
10067
16
原创 matlab中的数字滤波器
在进行数字信号处理的时候经常需要对时间序列进行滤波。工具箱中常用的函数是filter常见形式: y = filter(b,a,x) 其中x是输入序列,向量b&a是滤波器的参数。y是输出序列。 下面举一个例子说明一下实际的计算过程。 比如要对一段语音信号做预加重处理,其实就是要让响应的数字序列通过一个高通滤波器。滤波器的传递函数模型为——H(z)=1-μ*z^(-1)。实
2016-05-23 11:42:44
3355
原创 语音情感数据库&python实现文件名的批量更改
昨天需要对柏林情感语音库中的535段承载七种不同情感的语音片段进行重命名以方便后续处理。 原始数据是按照下图所示命名的: 可以看到,排序会以演员名进行,而我需要它以情感种类进行排序,这样才方便后续处理。 python代码如下:import ospath = "C:\Users\machuanli\Desktop\download\wav";j = 0 ;prename = {};ne
2016-05-18 11:58:59
1511
10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人