把一些深度学习在语音上的应用的开源代码收集起来,如果你遇到,可以告诉我,我也收集在这里。方便大家查阅和做实验。
1.audio feature extraction with deep belief network: http://www.liacs.nl/~dmus/api2011.html 这个主要是用dbn来做个语音的分类。
2.Unsupervised feature learning for audio classification using convolutional deep belief networks : http://web.eecs.umich.edu/~honglak/ Honglak Lee的主页,这篇论文主要做一些音乐的分类和说话人识别等等。论文和代码都有链接。
3.Recurrent neural network training for noise reduction in robust automatic speech recognition :https://github.com/amaas/rnn-speech-denoising rnn在语音去噪上的应用。你值得看看。
4.Deep Recurrent Neural Networks for Source Separation:https://github.com/posenhuang/deeplearningsourceseparation rnn和dnn在语音分离上的应用,最近才公布出来的哦。
5.深度学习模型在语音识别上的应用,当然是kaldi,这个提供深度学习的框架。主页:http://kaldi.sourceforge.net/index.html
6.cmu的苗博士的kaldi+pdnn,大家可以看看:http://www.cs.cmu.edu/~ymiao/kaldipdnn.html ,里面提供很多的模型。
7.微博上有人收集的:https://github.com/memect/hao/blob/master/awesome/speech-recognition.md
8.http://research.microsoft.com/en-us/events/fs2013/agenda_collapsed.aspx
9.中科大博士生,用dnn做语音增强:http://home.ustc.edu.cn/~xuyong62/demo/SE_DNN.html