- 博客(80)
- 资源 (34)
- 收藏
- 关注

原创 语音信号识别动态时间规整算法 DTW 编程实现
想象力比知识更重要!声明:本文是作者原创文章,未经作者允许,不得照本用在论文,书籍等涉及谋取私利的任何平台上,欢迎转载,请注明出处。 开源分享的力量在于使优秀的思想和技术得到发展传承,开源良好秩序的维持在于对知识的尊重和对成果合理利用。概述:前段时间在百度DTW是怎么回事,在优快云...
2018-10-26 20:45:45
919
原创 嵌入式操作系统进入临界区是否影响中断的接受?
在ucos,Freertos中常常会有进入临界区,以保证当前的操作不可被打断,确保操作关键代码的安全。进入临界区关键代码操作假设发生A类型中断退出临界区那么A中断还能够接受到吗?进入临界区,关闭中断,中断发生,打开中断,这个过程中会发生什么呢?显然,关闭中断期间,CPU不可能去响应中断,再次打开中断的时候,如果在关闭中断期间,发生了中断,发生的中断被记录下来,开启中...
2019-12-18 11:56:31
2247
原创 stm32的存储器结构
https://blog.youkuaiyun.com/qq_33114231/article/details/78658465 首页 博客 学院 下载 图文课 论坛 APP 优快云优快云学院 问答 商城 VIP会员 活动 招聘 ITeye GitChat 写博客 小程序 百度APP扫码 关注智能小程序 阅读体验更佳 消息 1 评...
2019-03-29 20:49:54
2185
原创 CAN通信协议
https://blog.youkuaiyun.com/weixin_40528417/article/details/79476186
2019-03-26 22:23:42
962
转载 语音的线性预测系数(Linear Prediction Coefficient,LPC)
语音的线性预测系数(Linear Prediction Coefficient,LPC)转自@https://blog.youkuaiyun.com/Lebronze/article/details/54135664线性预测技术很早(1967年)就已经被应用与语音处理领域,基本概念是:一个语音的采样值可以通过过去若干语音采样值的线性组合来逼近(最小均方误差),能够决定唯一的一组预测系数,而这个预...
2018-10-31 20:26:33
14874
1
转载 matlab工具voicebox函数中文说明
matlab工具voicebox函数中文说明原文 http://blog.youkuaiyun.com/u014646950/article/details/55050696Voicebox:在matlab使用的语音程序工具 一些文件使用加前缀"v_"避免命名冲突 音频文件输入或输出 readwav - 读取WAV文件 writewav ...
2018-10-31 11:29:18
4783
转载 七种滤波方法的matlab实现和测试
七种滤波方法的matlab实现和测试创建两个混合信号,便于更好测试滤波器效果。同时用七中滤波方法测试。混合信号Mix_Signal_1 = 信号Signal_Original_1+白噪声。混合信号Mix_Signal_2 = 信号Signal_Original_2+白噪声。1.巴特沃斯低通滤波器去噪巴特沃斯滤波器适合用于信号和噪声没有重叠的情况下。下图是巴特沃斯对两个信号的...
2018-10-30 21:08:39
76857
6
转载 有关信号处理中的 窗函数
1 信号截断及能量泄漏效应数字信号处理的主要数学工具是傅里叶变换。应注意到,傅里叶变换是研究整个时间域和频率域的关系。然而,当运用计算机实现工程测试信号处理时,不可能对无限长的信号进行测量和运算,而是取其有限的时间片段进行分析。做法是从信号中截取一个时间片段,然后用观察的信号时间片段进行周期延拓处理,得到虚拟的无限长的信号,然后就可以对信号进行傅里叶变换、相关分析等数学处理。 下面,我...
2018-10-30 15:36:39
3141
转载 了解FFT和信号加窗
1. 理解时域、频域、FFT傅立叶变换有助于理解常见的信号,以及如何辨别信号中的错误。 尽管傅立叶变换是一个复杂的数学函数,但是通过一个测量信号来理解傅立叶变换的概念并不复杂。 从根本上说,傅立叶变换将一个信号分解为不同幅值和频率的正弦波。 我们继续来分析这句话的意义所在。 所有信号都是若干正弦波的和 我们通常把一个实际信号看作是根据时间变化的电压值。 这是从时域的角度来观察信号。 傅...
2018-10-30 15:33:11
6044
转载 自然语言处理 数据集
自然语言处理 怎么获得数据集 中文语料集?转自@https://blog.youkuaiyun.com/u012052268/article/details/78035272深度学习 自然语言处理 怎么获得数据集 中文语料集? 深度学习 自然语言处理 怎么获得数据集 中文语料集 爬虫 数据平台 1 数据堂 2 搜狗实验室 3 自然语言处理与信息检索共享平台 ...
2018-10-29 23:13:09
713
转载 各领域公开数据集下载
原文:https://zhuanlan.zhihu.com/p/25138563 整理了一些网上的免费数据集,分类下载地址如下,希望能节约大家找数据的时间。欢迎数据达人加入QQ群 518881260 交流。金融美国劳工部统计局官方发布数据房地产公司 Zillow 公开美国房地产历史数据沪深股票除权除息、配股增发全量数据,截止 2016.12.31上证主...
2018-10-29 22:40:43
2645
转载 数据科学家职业素养
转自https://blog.youkuaiyun.com/tMb8Z9Vdm66wH68VX1/article/details/82634969 简介 你已经决定把数据科学当做是适合你的领域了?如今越来越多的企业正在变得以数据驱动,世界变得越来越紧密,以致于看起来每个企业都需要数据科学实践。因此,对数据科学家的需求是巨大的。甚至更好的是,业界数据科学人才短缺已经成为共识。 然而,要成...
2018-10-29 22:24:39
462
转载 何恺明ICCV获奖论文结果并开源 !(附论文&开源代码)
完整复现何恺明ICCV获奖论文结果并开源 !(附论文&开源代码) 本文为你介绍何恺明ICCV 2017两篇获奖论文,并附上完整复现论文结果的开源代码! ICCV 作为计算机视觉的顶级会议,2017年共收到2143篇论文投稿,比上一届ICCV2015的1698篇增加了26.2%。共621篇被选为大会论文,录用比例28.9%;poster、spotlight、...
2018-10-29 22:16:45
1581
2
转载 语音信号处理数据自然语言
转自@https://blog.youkuaiyun.com/tMb8Z9Vdm66wH68VX1/article/details/78153519作者:Jason Brownlee翻译:梁傅淇本文长度为1500字,建议阅读3分钟本文提供了七个不同分类的自然语言处理小型标准数据集的下载链接,对于有志于练习自然语言处理的新手而言,是极有帮助的资源。在你刚开始入手自然语言处理任务时,...
2018-10-29 22:02:45
896
转载 Tensorflow语音识别官方案例
Tensorflow语音识别官方案例下载地址https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples 这是tensorflow在github上的地址,里面有一个speech_commands案例,下载下来运行步骤参考官方版:https://www.tensorflow.org/versions...
2018-10-29 21:52:39
906
转载 基于深度学习的中文语音识别系统框架搭建
基于深度学习的中文语音识别系统框架转自@https://blog.youkuaiyun.com/chinatelecom08/article/details/82557715本文搭建一个完整的中文语音识别系统,包括声学模型和语言模型,能够将输入的音频信号识别为汉字。声学模型使用了应用较为广泛的递归循环网络中的GRU-CTC的组合,除此之外还引入了科大讯飞提出的DFCNN深度全序列卷积神...
2018-10-29 21:23:38
3841
转载 TIMIT语音库-----下载和matlab读取
TIMIT语音库-----下载和matlab读取 在MIT网站可以找到一些样例, 为 16kHz sampling, 16 bit sample, PCM encoding。样例才160个句子,不够用。这儿能找到完整版,用抓取工具全部下载下来有600多M但问题是虽然其为wav结尾,matlab中wavread却读不了,用二进制打开文件发现google一下,原来其为 S...
2018-10-29 21:09:16
2293
转载 清华大学王东:语音识别中的大数据与小数据学习
清华大学王东:语音识别中的大数据与小数据学习原文链接:http://www.199it.com/archives/455137.html本讲座选自清华语音语言实验室副主任王东于2016年1月19日在RONGv2.0系列——”语言语音语义与大数据技术”专场上所做的题为《语音识别中的大数据与小数据学习》的演讲。谢谢大家。刚才刘老师已经把很多的东西说得很清楚了,我觉得我已经...
2018-10-29 20:52:05
2295
转载 图像处理 语音识别 深度学习 开放数据集
从图像处理到语音识别,25款数据科学家必知的深度学习开放数据集 本文介绍了 25 个深度学习开放数据集,包括图像处理、自然语言处理、语音识别和实际问题数据集。介绍深度学习(或生活中大部分领域)的关键在于实践。你需要练习解决各种问题,包括图像处理、语音识别等。每个问题都有其独特的细微差别和解决方法。但是,从哪里获得数据呢?现在许多论文都使用专有数据集,这些数据集通常并不对公...
2018-10-29 20:25:56
1446
转载 语音识别工具箱之HTK安装与使用
转自@http://www.cnblogs.com/mingzhao810语音识别工具箱之HTK安装与使用 HTK(HMM Toolkit)一款基于hmm模型的语音处理工具,早就听说它了,一直因为用MATLAB中的工具箱在学习,或自己写代码在做HMM方面的试验,所以没有接触到它。现在,上海朋友家里的网速超赞,我就趁投简历的时间空隙,下载了它的一些资料,包括安装文件,使用文档(最好中英...
2018-10-28 11:43:05
670
转载 MFCC特征提取原理与HTK和matlab等方式的实现
MFCC特征提取原理与HTK和matlab等方式的实现(帧的原理也有)一、MFCC概述 在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,简称MFCC)。根据人耳听觉机理的研...
2018-10-28 11:23:03
1279
转载 傅里叶变换 FFT 频谱泄漏?
什么是泄漏?在做信号处理时,经常涉及到“泄漏”。那泄漏是什么,是什么原因造成了泄漏呢?在这将告诉您答案。 1.信号截断一次FFT分析截取1帧长度的时域信号,这1帧的长度总是有限的,因为FFT分析一次只能分析有限长度的时域信号。而实际采集的时域信号总时间很长,因此,需要将采样时间很长的时域信号截断成一帧一帧长度的数据块。这个截取过程叫做信号截断。 假设有一段10s的时域信号,...
2018-10-27 23:38:55
4697
转载 Mel Frequency Cepstral Coefficient
Mel Frequency Cepstral Coefficient (MFCC) tutorialThe first step in any automatic speech recognition system is to extract features i.e. identify the components of the audio signal that are good f...
2018-10-27 22:46:48
770
转载 TTS资源
转自@https://blog.youkuaiyun.com/jtop0/article/details/5423949?utm_source=blogxgwz2目前 流行到 TTS软件 和 发音库2010年03月28日 03:03:00 jtop0 阅读数:6175 标签: ttsstringiteratorfilecommandubuntu 这两天 在 安装 Ubuntu下 到 sta...
2018-10-27 22:21:45
2127
转载 开源TTS的选择和使用
转自@https://www.cnblogs.com/mulisheng/p/7162069.html开源TTS(Text To Speah)的选择和使用TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。TTS是语音合成应用的一种,它将文件内容或应用上的文字等,如应用菜单或者网页,转换成自然语音输出。TTS不仅能帮助有视觉障碍的人...
2018-10-27 22:15:21
3805
原创 Tempo and Beat Tracking
Tempo and Beat Trackingif you are reading this paper .please do not go on !!! it's not for you. methods:1.Onset Detection do so...
2018-10-27 00:25:52
597
原创 语音信号识别动态时间规整算法 DTW 高级用法
Subsequence DTWOptimal time alignment of the sequence X with a subsequence of Y .Aligned points are indicated by the arrows how to do this ,I will told you a method : if you don...
2018-10-26 23:39:54
644
原创 CPU之多核计算程序设计 <1>
CPU多核计算概论为什么需要CPU多核计算:矛盾1.日益增长的处理能力单核处理极限瓶颈的矛盾其中,单核CPU频率接近极限,提高主频发热现象严重,继续提高主频会带来高发热问题,导致芯片运行不正常。单核通过提高指令形式方法会带来一些移植上的麻烦,增加流水线是很困难的,从指令上提升CPU是很困难的。单纯提高CPU的主频,会与储存器访问速度匹配问题没如果CPU的访问速度不能匹...
2018-10-26 09:22:46
1808
1
原创 CPU之多核计算程序设计 <2>
多核编程与单核多线程编程的区别1竞争导致串行化问题单核系统中,如果某个线程的得到了锁,那么这个线程将会获得CPU资源运行,其他的线程则被阻塞,这个过程中解锁消耗CPU资源。多核系统中,不同的线程竞争一把锁,某个线程获得锁后,其他的线程将会处于阻塞状态,只有该线程获得CPU资源运行,如果这些线程是在不同的核心上,那么将会出现仅有一个核心运行的情况,进程呈现排队运行的情况。2线程分解与...
2018-10-26 09:22:32
925
1
转载 通俗理解神经网络之激励函数
关于神经网络激励函数的作用,常听到的解释是:不使用激励函数的话,神经网络的每层都只是做线性变换,多层输入叠加后也还是线性变换。因为线性模型的表达能力不够,激励函数可以引入非线性因素。 其实很多时候我们更想直观的了解激励函数的是如何引入非线性因素的。我们使用神经网络来分割平面空间作为例子。无激励函数的神经网络神经网络最简单的结构就是单输出的单层感知机,单层感知机只有输入层和输出层,...
2018-10-26 09:22:01
1053
2
转载 深入理解朴素贝叶斯(Naive Bayes)
深入理解朴素贝叶斯(Naive Bayes) 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。该算法虽然简单,但是由于笔者不常用,总是看过即忘,这是写这篇博文的初衷。当然,更大的动力来在于跟大家交流,有论述不妥的地方欢迎指正。1.算法思想——基于概率的预测逻辑回归通过拟合曲线(或者学习...
2018-10-26 09:20:27
798
原创 机器学习之最小二乘法
最小二乘法实际应用的一个完整例子 整个过程分七步,为了方便喜欢直接copy代码看结果的同学,每步都放上了完整的代码。实验数据: 第一步:准备样本数据并绘制散点图 1)代码及其说明import numpy as npimport scipy as spimport matplotlib.pyplot as pltfrom ...
2018-10-26 09:20:05
439
转载 Linux 同步方法剖析
转自@https://www.ibm.com/developerworks/cn/linux/l-linux-synchronization.html内核原子,自旋锁和互斥锁本文讨论了 Linux 内核中可用的大量同步或锁定机制。这些机制为 2.6.23 版内核的许多可用方法提供了应用程序接口(API)。但是在深入学习 API 之前,首先需要明白将要解决的问题。并发和锁定当存...
2018-10-26 09:19:37
106
转载 DTW算法
DTW算法 转自@http://www.cnblogs.com/tornadomeet DTW为(Dynamic Time Warping,动态时间归准)的简称。应用很广,主要是在模板匹配中,比如说用在孤立词语音识别,计算机视觉中的行为识别,信息检索等中。可能大家学过这些类似的课程都看到过这个算法,公式也有几个,但是很抽象,当时看懂了但不久就会忘记,因为没有具体的实例...
2018-10-26 09:19:25
1142
转载 GMM-HMM语音识别
GMM-HMM语音识别转自@http://www.cnblogs.com/tornadomeet 为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的。不得不说,网络上关于语音识别的通俗易懂教程太少,都是各种公式满天飞,很少有说具体细节的,当然了,那需要有实战经验才行。...
2018-10-26 09:19:15
1016
转载 机器学习(Machine Learning)&深度学习(Deep Learning)资料 <2>
机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) 《Image Scaling using Deep Convolutional Neural Networks》介绍:使用卷积神经网络的图像缩放.《Proceedings of The 32nd International Conference on M...
2018-10-26 09:19:06
1237
转载 实时 Linux 架构剖析
转自@https://www.ibm.com/developerworks/cn/linux/l-real-time-linux/#resources本文探索了一些支持实时特性的 Linux 架构,并探讨了实时架构 的含意是什么。有许多种解决方案赋予 Linux 实时能力,本文将对瘦内核(或微内核)方法、超微内核方法以及资源内核(resource-kernel)方法进行考查。最后,描述了标准 ...
2018-10-25 00:42:23
698
转载 Linux 和对称多处理
Linux 和对称多处理转自@https://www.ibm.com/developerworks/cn/linux/l-linux-smp/在 SMP 系统上发挥 Linux 的功能可以通过多种方法提高 Linux 系统的性能,而其中最流行的一种是提高处理器的性能。一个明显的解决方案是使用具有更快时钟频率的处理器,但是对于任何特定技术来讲都存在一个物理极限,时钟频率也有这样的极...
2018-10-25 00:42:14
436
转载 语音识别原理
首先,我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows PCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头以外,就是声音波形的一个个点了。下图是一个波形的示例。 在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续步骤造成的干扰。这个静音切除的操作一般称为VAD,需要用到信号处理的一些...
2018-10-24 09:55:03
1335
转载 Qt 3D的研究(三):显示3D模型
Qt 3D的研究(三):显示3D模型转自@http://blog.youkuaiyun.com/gamesdev/article/details/43964499 我们接下来要使用Qt 3D将一个模型显示出来。Qt 3D内置了obj模型的解析器,可以很方便地导入obj格式的模型。如果想要使用Qt 3D导入ms3d、3ds这样格式的文件,可能需要将Assimp模型解析库和Qt 3D放在一起进...
2018-10-23 18:38:41
6807
工程师10年STM32工程汇总(没什么用)
2017-11-05
机器学习实战
2017-11-05
小波变换计算方法
2017-11-05
C语言基础PPT
2017-11-05
神经网络matlab代码
2017-11-05
华为工程师内部 资料代码
2017-10-30
UML入门实战
2017-10-30
DTWC语言编程实现博客配套代码
2018-10-26
MATLAB 齐次坐标 机器人实验代码
2018-03-17
STM32DMAI2C代码
2018-03-10
machine lerning机器学习实战源代码
2018-03-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人