
语音识别
eternity668
行天之路
展开
-
混淆网络和词格或者字格
一个字格是一个有向无环图。它有一个单独的起点和标记了一个字和其权重的边(为单独边)。不像强制要求每一条路径都必须通过所有节点的混淆网络。字格的路径是不要求每一条都通过其所有节点的。字格能够表示任何的有限的字符串集,尽管这一般使得字格低于混淆网络的空间效率。不管怎样,一般一个字格能够表示以多项式空间的指数数量的句子。以下为字格的一个实例表示了组合字的可能的分解:翻译 2014-09-20 11:46:15 · 1504 阅读 · 0 评论 -
Utterance API
public class Utterance 表示一个完整音频数据的Utterance,在信号的传输中,每一个Utterance的前面有一个DataStartSignal类对象,Utterance其后有一个DataEndSignal类对象,用来表示一个Utterance的开始和结束。Utterance可为一个字或多个字? 本类的属性: String name:用来标记此Utterance。给一个U翻译 2015-06-06 16:44:54 · 540 阅读 · 0 评论 -
SpeechClassifier API 与端点检测
public class SpeechClassifier extends AbstractVoiceActivityDetector 经过本类处理后的数据流中含数的为:SpeechClassifiedData(语音和非语音),DataStartSignal信号和DataEndSignal信号。 本类的作用就是把把音频信号分类成语音和非语音信号。实现了端点检测的第一步。 作用:在一定程度上实现了原创 2015-06-04 21:58:02 · 854 阅读 · 0 评论 -
SpeechMarker API 与端点检测
public class SpeechMarker extends BaseDataProcessor 经过本类处理后的数据流中含数的为:SPEECH_START信号, SPEECH_END信号, DoubleData(包含语音和非语音),DataStartSignal信号和DataEndSignal信号。属于语音的DoubleData位于SPEECH_START信号和 SPEECH_END信号之翻译 2015-06-04 21:45:21 · 837 阅读 · 0 评论 -
FrameDecoder API
public class FrameDecoder extends AbstractDecoder implements DataProcessor 一个解码器,此解码器没有使用s4常用的pull模式。而是每次调用decode()方法仅仅处理一个单独的特征帧。当使用此解码器时,需确保搜索管理使用的声学打分器能够使用缓存的data 特征数据即矢量。 本类的属性: private Dat翻译 2015-01-17 10:02:06 · 551 阅读 · 0 评论 -
Decoder API
public class Decoder extends AbstractDecoder 原始解码器类。 @S4Integer(defaultValue= 100000) public final static String PROP_FEATURE_BLOCK_SIZE = "featureBlockSize"; private int featureBloc翻译 2015-01-17 10:00:49 · 464 阅读 · 0 评论 -
Token API
public class Token implements Scoreable 从上可以看出Token实现了Scoreable接口,可知此类对象是可以被打分器打分的。此类对象代表了再识别框架中的一个单独状态,一个Token(标记)的子类被用于表示不同的发射状态。注意所有的打分是基于log域的。 本类的属性: private static int curCount;为标记的当前计数。翻译 2015-01-17 10:02:52 · 983 阅读 · 0 评论 -
sphinx 4 AbstractDecoder
public abstract class AbstractDecoder implements ResultProducer, Configurable 一个抽象的解码器,此解码器实现了独立于被使用的(pull/push)的解码框架的全部方法的实现。 本类的属性: @S4Component(type =SearchManager.class) public fin翻译 2014-11-25 23:37:57 · 481 阅读 · 0 评论 -
公共注意项
1,在看方法名时我们应该注意方法名中是否为复数,即名词后是否加了s或者es,如果名词为复数,一般其返回的是能够存储多个值的对象,如数组,列表,map等,还有如果方法名是is某某开头的,一般如果输入是某某时返回的是真,否则为false。带dump的方法名表示的是一字符串的形式打印出所需的对象。 2,Java方法的访问控制: public protec原创 2014-09-25 23:11:26 · 323 阅读 · 0 评论 -
sphinx4的Microphone
public class Microphone extends BaseDataProcessor 本类的作用是,捕捉原始的语音信号,并对语音信号进行数字化处理,以便转换成数字信号。是front-end的第一输入可选输入信号处理单元之一。会把所有得到的数据放入列队缓存中。数据是以在前面为开始信号中间为doubledata数据后为结束信号的形式存储的。即此形式为一基本单元翻译 2014-09-26 22:36:09 · 810 阅读 · 0 评论 -
sphinx4的数据处理器的构建
一般具体的数据处理器都有两个构造方法,一个为空的,一个为非空。我们可以用非空的构造方法动态的创建数据处理器。用空的话,一般需要在文件中配置,并通过newproperties()方法来完成数据处理器的配置。数据处理器配置完后一般要调用initialize()方法来初始化数据处理器。这主要看类的具体实现所决定。原创 2014-09-26 22:27:44 · 824 阅读 · 0 评论 -
BaseDataProcessor API
public abstract class BaseDataProcessor extends ConfigurableAdapter implements DataProcessor 本抽象类实现了所有具体数据(信号)处理器的共同元素(部分)。如name(名字),processor(前一数据(信号)处理器),timer(计时器)。 本类的属性: private DataProcessor pre翻译 2015-06-06 16:45:54 · 799 阅读 · 0 评论