
Sphinx-4 API
文章平均质量分 53
eternity668
行天之路
展开
-
LogMath
public final class LogMath implements Configurable, Serializablelog(a - b) = log(a) + log(1- exp(log(b)-log(a)))log(a + b) = log(a) +log(1 + exp(log(b)- log(a)))作用:首先本类是一个compone翻译 2014-08-05 22:08:49 · 626 阅读 · 0 评论 -
StatisticsVariable
public class StatisticsVariable代表了一个被命名的值。一个统计变量能够被用来跟踪数据,它允许在任何时候被查看和打印输出(输出)。统计数字被保留在一个数据池中,并且以场景来分组。统计数据能够被当做一个整体打印出或被创建所输出。本类的属性: private static final Mappool = new HashMap();统计数据池用来存翻译 2014-08-05 22:04:51 · 475 阅读 · 0 评论 -
Complex
public class Complex本类实现了复数类型,及复数域的基本算法。本类的属性: private double real;一个复数对象的实部private double imaginary;复数对象的虚部即一个复数数字的虚部。本类的构造方法:public Complex();构造一个实部和虚部都是0的复数对象(数字)。public Comple翻译 2014-08-07 22:40:26 · 1023 阅读 · 0 评论 -
GState
本类方法:private Set getStartingContexts();得到此节点的开始场景集,开始场景为一个长度等于最大的右场景尺寸的unit[]集。如果此节点为空节点,则开始场景是此节点直接后续节点的所有开始场景的集合,否则的话从节点字的每一发音来创建开始场景。返回的是startingContexts属性。private UnitContext getStartingContex翻译 2014-09-20 11:50:18 · 776 阅读 · 0 评论 -
混淆网络和词格或者字格
一个字格是一个有向无环图。它有一个单独的起点和标记了一个字和其权重的边(为单独边)。不像强制要求每一条路径都必须通过所有节点的混淆网络。字格的路径是不要求每一条都通过其所有节点的。字格能够表示任何的有限的字符串集,尽管这一般使得字格低于混淆网络的空间效率。不管怎样,一般一个字格能够表示以多项式空间的指数数量的句子。以下为字格的一个实例表示了组合字的可能的分解:翻译 2014-09-20 11:46:15 · 1504 阅读 · 0 评论 -
Shohix3声学模型的训
1训练的基本步骤:...32模拟未绑定状态的场景依赖音素的注意事项:...43 你所需准备的数据...44,训练之前需检查的项...56 当你有一个非常小的闭合的词汇表(字典)(50—60字):...67 “base”集合和高阶特征向量...68 特征流(featuresstreams)...69训练连续模型...710 创建模型定义翻译 2014-08-14 23:10:41 · 2141 阅读 · 0 评论 -
sphinx4的数据处理器的构建
一般具体的数据处理器都有两个构造方法,一个为空的,一个为非空。我们可以用非空的构造方法动态的创建数据处理器。用空的话,一般需要在文件中配置,并通过newproperties()方法来完成数据处理器的配置。数据处理器配置完后一般要调用initialize()方法来初始化数据处理器。这主要看类的具体实现所决定。原创 2014-09-26 22:27:44 · 824 阅读 · 0 评论 -
sphinx4的Microphone
public class Microphoneextends BaseDataProcessor本类的作用是,捕捉原始的语音信号,并对语音信号进行数字化处理,以便转换成数字信号。是front-end的第一输入可选输入信号处理单元之一。会把所有得到的数据放入列队缓存中。数据是以在前面为开始信号中间为doubledata数据后为结束信号的形式存储的。即此形式为一基本单元翻译 2014-09-26 22:36:09 · 810 阅读 · 0 评论 -
sphinx4 FrontEnd
public class FrontEnd extends BaseDataProcessor在sphinx-4系统中,系统把整个前端处理当作一个前端类,此类把所有的信号处理流程都集合起来,只要通过此类我们就能获得整个前端的输出。通过对此类的操作我们能够修改信号处理的流程。就可得到我们所需的处理的流程和前端处理的结果。作用: FrontEnd(前端)是一个component(confi翻译 2014-10-13 22:03:21 · 893 阅读 · 0 评论 -
sphinx 4 AbstractDecoder
public abstract class AbstractDecoderimplements ResultProducer, Configurable一个抽象的解码器,此解码器实现了独立于被使用的(pull/push)的解码框架的全部方法的实现。本类的属性: @S4Component(type =SearchManager.class) public fin翻译 2014-11-25 23:37:57 · 481 阅读 · 0 评论 -
Recognizer API
public class Recognizer implements Configurable, ResultProducer此为识别了设置了相应的状态,以防止在某些方法在其必要的条件之前被调用。使用了异常处理。靠继承RuntimeException来实现新的异常类。Sphinx4识别器。此是sphinx4的主要的入口。一个识别器的典型使用如下:public void recogn翻译 2015-01-11 12:41:05 · 627 阅读 · 0 评论 -
Result API
public class Result 提供识别的结果。结果可以是局部的,也可以是最终的。一个result结果在它是最终结果之前不应该被修改。注意一个result结果也许不会保护所有可能的信息。The following methods arenot yet defined but should be: * * public Result getDAG(intcompress翻译 2015-01-11 12:43:08 · 1590 阅读 · 0 评论 -
Decoder API
public class Decoder extends AbstractDecoder原始解码器类。 @S4Integer(defaultValue= 100000) public final static String PROP_FEATURE_BLOCK_SIZE ="featureBlockSize";private int featureBloc翻译 2015-01-17 10:00:49 · 464 阅读 · 0 评论 -
FrameDecoder API
public class FrameDecoder extends AbstractDecoderimplements DataProcessor一个解码器,此解码器没有使用s4常用的pull模式。而是每次调用decode()方法仅仅处理一个单独的特征帧。当使用此解码器时,需确保搜索管理使用的声学打分器能够使用缓存的data 特征数据即矢量。本类的属性: private Dat翻译 2015-01-17 10:02:06 · 551 阅读 · 0 评论 -
Token API
public class Token implements Scoreable从上可以看出Token实现了Scoreable接口,可知此类对象是可以被打分器打分的。此类对象代表了再识别框架中的一个单独状态,一个Token(标记)的子类被用于表示不同的发射状态。注意所有的打分是基于log域的。本类的属性:private static int curCount;为标记的当前计数。翻译 2015-01-17 10:02:52 · 983 阅读 · 0 评论 -
NGramProbability API
class NGramProbability代表一个字的id(字在一个N-gram中的位置)。一个N-Gram 概率id。本类的属性:private final int which; which follower of the first word is this NGram。哪一个跟随第一个的是此NGram。private final int wordID;在一个N-gram中的特定的字翻译 2015-06-16 21:11:01 · 409 阅读 · 0 评论 -
LanguageModel API 语言模型
public interface LanguageModel extends Configurable代表了对言一个N(N-Gram)元语模型的一般接口。所有的概率都在log域的。本接口的属性:@S4String(defaultValue = ".")public final static String PROP_LOCATION = "location";属性用来确定语言模型的位置。@翻译 2015-06-16 21:14:23 · 492 阅读 · 0 评论 -
UnigramProbability API
class UnigramProbability代表了一个概率,一个回退(blackoff)(权重)概率,以及bigram 二元语法的第一项的位置。the location of the first bigram entry。本类的属性:private final int wordID;字idprivate float logProbability;概率private float log翻译 2015-06-16 21:11:54 · 485 阅读 · 0 评论 -
Grammar API
public abstract class Grammar implements Configurable, GrammarInterface本类实现了创建语法的语法接口。一个语法类内部是当做一个语法节点和语法弧组成的图所表示的。通过调用getInitialNode()方法将会获得在语法图中的第一个节点。为了遍历整个语法图,可以通过调用语法节点的getSuccessors方法,此方法会返回的是一翻译 2015-06-16 21:05:29 · 565 阅读 · 0 评论 -
LMGrammar API
public class LMGrammar extends Grammar定义了一个简单的语法基于一个语言模型。本类对每个字都产生一个语法节点。本LM语法能够处理多达1000字的unigram and bigram grammars 单元语法和2元语法。注意所有的概率都是log域的。本类的属性:@S4Component(type = LanguageModel.class)public翻译 2015-06-16 21:06:45 · 395 阅读 · 0 评论 -
BinaryLoader API
public class BinaryLoader读取由cmu SphinxBase sphinx_lm_convert 产生的一个二进制 NGram 语言模型文件(”DMP 文件”)。注意所有在语法中的概率都是以log域的形式存储的,在语言模型文件中的语言概率是以log 10为底的形式存储的。它们被转换为logmath的底。本类的属性:private static final String翻译 2015-06-16 21:07:48 · 662 阅读 · 0 评论 -
LargeNGramModel API 语言模型
public class LargeNGramModel implements LanguageModel, BackoffLanguageModel使用一个二进制NGram(n元)语言模型文件(”DMP 文件”)的语言模型。此语言模型是通过SphinxBase sphinx_lm_convert产生的。本类的属性:@S4String(mandatory = false)public st翻译 2015-06-16 21:09:24 · 883 阅读 · 0 评论 -
BackoffLanguageModel API
public interface BackoffLanguageModel extends LanguageModel代表使用后向(回退)方法来估计不可见概率的一个N-Gram 语言模型的一般接口。后向深度Backoff depth是非常重要的在搜索空间的优化中,例如:它在LexTreeLinguist中用来collapse states(损毁状态),那些状态仅有unigram backoff单翻译 2015-06-16 21:13:36 · 679 阅读 · 0 评论 -
ProbDepth API
public class ProbDepth此类为从BackoffLanguageModel返回的结果。本类的属性:public float probability;public int depth;本类的构造方法:public ProbDepth(float probability, int depth);构造方法。对属性进行设置了。public class ProbDepth {翻译 2015-06-16 21:15:02 · 439 阅读 · 0 评论 -
LatticeGrammar API
public class LatticeGrammar extends Grammar一个语法从一个lattice所创建的。此能够用于一个2次的或者其后的多传播识别的传播。本类的属性:public Lattice lattice;为网格。或字格。本类的构造方法:public LatticeGrammar(Lattice lattice, boolean showGrammar, bool翻译 2015-06-16 21:06:07 · 344 阅读 · 0 评论 -
NGramBuffer API
class NGramBuffer实现了一个保护NGrams的缓存。它假定每一个n-gram项的前两个字节是n-gram的id。本类的属性:private final byte[] buffer;ngrams的字节数组,存储ngrams的缓存。private final int numberNGrams;N-Gram的个数即数目。private int position;private翻译 2015-06-16 21:10:16 · 374 阅读 · 0 评论 -
TokenSearchManager API
abstract public class TokenSearchManagerimplements SearchManager抽象类,实现了SearchManager接口。本类的属性:@S4Boolean(defaultValue = true)public final static String PROP_BUILD_WORD_LATTICE ="bui翻译 2015-05-31 23:34:51 · 455 阅读 · 0 评论 -
ActiveList API
public interface ActiveList extends Iterable一个被当做以排序的列表的活动列表。此列表可以通过迭代的方法来访问其的元素。本接口的属性:@S4Integer(defaultValue= 2000)public final static String PROP_ABSOLUTE_BEAM_WIDTH ="absoluteBeamWi翻译 2015-05-31 23:34:16 · 477 阅读 · 0 评论 -
ActiveListManager API
public interface ActiveListManager extends Configurable一个被当做以排序的列表的活动列表。@S4Integer(defaultValue= 2000)public final static String PROP_ABSOLUTE_WORD_BEAM_WIDTH ="absoluteWordBeamWidth";属性确定翻译 2015-05-31 23:37:00 · 497 阅读 · 0 评论 -
WordPruningBreadthFirstSearchManager API
public class WordPruningBreadthFirstSearchManagerextends TokenSearchManager提供了一个宽度优先搜索。为了执行识别,应用程序在识别开始前需调用initialize初始化,然后在重复调用recognize方法,直到result.isfinal()返回为true。一旦一个final结果已经获得,则stoprecogni翻译 2015-05-31 23:37:00 · 464 阅读 · 0 评论 -
SimpleBreadthFirstSearchManager API
public class SimpleBreadthFirstSearchManager extends TokenSearchManager提供深度优先搜索。为了进行识别处理,应用程序在进行识别处理前需调用initialize即进行初始化,然后重复的调用recognize方法,直到Result.isFinal()返回为true为止。一旦得到了一个最终的结果,terminate方法将被翻译 2015-05-31 23:37:50 · 400 阅读 · 0 评论 -
Preemphasizer API 及预加重
原创 2015-06-01 20:16:23 · 529 阅读 · 0 评论 -
EntryPointTable API
class EntryPointTable进入指针表,此被使用来管理在lex树中的进入指针集合。、本类的属性: private final Map entryPoints;存储单元为发音的第一个单元与进入指针对的map。本类的构造方法:EntryPointTable(Collection entryPointCollection) ;给定所有可能的进入指针单元集来创建进入指针表。输入e翻译 2015-06-22 15:46:27 · 303 阅读 · 0 评论 -
EntryPoint API
class EntryPoint管理一个单独的进入指针。此为进入hmm树中的节点的指针。本类的属性: final Unit baseUnit;目标单元一般为发音的第一个单元。 final Node baseNode; 基本节点 ,为目标节点final Map unitToEntryPointMap;存储目标单元和目标节点。List singleUnitWords;单独单元字集i翻译 2015-06-22 15:47:25 · 353 阅读 · 0 评论 -
HMMNode API
class HMMNode extends UnitNode表示了在hmm树中的一个代表hmm的节点。由于在大词汇量的识别中,存在节点数十分的巨大,因此尽可能的节省空间是很重要的。当建立hmm节点时,我们把右场景保持在一个集合中以便很容易的实现对副本进行剪枝。一旦树被完全建立起来了,我们就不在需要把右场景当做一个集合来管理,一个简单的数组就可行了。Freeze方法是把集合转换成单元数组。Rc右翻译 2015-06-22 15:48:04 · 345 阅读 · 0 评论 -
HMMTree API
class HMMTree以一个lex树的形式来表示词汇表。在树中的节点表示字(字节点)或单元(hmm节点)。Hmm节点也许会被共享。本类的属性:private final HMMPool hmmPool;hmm和单元池private InitialWordNode initialNode;树的初始节点 private Dictionary dictionary;包含发音的字典翻译 2015-06-22 15:48:48 · 350 阅读 · 0 评论 -
WordNode API
class WordNode extends Node此节点表示在hmm树中的一个字。private final Pronunciation pronunciation;表示字的发音private final boolean isFinal;是否为终止状态,即此字节表示字是否为句的结束字。本类的构造方法: WordNode(Pronunciation pronunciation, flo翻译 2015-06-22 15:49:26 · 699 阅读 · 0 评论 -
EndNode API
class EndNode extends UnitNode本类的属性:final Unit baseUnit;此节点的基本单元final Unit leftContext;当做左场景的单元final Integer key;关键字本类的构造方法:EndNode(Unit baseUnit, Unit lc, float probablilty);创建节点。输入probablilty为翻译 2015-06-22 15:50:02 · 563 阅读 · 0 评论 -
InitialWordNode API
class InitialWordNode extends WordNode此类表示在搜索空间中的初始字。它被特别对待因为我们需要保持跟踪其场景。场景是内嵌在父节点中的。The context is embodied in the parent node本类的属性:final HMMNode parent;表示父节点的hmm节点。本类的构造方法: InitialWordNode(Pron翻译 2015-06-22 15:50:40 · 508 阅读 · 0 评论 -
Node API
class Node表示节点本类的属性:private static int nodeCount;表示节点数在树中此类节点的个数。即此节点类对象的实例个数。private static int successorCount;后续数,此节点类的对象的后续节点数。private static final Map wordNodeMap = new HashMap();/* 以下个属性在树的翻译 2015-06-22 15:51:22 · 479 阅读 · 0 评论