
kaldi
dzp443366
我叫邓志鹏,我现在开始会努力打理博客了!!!对读者负责就是对自己负责。
展开
-
kaldi数据准备部分,文件解释
若想用已识别的系统对你的数据解码,要重写 “数据部分”. 直接以thchs30项目为例里面或许会有cmvn.scp feats.scp reco2file_and_channel segments spk2utt text utt2spk wav.scp文件”text” :包含每段语音的文字意思 每行的第一项是录音编号(utterance-id),发音编号后面跟着的 是每段录音的原创 2017-01-05 16:41:27 · 4204 阅读 · 0 评论 -
kaldi
第一阶段:./cmd.sh . ./path.sh(设置执行路径以及命令脚本名字)ps:decode 解码 train 训练第二阶段:data preparation(数据准备阶段)执行 local/ thchs-30_data_prep.sh为了创建: wav.scp, utt2spk.scp, spk2utt.scp, text 还有words.txt phone.txt- 循环遍历t原创 2017-01-05 16:11:34 · 4249 阅读 · 0 评论 -
修改kaldi难题
1.解决录音自身的音素填写, 既是 data/phone.txt2.大量资料(基本的词汇因素) , 既是 dict/lexicon.txt 以及 dict/phone.txt原创 2017-01-05 18:46:35 · 656 阅读 · 0 评论 -
kaldi解释wav.trn
第一行中文 第二行拼音 第三行音素音素与中文相关 .原创 2017-01-10 15:35:59 · 1718 阅读 · 0 评论 -
临时kaldi 记载
1.final.mdl 声音模型文件 2. HCLG.fst 完全的fst 3. words.txt 发音词典 4. final_mat: 特征的LDA矩阵 5. word_boundary_phones.int: 词对齐时使用的音素分界信息原创 2017-01-12 11:47:16 · 541 阅读 · 0 评论 -
gentle里面的py文件
diff_align.py 排列工具forced_aligner.py 强制排列full_transcriber.py 转录kaldi_queue.py kaldi队列language_model.py 语言模型metasentence.py 元的句子(造句)multipass.py 多通道resample.py 重采样resources.py原创 2017-01-11 18:29:13 · 554 阅读 · 0 评论