自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

u012361418的博客

算法工程师000001 优快云认证博客专家优快云认证企业博客

码龄12年

60: 原创

4万+: 周排名

200万+: 总排名

30万+: 访问

: 等级

3830: 积分

204: 粉丝

95: 获赞

50: 评论

300: 收藏

私信

关注

热门文章

分类专栏

程序员面试 47篇
c++ 18篇
android 6篇
虚拟视点 20篇
人脸识别 3篇
图像处理 3篇
opencl 11篇
机器学习 1篇
计算机架构 2篇
数据结构 4篇
opengl 1篇
数学知识
openfst 1篇
learn python 17篇
kaldi 13篇
tool 4篇
tensorflow 3篇
ctc 4篇
asr 7篇

最新评论

语音识别系列2--基于WFST解码器
算法工程师000001: 声学模型的分类结果有没有检查一下？看看概率分布对不对？
语音识别系列2--基于WFST解码器
魔法学徒q: 大佬您好，因为看您分享过几篇语音识别中使用wfst的论文，想到您应该对wfst比较了解。目前我用wenet做训练识别一个官方以外的数据集时，我是使用该数据集语料库和librispeech的lexicon做的lm解码，但是我发现解码结果是把所有音频都识别成了一个单词yeah。请问我是需要重新构建lexicon，还是可能其他地方出错了呢？
语音识别系列3--KALDI解码器（SimpleDecoder）
魔法学徒q: 大佬您好，目前我用wenet做训练识别一个官方以外的数据集时，我是使用该数据集语料库和librispeech的lexicon做的lm解码，但是我发现解码结果是把所有音频都识别成了一个单词yeah。请问我是需要重新构建lexicon，还是可能其他地方出错了呢？
虚拟视点图像的生成001
lber_: 运行窗口好像是作者用来显示信息的，在运行窗口随便输入一些什么，enter继续运行应该就会跑出图了
语音识别系列1--语音识别CTC之数据准备
koko1111111: 你好我看要传入三个参数，可以问一下这三个参数分别传入的是什么内容吗？本人是初学者，不太了解，麻烦解答一下，谢谢！

最新文章

asr

关注

关注数：文章数：7 文章阅读量：19849 文章收藏量：84

作者: 算法工程师000001

生命不息，奋斗不止。

展开