
ASR
mengzhongsuiyi521
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
语音识别之预处理==>音频格式转换
语音的声学模型我们一般使用 单声道 16bit 16000采样率的wav或pcm音频(pcm为wav去掉头信息后的部分) 两种方案: 一、sox转换 sox -t raw -c 1 -e signed-integer -b 16 -r 16000 INPUT_FILE OUTPUT_FILE 二、ffmpeg转换 ffmpeg -y -i INPUT_FILE -af 'pa...原创 2019-01-10 19:45:18 · 1101 阅读 · 0 评论 -
语音识别之预处理==>文本处理(去^M符号、去BOM头、格式转换等)
1、去掉^M符号 vi编辑下使用ctrl V + ctrl M打出^M符号,然后替换为空即可。(window下^M\n结尾) %s/^M//g 2、去掉UTF-8文件BOM头 vim下:使用命令 :set nobomb 保存即可 3、格式转换,使用iconv工具: iconv -f GB18030 -t UTF-8 shanghaihua_corpus.trans -o sh...原创 2019-01-10 19:49:44 · 449 阅读 · 0 评论