ASR(自动语音识别)是一种将人的语音转换为文本的技术,涉及声学、信号处理、信息论等多个学科。以下是一些与 ASR 相关的项目介绍:
- 开源 ASR 服务器 vosk:支持十九种语言,可在移动设备上脱机工作,如 Raspberry Pi、Android、iOS。使用简单,可通过 pip3 install vosk 安装,每种语言的手提式模型只有 50Mb,还提供流媒体 API 和用于不同编程语言的包装器,可快速重新配置词汇以实现最佳准确性,支持说话人识别。
- 腾讯云语音识别 ASR:为开发人员提供语音转换文字服务,经内部大量项目认可,也在外部众多业务场景成功落实,具有识别成功率高、连接方便快捷、特性可靠等特点。对外开放即时语音识别、一句话识别和录音文档识别三种服务方式。
- asr_evaluation:Python 工具包,专为准确评估自动语音识别假设而生,可轻松计算词错误率、词识别率和句子错误率,依托于 editdistance 库高效计算序列间的编辑距离,在语音识别系统开发、训练调优及产品上线后的持续监控中发挥重要作用。
- Python ASR:由 Ry Takashima 开发,基于 Google Speech Recognition API,提供简洁接口实现高效语音转文字服务,支持多种音频文件格式和实时录音识别,多语言支持,内置错误处理机制和性能优化,可用于智能助手、教育应用、无障碍技术和数据分析等场景。
- ASR 长期项目:目标是不断改进和提升 ASR 系统性能,由语音科学家、工程师和研究人员组成的团队负责,对语音识别模型、语音信号处理、语言模型等方面进行研究和优化,涉及实际应用和系统集成,将 ASR 技术应用于语音助手、智能家居、语音翻译等领域。
- kaldi 入门项目:搭建中文 ASR,包括构建项目基本结构,准备相关配置,链接 steps 和 utils,修改 path.sh 指定 kaldi 位置等。
- TensorFlow 项目实战开发教程:使用 TensorFlow 构建自动语音识别系统,包括准备工作、数据集准备、构建模型、模型训练和语音识别示例等步骤。
- ASR 项目实战-任务队列在文件转写特性中的应用:采用基于 DB 实现任务队列的方案,满足语音识别文件转写场景下对任务队列的要求,如允许多个生产服务和消费服务操作、具备可靠性、满足业务要求的读写效率等。
- ASR