项目ASR

百态老人

于 2024-11-25 09:43:04 发布

阅读量729

点赞数 11

文章标签：笔记

本文链接：https://blog.youkuaiyun.com/weixin_41429382/article/details/143769322

版权

ASR（自动语音识别）是一种将人的语音转换为文本的技术，涉及声学、信号处理、信息论等多个学科。以下是一些与 ASR 相关的项目介绍：

开源 ASR 服务器 vosk：支持十九种语言，可在移动设备上脱机工作，如 Raspberry Pi、Android、iOS。使用简单，可通过 pip3 install vosk 安装，每种语言的手提式模型只有 50Mb，还提供流媒体 API 和用于不同编程语言的包装器，可快速重新配置词汇以实现最佳准确性，支持说话人识别。
腾讯云语音识别 ASR：为开发人员提供语音转换文字服务，经内部大量项目认可，也在外部众多业务场景成功落实，具有识别成功率高、连接方便快捷、特性可靠等特点。对外开放即时语音识别、一句话识别和录音文档识别三种服务方式。
asr_evaluation：Python 工具包，专为准确评估自动语音识别假设而生，可轻松计算词错误率、词识别率和句子错误率，依托于 editdistance 库高效计算序列间的编辑距离，在语音识别系统开发、训练调优及产品上线后的持续监控中发挥重要作用。
Python ASR：由 Ry Takashima 开发，基于 Google Speech Recognition API，提供简洁接口实现高效语音转文字服务，支持多种音频文件格式和实时录音识别，多语言支持，内置错误处理机制和性能优化，可用于智能助手、教育应用、无障碍技术和数据分析等场景。
ASR 长期项目：目标是不断改进和提升 ASR 系统性能，由语音科学家、工程师和研究人员组成的团队负责，对语音识别模型、语音信号处理、语言模型等方面进行研究和优化，涉及实际应用和系统集成，将 ASR 技术应用于语音助手、智能家居、语音翻译等领域。
kaldi 入门项目：搭建中文 ASR，包括构建项目基本结构，准备相关配置，链接 steps 和 utils，修改 path.sh 指定 kaldi 位置等。
TensorFlow 项目实战开发教程：使用 TensorFlow 构建自动语音识别系统，包括准备工作、数据集准备、构建模型、模型训练和语音识别示例等步骤。
ASR 项目实战-任务队列在文件转写特性中的应用：采用基于 DB 实现任务队列的方案，满足语音识别文件转写场景下对任务队列的要求，如允许多个生产服务和消费服务操作、具备可靠性、满足业务要求的读写效率等。
ASR