语音识别：docker部署FunASR以及springboot集成funasr

最新推荐文章于 2025-03-03 16:01:00 发布

m0_74824687

最新推荐文章于 2025-03-03 16:01:00 发布

阅读量1.2k

点赞数 9

分类专栏：面试学习路线阿里巴巴文章标签：语音识别 docker spring boot

本文链接：https://blog.youkuaiyun.com/m0_74824687/article/details/145510156

版权

内容摘选自: https://github.com/modelscope/FunASR/blob/main/runtime/docs/SDK_advanced_guide_offline_zh.md

FunASR

FunASR是一个基础语音识别工具包，提供多种功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程，支持预训练好的模型的推理与微调。

此文章补充了一些内容，让小白更容易上手

注意：
	1.	certfile ssl证书问题，不了解的话就关闭即可
	2.	关闭FunASR服务（有守护线程杀完会自动启动，如果想修改启动命令的话就kill和nohup全部编辑好在贴进去执行）

镜像启动

通过下述命令拉取并启动FunASR软件包的docker镜像：

# 拉取镜像
sudo docker pull 
registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.6

# 当前文件路径下创建目录 用于挂载模型
mkdir -p ./funasr-runtime-resources/models

# 启动镜像
sudo docker run -p 10095:10095 -it --privileged=true 
-v $PWD/funasr-runtime-resources/models:/workspace/models 
registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.6

服务端启动

docker启动之后，进入到docker里边

docker exec -it <imageid> /bin/bash

启动funasr-wss-server服务程序（有16K 和 8K模型可选择）：

cd FunASR/runtime
nohup bash run_server.sh 
--download-model-dir /workspace/models 
--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx 
--model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx 
--punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx 
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst 
--itn-dir thuduj12/fst_itn_zh 
--hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

查看打印日志

tail -f log.txt

如果您想关闭SSL，增加参数：--certfile 0
如果您想使用SenseVoiceSmall模型、时间戳、nn热词模型进行部署，请设置--model-dir为对应模型：
- iic/SenseVoiceSmall-onnx
- damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx（时间戳）
- damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx（nn热词）
如果您想在服务端加载热词，请在宿主机文件./funasr-

最低0.47元/天解锁文章