内容摘选自: https://github.com/modelscope/FunASR/blob/main/runtime/docs/SDK_advanced_guide_offline_zh.md
FunASR
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。
此文章补充了一些内容,让小白更容易上手
注意:
1. certfile ssl证书问题,不了解的话就关闭即可
2. 关闭FunASR服务(有守护线程杀完会自动启动,如果想修改启动命令的话就kill和nohup全部编辑好在贴进去执行)
镜像启动
通过下述命令拉取并启动FunASR软件包的docker镜像:
# 拉取镜像
sudo docker pull
registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.6
# 当前文件路径下创建目录 用于挂载模型
mkdir -p ./funasr-runtime-resources/models
# 启动镜像
sudo docker run -p 10095:10095 -it --privileged=true
-v $PWD/funasr-runtime-resources/models:/workspace/models
registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.6
服务端启动
docker启动之后,进入到docker里边
docker exec -it <imageid> /bin/bash
启动funasr-wss-server
服务程序(有16K 和 8K模型可选择):
cd FunASR/runtime
nohup bash run_server.sh
--download-model-dir /workspace/models
--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx
--model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx
--punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst
--itn-dir thuduj12/fst_itn_zh
--hotword /workspace/models/hotwords.txt > log.txt 2>&1 &
查看打印日志
tail -f log.txt
- 如果您想关闭SSL,增加参数:
--certfile 0
- 如果您想使用SenseVoiceSmall模型、时间戳、nn热词模型进行部署,请设置
--model-dir
为对应模型:iic/SenseVoiceSmall-onnx
damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx
(时间戳)damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx
(nn热词)
- 如果您想在服务端加载热词,请在宿主机文件
./funasr-