语音识别-FunASR-docker部署-【超简洁步骤】

FunASR介绍

FunASR是一个开源的语音识别工具包,它旨在为开发者提供一个灵活且易于使用的平台,用于开发和部署自动语音识别(ASR)系统。FunASR支持多种语言,并提供了丰富的API接口,使得集成和定制化变得更加简单。这个项目通常包含一些最新的语音识别技术,如深度学习模型等,这些技术能够显著提高语音识别的准确率和效率。
源码地址https://github.com/modelscope/FunASR

部署

docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.12
mkdir -p /data/funasr-runtime-resources/models
docker run -p 10095:10095 -d --name=funasr --privileged=true -v /data/funasr-runtime-resources/models:/workspace/models registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.12

服务启动

# 进入funasr容器
docker exec -it funasr /bin/sh
cd FunASR/runtime

nohup bash run_server_2pass.sh \
  --download-model-dir /workspace/models \
  --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
  --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx  \
  --online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx  \
  --punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx \
  --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
  --itn-dir thuduj12/fst_itn_zh \
  --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

# 如果您想关闭ssl,增加参数:--certfile 0
# 如果您想使用SenseVoiceSmall模型、时间戳、nn热词模型进行部署,请设置--model-dir为对应模型:
#   iic/SenseVoiceSmall-onnx
#   damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx(时间戳)
#   damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx(nn热词)
# 如果您想在服务端加载热词,请在宿主机文件./funasr-runtime-resources/models/hotwords.txt配置热词(docker映射地址为/workspace/models/hotwords.txt):
#   每行一个热词,格式(热词 权重):阿里巴巴 20(注:热词理论上无限制,但为了兼顾性能和效果,建议热词长度不超过10,个数不超过1k,权重1~100)
# SenseVoiceSmall-onnx识别结果中“<|zh|><|NEUTRAL|><|Speech|> ”分别为对应的语种、情感、事件信息

快速测试-自动demo

在源码目录下的runtime/html5/static路径,直接在浏览器打开index.html

设置wss://127.0.0.1:10095

要关闭ssl加上--certfile 0参数就可以。

插入个人广告,不喜欢可以不用往下看了

搭建属于你自己的WEB堡垒机系统,只要有浏览器就可以远程控制你的电脑,协议支持rdp,vnc,ssh
官方地址:百百WEB堡垒机 http://bb.yun-api.com/

<think>好的,我现在要解决用户在使用funasr和sentencepiece时遇到的OSError: No such file or directory错误,具体是在加载'C:\Users\联想\.cache\modelscope\hub\models\iic\SenseVoiceSmall\chn_jpn_yue_eng_ko_spectok.bpe.model'这个文件时报错。首先,我需要了解这个问题的可能原因。 首先,用户提到的是Windows系统下的路径问题。因为路径中有中文用户名“联想”,这可能导致路径识别的问题。很多库在处理包含非ASCII字符的路径时可能会有问题,特别是像sentencepiece这样的底层库,可能对UTF-8路径支持不够好。所以,用户的缓存目录位于中文路径下,可能是问题的一个原因。 接下来,用户提供的错误信息明确指出文件未找到。这时候需要考虑几个可能性:文件确实不存在,路径被错误转义,或者权限问题。首先应该检查文件是否存在。用户需要确认C:\Users\联想\.cache\modelscope\hub\models\iic\SenseVoiceSmall\目录下是否存在这个模型文件。如果不存在,可能是下载不完整或者被误删,需要重新下载。 另外,Windows的路径分隔符是反斜杠\,但在Python字符串中,反斜杠是转义字符,如果没有正确处理,可能导致路径解析错误。例如,如果路径字符串中有未转义的反斜杠,可能会被Python解释为转义字符,从而导致路径错误。建议用户使用原始字符串或双反斜杠来避免这个问题。 此外,缓存路径的设置可能也是一个因素。用户可以通过设置环境变量MODELSCOPE_CACHE来更改模型下载的默认路径,将其改为一个不含中文或空格的路径,这样可以避免因路径中的特殊字符导致的文件访问问题。 还有,权限问题也可能导致无法访问文件。用户需要检查是否有足够的权限读取该目录和文件,特别是如果缓存目录位于系统保护的区域,如用户目录下,可能需要以管理员权限运行程序,或者调整文件夹权限。 如果文件确实存在且路径正确,还需要考虑sentencepiece在Windows上的兼容性问题。虽然sentencepiece官方支持Windows,但某些情况下可能需要额外的配置,比如安装C++构建工具或设置环境变量。用户可能需要确保所有依赖项都已正确安装。 总结可能的解决步骤:首先确认文件是否存在;检查路径中的转义和分隔符是否正确;更改缓存路径到英文目录;处理权限问题;确保依赖库正确安装。此外,还可以尝试更新库的版本,或者查看是否有相关的已知问题和解决方案。 最后,用户可能需要查看funasr和sentencepiece的文档,或者搜索类似问题的解决方案,比如社区中其他用户遇到相同错误的处理方法。如果有必要,可以联系库的维护者或在相关论坛提问,提供详细的错误信息和系统环境,以获得更具体的帮助。</think>### 解决Python中SentencePiece模型加载的“文件未找到”错误 在使用 `funasr` 和 `sentencepiece` 时,遇到 `OSError: No such file or directory` 错误通常与文件路径或依赖配置相关。以下是逐步解决方案: --- #### **1. 验证文件是否存在** 首先确认模型文件 `chn_jpn_yue_eng_ko_spectok.bpe.model` 是否实际存在于指定路径: ```python import os target_path = r'C:\Users\联想\.cache\modelscope\hub\models\iic\SenseVoiceSmall\chn_jpn_yue_eng_ko_spectok.bpe.model' print(os.path.exists(target_path)) # 输出应为 True ``` - 如果返回 `False`,说明文件未正确下载或路径错误,需重新下载模型或检查路径[^3]。 --- #### **2. 处理路径中的特殊字符** Windows 中文路径可能导致某些库无法解析,尤其是路径中包含 **中文用户名**(如 `联想`)时: - **临时方案**:将模型文件手动复制到纯英文路径(如 `D:\models\`)并更新代码中的路径。 - **长期方案**:修改缓存目录环境变量,避免中文路径: ```python import os os.environ['MODELSCOPE_CACHE'] = 'D:\\models\\' ``` --- #### **3. 检查路径分隔符转义** Windows 路径中的反斜杠 `\` 需在 Python 中正确转义: ```python # 使用原始字符串或双反斜杠 model_path = r'C:\Users\联想\.cache\modelscope\hub\...\chn_jpn_yue_eng_ko_spectok.bpe.model' # 或 model_path = 'C:\\Users\\联想\\.cache\\modelscope\\hub\\...\\chn_jpn_yue_eng_ko_spectok.bpe.model' ``` --- #### **4. 确保依赖库安装正确** `sentencepiece` 需要 C++ 运行时库支持: - 安装 Microsoft Visual C++ Redistributable(适用于 Python 3.8+ 的 [最新版本](https://aka.ms/vs/16/release/vc_redist.x64.exe))[^1]。 - 重新安装 `sentencepiece`: ```bash pip install --force-reinstall sentencepiece ``` --- #### **5. 检查文件权限** 确保当前用户对目标文件和目录有读取权限: - 右键点击 `.cache` 目录 → 属性 → 安全 → 编辑权限,添加当前用户为完全控制。 --- #### **6. 更新库版本** 确保 `funasr` 和 `modelscope` 为最新版本: ```bash pip install --upgrade funasr modelscope ``` --- ### 相关问题 1. **如何避免Python中因路径导致的文件加载错误?** - 使用 `pathlib` 库处理跨平台路径,或通过环境变量指定存储目录。 2. **sentencepiece在Windows安装失败怎么办?** - 安装 C++ 构建工具(如 Visual Studio Build Tools)后重试[^1]。 3. **如何强制重新下载模型文件?** - 删除缓存目录中的模型文件或调用 `Model.from_pretrained(force_download=True)`。 --- ### 引用 [^1]: 依赖库路径配置问题需确保运行时环境完整,参考 C++ 库配置方法。 : 路径错误常见于直接复制配置,需根据实际系统路径调整。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值