Windows部署SenseVoice保姆级教程

一、系统环境

操作系统:Windows Server 2019 64位操作系统

CUDA版本:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Tue_Aug_15_22:09:35_Pacific_Daylight_Time_2023
Cuda compilation tools, release 12.2, V12.2.140
Build cuda_12.2.r12.2/compiler.33191640_0

二、部署流程

1、Anaconda安装

下载地址:Anaconda Installers and Packages

下载好后,双击进行安装。安装地址为:D:\ProgramData\anaconda3

2、Git安装

下载地址:Git - Downloading Package

下载好后,双击进行安装。

3、项目下载

(1)在D盘创建Project文件夹用于存放项目源码,打开Project文件夹地址栏输入cmd进入控制台

cd /d D:\Project
git clone --recursive https://github.com/FunAudioLLM/SenseVoice.git

(2)执行git clone命令下载源码

源码下载完成目录结构如下:

4、配置CUDA环境变量

安装AI框架CUDA和cuDNN的安装(如果已安装,可跳过):

(1)CUDA下载地址(需下载显卡支持的版本,且大于等于V11.8):https://developer.nvidia.com/cuda-toolkit-archive

//检查显卡支持的最大CUDA版本命令行指令
nvidia-smi

安装地址为:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2

(2)cuDNN下载地址(需下载CUDA支持的版本,且大于等于V8.5):https://developer.nvidia.com/rdp/cudnn-archive

//检查是否安装CUDA成功的命令行指令
nvcc -V

(3)配置CUDA环境变量

系统环境参数path新增

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2\bin

5、修改SenseVoice依赖版本

(1)打开D:\Project\SenseVoice目录找到requirements.txt文件编辑器打开修改成如下内容

--extra-index-url https://download.pytorch.org/whl/cu121
torch==2.5.1+cu121
torchvision==0.20.1+cu121
torchaudio==2.5.1+cu121
modelscope
huggingface
huggingface_hub
funasr>=1.1.3
numpy<=1.26.4
gradio
fastapi>=0.111.1

6、创建conda虚拟环境并下载依赖

(1)打开D:\Project\SenseVoice目录地址栏输入cmd进入控制台执行如下命令创建环境

# 创建 Conda 环境
conda create -n sensevoice python=3.8
conda activate sensevoice
# 安装依赖
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

等待环境安装完成

7、下载模型

(1)在D:\Project\SenseVoice目录下创建iic目录

(2)打开D:\Project\SenseVoice\iic目录地址栏输入cmd进入控制台执行如下命令下载模型

git clone https://www.modelscope.cn/iic/SenseVoiceSmall.git
git clone https://www.modelscope.cn/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch.git

目录结构如下:

(3)将SenseVoiceSmall与speech_fsmn_vad_zh-cn-16k-common-pytorch目录下的example目录拷贝到D:\Project\SenseVoice目录下

example目录下的内容如下:

(4)在D:\Project\SenseVoice目录下找到webui.py编辑器打开注释掉不需要的音频文件保存

8、使用webui部署并支持远程访问

(1)打开D:\Project\SenseVoice目录地址栏输入cmd进入控制台执行如下命令启动

conda activate sensevoice
python webui.py

启动成功示例图:

访问地址:http://127.0.0.1:7860/

(2)配置环境变量支持远程访问

变量名:GRADIO_SERVER_NAME 值:0.0.0.0

变量名:GRADIO_SERVER_PORT  值:7860

9、测试语言识别

(1)上传音频文件点击start

PS:上传的如果是mp3格式页面出现error需要安装FFmpeg安装步骤如下:

(1)打开FFmpeg官网:Download FFmpeg

 (2)在D盘创建ffmpeg文件夹将下载的压缩包解压

(3)配置ffmpeg环境变量path增加D:\ffmpeg\ffmpeg-7.1-full_build\bin

(4)cmd打开控制台执行ffmpeg -version查看ffmpeg版本,如果可以看到打印出 ffmpeg的版本,则表示ffmpeg安装成功了,反之则表示安装失败

识别语音成功示例图:

### 如何在本地环境中部署和使用SenseVoice模型 #### 创建虚拟环境并激活 为了确保项目的独立性和稳定性,在开始之前建议创建一个新的Python虚拟环境。这一步骤可以防止不同项目之间的包冲突。 ```bash python3 -m venv sensevoice-env source sensevoice-env/bin/activate # Linux 或 macOS sensevoice-env\Scripts\activate # Windows ``` #### 获取源码仓库 接着,从GitHub上克隆官方维护的`SenseVoice`项目库到本地机器中[^1]。 ```bash git clone https://github.com/FunAudioLLM/SenseVoice.git cd SenseVoice ``` #### 安装必要的依赖项 进入项目目录后,按照文档说明安装所需的第三方库和其他资源文件。通常情况下,这些信息会被记录在一个名为`requirements.txt`的文本文件内[^2]。 ```bash pip install -r requirements.txt ``` 对于更全面的支持,还可以考虑安装带有额外功能扩展版本的Xinference工具集来辅助管理和服务化部署: ```bash %pip install --upgrade --quiet "xinference[all]" ``` #### 启动Web界面服务 完成上述准备工作之后,可以通过运行特定命令启动内置的Web用户接口(WebUI),以便于后续的操作管理和交互测试。 ```bash python app.py ``` 此时应该可以在浏览器地址栏输入类似于`http://localhost:7860`这样的URL访问图形化的操作面板。 #### 使用模型进行推理 一旦成功搭建好整个平台架构,就可以利用训练好的预置模型执行各种自然语言处理任务了。具体方法取决于所选API端点以及参数配置方式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值