STT 项目安装与使用教程

裴麒琰

于 2024-09-15 09:03:36 发布

阅读量1.1k

点赞数 17

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_00210/article/details/142279334

STT 项目安装与使用教程

stt Voice Recognition to Text Tool / 一个离线运行的本地语音识别转文字服务，输出json、srt字幕带时间戳、纯文字格式项目地址: https://gitcode.com/gh_mirrors/stt/stt

1. 项目目录结构及介绍

STT 项目的目录结构如下：

stt/
├── docs/
├── models/
├── static/
├── stslib/
├── templates/
├── .gitignore
├── LICENSE
├── README.md
├── ffmpeg.7z
├── requirements.txt
├── run.bat
├── set.ini
├── start.py
├── test.py
├── testcuda.py
└── version.json

目录介绍

docs/: 存放项目文档文件。
models/: 存放语音识别模型文件。
static/: 存放静态资源文件。
stslib/: 存放项目依赖的库文件。
templates/: 存放项目的前端模板文件。
.gitignore: Git 忽略文件配置。
LICENSE: 项目许可证文件。
README.md: 项目说明文件。
ffmpeg.7z: 包含 FFmpeg 工具的压缩包。
requirements.txt: 项目依赖的 Python 包列表。
run.bat: Windows 下的启动脚本。
set.ini: 项目的配置文件。
start.py: 项目的启动文件。
test.py: 项目的测试文件。
testcuda.py: CUDA 测试文件。
version.json: 项目版本信息文件。

2. 项目启动文件介绍

start.py

start.py 是 STT 项目的启动文件。通过运行该文件，可以启动本地语音识别服务，并自动打开浏览器窗口进行操作。

使用方法

在项目根目录下运行以下命令：

python start.py

运行后，浏览器会自动打开一个本地页面，用户可以在页面上传音频或视频文件进行语音识别。

3. 项目配置文件介绍

set.ini

set.ini 是 STT 项目的配置文件，用于配置项目的运行参数。

配置项介绍

devtype: 指定使用的设备类型，可选值为 cpu 或 cuda。如果使用 NVIDIA GPU 并配置了 CUDA 环境，可以将此项设置为 cuda 以启用 CUDA 加速。

示例配置

[DEFAULT]
devtype = cpu

如果使用 CUDA 加速，配置如下：

[DEFAULT]
devtype = cuda

注意事项

如果没有 NVIDIA GPU 或未配置 CUDA 环境，请保持 devtype 为 cpu，否则可能导致内存耗尽或程序崩溃。
如果使用 CUDA 加速，请确保已正确安装并配置 CUDA 和 cuDNN。

stt Voice Recognition to Text Tool / 一个离线运行的本地语音识别转文字服务，输出json、srt字幕带时间戳、纯文字格式项目地址: https://gitcode.com/gh_mirrors/stt/stt

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

裴麒琰 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。