搭建一个语音转文字的简单全栈项目:基于 Streamlit + Whisper 的实践指南

最近我在一台阿里云轻量级服务器上成功部署了一个语音转文字(Speech-to-Text)的全栈 Demo,支持 Whisper 模型的语音转写,还可以选择 AI 自动纠错,并支持中文和英文语音测试。这篇文章将完整记录从环境配置、项目部署、模型下载到使用效果的全过程,帮助你快速上手。


本文承接上一篇文章,
开源音视频转文字工具:基于 Vosk 和 Whisper 的多语言语音识别项目

一、服务器与系统环境

  • 云服务器:阿里云 99 元/年的轻量服务器
  • 配置:2 核 CPU + 2G 内存 + 3Mbps 带宽
  • 系统版本:Alibaba Cloud Linux 3 (OpenAnolis Edition) x86_64
  • Python 环境:系统自带 Python 3.7.16,另安装 Python 3.10.14
  • 可视化面板:宝塔面板(免费版 9.5.0)

二、项目部署步骤

1. 克隆代码仓库

打开宝塔面板 → 终端,进入你希望存放项目的目录(如 /www/wwwroot):

cd /www/wwwroot
git clone https://gitee.com/phpervip/speech-to-text.git
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值