ChatTTS-Enhanced 项目安装与配置指南
ChatTTS-Enhanced 项目地址: https://gitcode.com/gh_mirrors/ch/ChatTTS-Enhanced
1. 项目基础介绍
ChatTTS-Enhanced 是一个开源项目,旨在增强和改善 Chat-TTS 的音质,解决生成过程中的噪音问题。它支持多种文本文件格式的批量处理,可以对长文本进行切割处理,支持中英混读,并允许自定义切割长度。此外,它还能导出 SRT 文件,并支持调节语速、停顿、笑声和口语化程度等参数。项目支持导入 ChatTTS Speaker 音色,并能够储存音色配置和选项配置,方便用户管理。
项目主要使用的编程语言是 Python。
2. 项目使用的关键技术和框架
- PyTorch: 用于深度学习模型的框架。
- torchaudio: PyTorch 的音频处理库。
- WeTextProcessing: 用于文本处理的库。
- resemble-enhance: 用于音质增强的库。
3. 项目安装和配置的准备工作
在开始安装之前,请确保您的系统中已经安装了以下环境:
- Python 3.10
- Conda(推荐使用 Anaconda)
- Git
安装步骤
步骤1:克隆项目
首先,您需要从 GitHub 克隆项目到本地:
git clone https://github.com/CCmahua/ChatTTS-Enhanced.git
cd ChatTTS-Enhanced
步骤2:创建并激活虚拟环境
创建一个名为 Dlab
的虚拟环境,并激活它:
conda create -n Dlab python=3.10
conda activate Dlab
步骤3:安装依赖
根据操作系统选择相应的命令来安装 PyTorch 及其相关依赖:
对于 Windows 用户:
conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install resemble-enhance --no-deps
pip install deepspeed-0.11.2+cuda118-cp310-cp310-win_amd64.whl
pip install -r requirements.txt
conda install -c conda-forge pynini==2.1.5
pip install WeTextProcessing
对于 Mac 和 Linux 用户:
# 对于 Linux 用户
conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 pytorch-cuda=11.8 -c pytorch -c nvidia
# 对于 Mac 用户
conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 cpuonly -c pytorch
pip install resemble-enhance
pip install -r requirements.txt
pip install WeTextProcessing
步骤4:启动项目
最后,启动项目的 Web 用户界面:
python webui/webui.py
按照以上步骤操作后,您应该能够成功安装和配置 ChatTTS-Enhanced 项目,并开始使用了。
ChatTTS-Enhanced 项目地址: https://gitcode.com/gh_mirrors/ch/ChatTTS-Enhanced
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考