ChatTTS-Enhanced 项目安装与配置指南

贺俭艾Kenyon

于 2025-04-03 10:04:37 发布

阅读量594

点赞数 22

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00664/article/details/146973650

ChatTTS-Enhanced 项目安装与配置指南

ChatTTS-Enhanced 项目地址: https://gitcode.com/gh_mirrors/ch/ChatTTS-Enhanced

1. 项目基础介绍

ChatTTS-Enhanced 是一个开源项目，旨在增强和改善 Chat-TTS 的音质，解决生成过程中的噪音问题。它支持多种文本文件格式的批量处理，可以对长文本进行切割处理，支持中英混读，并允许自定义切割长度。此外，它还能导出 SRT 文件，并支持调节语速、停顿、笑声和口语化程度等参数。项目支持导入 ChatTTS Speaker 音色，并能够储存音色配置和选项配置，方便用户管理。

项目主要使用的编程语言是 Python。

2. 项目使用的关键技术和框架

PyTorch: 用于深度学习模型的框架。
torchaudio: PyTorch 的音频处理库。
WeTextProcessing: 用于文本处理的库。
resemble-enhance: 用于音质增强的库。

3. 项目安装和配置的准备工作

在开始安装之前，请确保您的系统中已经安装了以下环境：

Python 3.10
Conda（推荐使用 Anaconda）
Git

安装步骤

步骤1：克隆项目

首先，您需要从 GitHub 克隆项目到本地：

git clone https://github.com/CCmahua/ChatTTS-Enhanced.git
cd ChatTTS-Enhanced

步骤2：创建并激活虚拟环境

创建一个名为 Dlab 的虚拟环境，并激活它：

conda create -n Dlab python=3.10
conda activate Dlab

步骤3：安装依赖

根据操作系统选择相应的命令来安装 PyTorch 及其相关依赖：

对于 Windows 用户：

conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install resemble-enhance --no-deps
pip install deepspeed-0.11.2+cuda118-cp310-cp310-win_amd64.whl
pip install -r requirements.txt
conda install -c conda-forge pynini==2.1.5
pip install WeTextProcessing

对于 Mac 和 Linux 用户：

# 对于 Linux 用户
conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 pytorch-cuda=11.8 -c pytorch -c nvidia

# 对于 Mac 用户
conda install pytorch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 cpuonly -c pytorch

pip install resemble-enhance
pip install -r requirements.txt
pip install WeTextProcessing