
AI创作从零开始
文章平均质量分 91
详细记录基于魔塔平台,使用各种AI工具从零到一的过程。
CITY_OF_MO_GY
计算机视觉、多模态大模型
展开
-
GPT-SoVITS:训练自己的声音【超详细教程】
上一篇文章中我们介绍了如何在魔塔平台搭建GPT-SoVITS工具,今天,我们就详细介绍一下如何训练出自己的声音,话不多说,那我们现在开始。我们先大概介绍一下相关流程:第一步需要录一段自己或者喜欢的声音的录音作为训练集;第二步需要对录音中的背景音进行去除,提取人声;第三步对语音进行切分;第四步对切分好的录音再进行降噪处理;第五步再将降噪后的录音进行自动文本标注,生成标签文件;第六步将生成的标注文件进行人工矫正;第七步加载训练集;第八步选择与训练模型进行训练;第九步加载训练好的模型进行推理;原创 2024-08-05 23:29:59 · 3649 阅读 · 5 评论 -
在modelscope(魔塔)部署GPT-SoVITS并实现网络穿透,可外部调用
前面我们介绍了如何搭建一个自己的,大家可以添加自己喜欢的diffusion大模型以及Lora进行图片创作,但是有的小伙伴创作的图片是为了迎合自己的故事背景,需要借助图片形象的展示一段故事,但苦于一些剪辑软件上的文本转换语音太过生硬没有感情色彩,一耳就可以听出是机器人,拉低了整体观感,那么今天就再为大家介绍一个开源音色提取及语音生成的开源模型在这篇文章中我们已经介绍了如何开启一个modelscope的GPU服务器,这里我们就跳过这些步骤,直接部署项目。原创 2024-08-04 16:57:52 · 2143 阅读 · 0 评论 -
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力;登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器;原创 2024-07-24 20:53:29 · 3439 阅读 · 3 评论