这次不止新增了GPT-SoVITS视频变声转录,还同时完善了原音频变声转录中的时间对齐问题。
之前的GPT-SoVITS音频变声转录由于不能对齐原音频的时间,很多用户无法实打实地解决自己的视频配音问题,只能娱乐一下。
软件介绍
小米坡 GPT-SoVITS 批量API管理器2025是简单高效的GPT-SoVITS辅助工具,充分发挥GPT-SoVITS的无限潜力,畅玩个性化、低成本的文本转语音。
一次启动管理多个GPT-SoVITS角色API,网页配音服务(本机、局域网、外网),批量txt文件转语音,变声(音/视频转录)、多角色配音、语速调节、音调调节、插入静音、多音字纠正。
单文本配音
GPT-SoVITS API带多音字和插入静音功能演示
日常的文字合成音频,这个功能支持生成SRT字幕,方便大家完成配音的同时再获得一个SRT字幕文件。当然更多是直接合成音频,目前测试中直接合成音频的速度比勾选同时生成SRT字幕的速度快一些。
批量TXT配音
GPT-SoVITS批量配音批量TXT合成音频
批量TXT配音主要是支持用户一次上传多个TXT文件,软件对TXT文件里的内容逐个进行配音,合成的音频可以TXT文件名下载保存。
默认情况下,限制只从TXT计取10000行,这是考虑极端情况,如果用户使用了巨大的文件可能会搞了一天搞不完。
音频变声(转录)
GPT-SoVITS视频音频变声转录
早期制作视频教程之后,习惯性地使用手机录配音,但由于自己的声音不是很好听,因为想通过GPT-SoVITS进行转录,获得标准的、音色较好的普通话配音。
视频变声转录(转录)
GPT-SoVITS视频变声重配音
很多时候用户的配音是在制作视频时一边操作一边录音,这个时候如果要进行配音的优化,就需要提取音频出来再使用音频变声,很麻烦。出于这个考虑,软件新增的视频变声转录功能,有效地解决了视频重配音的一步到位。
这个功能使用了ASR,同时使用自动变速,对音频与原画面同步进行了对齐。但是用户仍然需要根据原视频的实际情况,调用你所使用的GPT-SoVITS配音角色的语速。
软件官网
软件资料,软件下载
小米坡 GPT-SoVITS 批量API管理器2025 ,把GPT-SoVITS搭建成局域网共用配音,支持多角色合成语音、批量txt文件转语音