OpenVoice本地部署教程与踩坑记录

原创

已于 2024-03-05 17:40:49 修改 · 1.4w 阅读

89 ·

CC 4.0 BY-SA版权

文章标签：

#OpenVoice #TTS #音色克隆 #语音克隆 #变音器

于 2024-01-09 11:30:20 首次发布

文章介绍了OpenVoice，一种能通过少量音频样本克隆声音的Python技术，涉及模型部署、环境准备、安装库、模型下载和运行示例。还提到了TTS和音频转换的过程，以及在中国遇到的网络限制问题及其解决方案。

该文章已生成可运行项目，

前言

OpenVoice是一种多功能的即时声音克隆方法，它只需要参考发言者的一小段音频片段，就可以复制他们的声音并用多种语言生成语音。更多介绍详见博文【Python趋势榜-OpenVoice】，官方仓库地址【https://github.com/myshell-ai/OpenVoice】

简单的说，OpenVoice可以克隆语音，只需要一段几十秒的录音就可以得到很不错的模仿效果。甚至男声转女声的效果也很不错，这就有很大的想象空间。目前官方的做法是通过算法学习录音文件的音色和发音习惯，然后将文本通过TTS转为语音，再用学习到的音色特征转换语音得到最终音频文件，其中还可以对生成的文件加入特殊水印从而保证不被滥用。

部署

准备环境

本项目运行在python3.9，可以到python官网下载对应的版本【python-3.9.10-amd64.exe】，也可以使用conda创建。自行安装的记得切换环境变量，最好是CMD中尝试一下是否正常运行在3.9之上。

克隆项目

克隆就不再赘述了，程序员的基本技能【https://github.com/myshell-ai/OpenVoice】。

git clone https://github.com/myshell-ai/OpenVoice.git

由于官方在2024-2-14日改变了目录层级【refactor!: Converts Project into a Python Compatible Package】，本文的代码无法直接使用，建议拉取之前的历史代码测试。也可以修改本文调用的代码测试，难度不大。

安装库

安装官方requirements.txt中所要求的支持库。

pip install -r requirements.txt

本文章已经生成可运行项目

最低0.47元/天解锁文章

37 条评论

山山而川qwq 2025.04.04
--------------------------------------------------------------------------- OSError Traceback (most recent call last) File ~/anaconda3/envs/openvoice/lib/python3.9/site-packages/urllib3/connection.py:198, in HTTPConnection._new_conn(self) 197 try: --> 198 sock = connection.create_connection( 199 (self._dns_host, self.port), 200 self.timeout, 201 source_address=self.source_address, 202 socket_options=self.socket_options, 203 ) 204 except socket.gaierror as e: File ~/anaconda3/envs/openvoice/lib/python3.9/site-packages/urllib3/util/connection.py:85, in create_connection(address, timeout, source_address, socket_options) 84 try: ---> 85 raise err 86 finally: 87 # Break explicitly a reference cycle File ~/anaconda3/envs/openvoice/lib/python3.9/site-packages/urllib3/util/connection.py:73, in create_connection(address, timeout, source_address, socket_options) 72
- Print_lin回复山山而川qwq 2025.04.07
  墙的问题，看看是哪个包没下载到，手动下载一下

gowithtik 2024.12.08
你好请问我遇到这样的错，怎么办？packages\wavmark\__init__.py", line 10, in load_model resume_path = hf_hub_download(repo_id="M4869/WavMark", File "E:\AI\OpenVoice\venv\lib\site-packages\huggingface_hub\utils\_validators.py", line 114, in _inner_fn return fn(*args, **kwargs) File "E:\AI\OpenVoice\venv\lib\site-packages\huggingface_hub\file_download.py", line 862, in hf_hub_download return _hf_hub_download_to_cache_dir( File "E:\AI\OpenVoice\venv\lib\site-packages\huggingface_hub\file_download.py", line 969, in _hf_hub_download_to_cache_dir _raise_on_head_call_error(head_call_error, force_download, local_files_only) File "E:\AI\OpenVoice\venv\lib\site-packages\huggingface_hub\file_download.py", line 1487, in _raise_on_head_call_error raise LocalEntryNotFoundError( huggingface_hub.errors.LocalEntryNotFoundError: An error happened while trying to locate the file on the Hub and we cannot
- Print_lin回复gowithtik 2024.12.11
  这是墙的问题导致文件下载不了，可以在这行代码中关闭vad组件：se_extractor.get_se(reference_speaker, tone_color_converter, vad=False)

码眼 2024.09.27
中文style只能设置default吗，其他的好像都报错

mcxc.png 2024.08.19
### Initialization报错怎么搞
- Print_lin回复mcxc.png 2024.08.20
  很久没有跟进官方仓库的改动了，我估计有些差异，建议看看官方仓库。然后参考本文的思路

艾斯芬尼金卡烧烤大串 2024.07.17
我的神~，请问您是如何定义的对应文件下载代码位置的呀？看不懂这块位置
- Print_lin回复艾斯芬尼金卡烧烤大串 2024.07.18
  基本流程就是阅读代码+查看日志。下载文件肯定会有一个写入地址，然后读取相应的文件，没什么神奇的，看懂调用链路就好了

飘帆世俗 2024.04.07
我执行后，出现这个错误，文件位置也确认了没啥问题 [code=python] FileNotFoundError Traceback (most recent call last) Cell In[4], line 2 1 reference_speaker = 'resources/example_reference.mp3' ----> 2 target_se, audio_name = se_extractor.get_se(reference_speaker, tone_color_converter, target_dir='processed', vad=True) File c:\Users\Administrator\Documents\OpenVoice-main\OpenVoice\openvoice\se_extractor.py:141, in get_se(audio_path, vc_model, target_dir, vad) 139 wavs_folder = audio_path 140 elif vad: --> 141 wavs_folder = split_audio_vad(audio_path, target_dir=target_dir, audio_name=audio_name) File c:\Users\Administrator\Documents\OpenVoice-main\OpenVoice\openvoice\se_extractor.py:79, in split_audio_vad(audio_path, audio_name, target_dir, split_seconds) 77 def split_audio_vad(audio_path, audio_name, target_dir, split_seconds=10.0): 78 SAMPLE_RATE = 16000 ---> 79 audio_vad = get_audio_tensor(audio_path) [/code]
- Print_lin回复我叫五分 2024.11.18
  尝试一下使用绝对路径，官方变更了目录结构，本文是基于v1版本写的，他们最新v2的目录组织方式不一样，你看看文件位置，然后修改一下
- 我叫五分回复飘帆世俗 2024.11.18
  和我一样，路径没啥问题一直找不到文件 [code=plain] Traceback (most recent call last): File "H:\work\docker\project\OpenVoiceMain\script.py", line 28, in <module> target_se, audio_name = se_extractor.get_se(reference_speaker, tone_color_converter, target_dir='processed', vad=True) File "H:\work\docker\project\OpenVoiceMain\openvoice\se_extractor.py", line 159, in get_se wavs_folder = split_audio_vad(audio_path, target_dir=target_dir, audio_name=audio_name) File "H:\work\docker\project\OpenVoiceMain\openvoice\se_extractor.py", line 84, in split_audio_vad audio_vad = get_audio_tensor(audio_path) [/code]

yubin1277408629 2024.03.29
[face]emoji:062.png[/face][face]emoji:062.png[/face][face]emoji:062.png[/face][face]emoji:062.png[/face][face]emoji:062.png[/face][face]emoji:062.png[/face]

IRISicy 2024.03.28
哥，你是我的神~[face]emoji:015.png[/face]
- Print_lin回复IRISicy 2024.03.29
  笑死，哈哈哈

dfhf1234 2024.03.05
se_extractor库从哪里下载
- Print_lin回复dfhf1234 2024.03.05
  se_extractor就在openvoice文件夹，我看了一下官方应该是更新了目录结构，所以找不到se_extractor。我在写文章时se_extractor.py文件就在根目录下，所以没问题

dfhf1234 2024.03.04
D:\Python\python.exe D:/OpenVoice/demo_part1.py Traceback (most recent call last): File "D:\OpenVoice\demo_part1.py", line 3, in <module> import se_extractor ModuleNotFoundError: No module named 'se_extractor' 这个依赖库没装上怎么办
- Print_lin回复dfhf1234 2024.03.05
  如果你是使用的最新的仓库，可以这样解决：from openvoice import se_extractor