音素
音素是构成语音的基本声音,音节和单词建立在音节上。在与 语音 和 语言 处理相关的各种应用(例如 文本到语音系统 )中,将文本从其拼写形式转录为语音字母表是一项重要要求。
Phonemizer 是一个精确寻址的 Python 包, 它将文本从其拼写表示转录为语音表示。该包设计用户友好的,并公开了一个高级音素化函数, 支持大约100种不同的语言。phonemizer 使用的默认后端是 eSpeak (Dunn & Vitolins,2019 年),一种基于语言专业知识和手写转录规则的文本转语音软件。它将文本转录成国际音标,并支持一百多种语言。使用 MBROLA 声音(Tits & Vitolins,2019),eSpeak 后端可用于大约 35 种语言,以 SAMPA 计算机可读语音字母表转录文本。
安装
安装phonemizer前需要配置espeak,
-
winhttps://github.com/espeak-ng/espeak-ng/releases下载对应的msi文件点击安装
-
mac首先配置好homebrew,之后命令行brew install espeak
pip3 install phonemizer
英文音素化
from phonemizer import phonemize
phonemize(text, language='en-us', prepend_text=False, preserve_punctuation=False, with_stress=False, njobs=1)
-
text 文本列表
-
language 语言。"en-us"美国英语, "zh"中文
-
prepend

Phonemizer是一个Python包,用于将文本从拼写转换为语音表示,支持大约100种语言。它依赖于eSpeak后端,可以将文本转录为国际音标,并在必要时使用MBROLA声音。本文介绍了如何安装Phonemizer,以及如何在英文和中文文本中进行音素化操作。
最低0.47元/天 解锁文章
2341

被折叠的 条评论
为什么被折叠?



