1. 前言
Montreal Forced Aligner(MFA)是一种强制对齐工具,可以将音频文件和其对应的文本,转换为音频文件在word、phone等级别的时间对齐的标注。这个工具在语音识别、音频标注和语音合成等领域得到了广泛的应用。本文将为大家介绍如何使用MFA完成音频文件的强制对齐。
2. 安装
2.1 简易安装
MFA在github上release了一些编译好的可执行文件,直接下载解压即可。虽然版本停留在第一代,但可以满足基本需求了。(PS,亲测 v1.1.0 Beta 2 的bug更少,v1.0.1稳定版并没有更稳定。)
2.2 pip 安装
MFA是一个Python包,可以通过pip来安装。建议单独安装一个新的虚拟环境:
conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch
conda activate aligner
安装MFA和第三方包:
pip install montreal-forced-aligner
mfa thirdparty download
部分系统版本较低的还需安装

最低0.47元/天 解锁文章
3732





