【语音算法】Montreal Forced Aligner教程(MFA,中文语音文本对齐)

1. 前言

Montreal Forced Aligner(MFA)是一种强制对齐工具,可以将音频文件和其对应的文本,转换为音频文件在word、phone等级别的时间对齐的标注。这个工具在语音识别、音频标注和语音合成等领域得到了广泛的应用。本文将为大家介绍如何使用MFA完成音频文件的强制对齐。

2. 安装

2.1 简易安装

MFA在github上release了一些编译好的可执行文件,直接下载解压即可。虽然版本停留在第一代,但可以满足基本需求了。(PS,亲测 v1.1.0 Beta 2 的bug更少,v1.0.1稳定版并没有更稳定。)

2.2 pip 安装

MFA是一个Python包,可以通过pip来安装。建议单独安装一个新的虚拟环境:

conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch
conda activate aligner

安装MFA和第三方包:

pip install montreal-forced-aligner
mfa thirdparty download

部分系统版本较低的还需安装

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值