Praat脚本-030 | 谈谈自动标注这点儿事(3)

简介

SPPAS工具是由Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动产生出带有音段信息,并且边界相对整齐的Praat标注文件TextGrid已经是大大提升了工作效率。所以推荐给进行语音研究,而且数据量规模很大的朋友。

有关于这个工具的详细说明,介绍,文档,由此相关的论文等信息请参阅官方网站:http://www.sppas.org/。在这里只是把使用的时候注意的一些地方写出来,以方便一些可能对插件包安装使用并不熟悉的同学。另外也请注意,本文主要使用是有关于SPPAS 2.4版本(个人更喜欢使用2.4,界面也简单,新版本。。。大家随意),而最新的版本好像是3.9(2021年7月6日更新),有关于最新的版本使用方面的问题,其实可以直接给作者发邮件询问,甚至作者也放了完整的安装视频,虽然是法语的,但是我觉得步骤还是比较清楚的。

安装环境

必须的软件环境:

  • Python
  • wxPython
  • Julius

安装Python

Python的官方网站是:https://www.python.org/,下载页在:https://www.python.org/downloads/release/python-2713/,请选择32位下载,Windows x86 MSI installer。不需要专门针对64位的机器下载64位,尤其对于初学者,32位可以将Python的bin目录增加到系统环境变量里,而64位有时候需要手工增加,如果你熟悉这个操作,可以选择64位Python安装,这里以32位为准。

如果使用SPPAS 2.4版本,请下载安装Python2.7版本使用。如果使用SPPAS 3.0以后版本,请下载安装Python3版本以上。

安装过程即和常规安装软件的过程类似,第一步使用默认方式就可以,即安装给该系统所有用户使用。
在这里插入图片描述

第二步,安装的路径,不建议目录太深,最好在常用盘,比如C盘或者D盘的根目录下,如图所示,在C盘根目录下的Python27就可以,27表示是2.7版本,有其它开发需求的朋友可能也会安装Python3.4以上版本,所以这里也要注意区分。
在这里插入图片描述

在这一步,给出了64位和32位安装的区别,上图是64位,下图是32位,下图有一个选项,可以将Python.exe设置到系统的环境变量里,这个很关键,直接关系运行SPPAS的时候是否能直接从系统调用Python

在这里插入图片描述
在这里插入图片描述
最后安装Python成功。
在这里插入图片描述
检验一下,点击win+R键,调出运行窗口,输入cmd,回车,也可以直接搜索命令行窗口, 输入python,如果有正确的显示python的信息,说明安装成功。

安装WxPython

WxPython是辅助Python实现可视化界面的。可以根据前面安装Python选择32位或者64位:

32位:https://sourceforge.net/projects/wxpython/files/wxPython/3.0.2.0/wxPython3.0-win32-3.0.2.0-py27.exe/download
64位:https://sourceforge.net/projects/wxpython/files/wxPython/3.0.2.0/wxPython3.0-win64-3.0.2.0-py27.exe/download

安装过程如下,第一步直接点下一步就可以。

在这里插入图片描述

这一步也是选择接受协议Accept the agreement直接点下一步。
在这里插入图片描述

第三步很关键,这个路径一定要和前面Python27目录保持一致,在本例中Python安装在C盘,则象下面这样,这样的路径才是正确的。site-packages表示WxPython作为一个 模块包,在Python里。同样如果你选择的是Python3+SPPAS3的环境,这里也要安装在Python3版本的这个目录里。
在这里插入图片描述

最后,这三个选项默认都选中,点击finish.
在这里插入图片描述

安装Julius

Julius是专门用来做对齐的工具,不需要安装,只是告诉系统它的位置就可以了。这个工具也可以用HVite代替,官网上也有介绍。

http://sourceforge.jp/projects/julius/downloads/60273/julius-4.3.1-win32bin.zip/

直接解压到一个目录里, 打开这个目录,打开bin目录,找到Julius.exe,注意因为本文下载的是Julius 4.3.1版本,所以其实这个文件名称是Julius-4.3.1.exe,即要把这个文件拷贝到C:\windows\目录下,并且改名为:julius.exe 。

注意:64位机器不需要找专门的这个版本,就使用和第(3)同样的方式操作就可以了,已经测试过,是成功了。
在这里插入图片描述

SPPAS使用

SPPAS工具下载后直接解压到磁盘根目录下,比如D盘下。D:\sppas\,目录级别尽量不要太深。
打开后,直接打开里面的sppas.bat,就可以运行了。
在这里插入图片描述

打开之后是这样的界面,注意Setting里面需要设置结果文件为TextGrid,现在软件默认的是xra文件。
在这里插入图片描述

数据格式

首先是一些使用时的注意事项,请想使用软件的同学务必仔细看一下是否符合。

  • 与声音对应的文本文件,必须是UTF8格式;
  • 声音文件必须是单通道文件,16位精度,格式为WAVE或者AU,最好是采样率为16K;
  • 所有的文件名称中没有特殊字符,比如中文,空格都不允许,推荐只出现字母,下划线,数字或者横线;
  • 声音文件和对应的文本文件名称必须完全一致;
  • 语音最好是录音条件比较好的数据,即录音环境很安静。发音人语音清晰,这样会明显提升自动标注效果。如果是在嘈杂环境的录音,野外录音,这样的自动标注效果很差。
  • 录音文件每一单位之间,最好有比较清楚的停顿,比如你是录音很多字、词,那么发音人在读字,词之间时,最好有一些停顿;如果是录音很多句子,那么句子之间也要有明显的停顿,这样也可以提高自动标注精度;

数据准备

准备音频和文本

在这里插入图片描述

注意声音文件和文本文件是对应出现的。文件名称必须一样。而文本文件,比如Sound_1.txt里面就是这个声音的内容,没有其它多余信息。如红色箭头所指。在保存这个文本文件的时候,需要注意编码格式为UTF-8格式,如下面的红色方框所示。

在这里插入图片描述

导入SPPAS进行切分

经过上面的步骤,我们已经制作了批量的声音文件和文本文件,把这些文件放在同一个目录内:
在这里插入图片描述

然后打开SPPAS这个工具,点击Add files将声音文件添加到窗口里,同时,有同样文件名的txt也会被添加到窗口里,把这些文件通过使用ctrl或者shift键,全部选择,然后把右侧的几个对齐的选项选择,并且在语言里选择相应的语言,比如这里选择的是中文,cmn。SPPAS最新的3.9版本这个地方是变化挺大的,请注意。
在这里插入图片描述

点击右下角的这个长的按钮,就是执行按钮,然后系统就会自动产生出来对齐音段的TextGrid文件。一般情况下,会同时产生几个TextGrid。你可以分别打开看一下,分别是运行的中间步骤。
在这里插入图片描述

我们只需要最终的结果Sound_-palign.TextGrid文件。
这就是最终的结果:可以看到,准确度并不高,但是省去了很多人工的添加边界,输入字符的过程。
在这里插入图片描述

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

在这里插入图片描述

版权说明

1、版权归本博客作者所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极地语音工作室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值