Praat使用 | 辅助Praat进行标注的工具

本文介绍了一款用于辅助Praat进行大规模语音数据标注的工具,该工具能自动读取和保存文件,显著提高标注效率。用户只需设置数据目录,点击开始即可自动进行标注,支持查找功能并能记录修改历史。此外,还提供了工具的下载链接和使用指南。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

引言

无论是学术课题的研究或者是公司项目的进行,数据处理是必然的,对语音数据来说,通过Praat标注仍然是很多学术团体或者公司使用较多的手段,包括语音识别和语音合成等。这些标注数据不仅是十几句的问题,以现在大数据的标准,你所面临的数据可能是上千,上万级别的。

问题提出

通过Praat进行标注是很方便的,问题在于,Praat不象是办公软件会有自动保存功能,如果你进行大量的数据标注,需要首先打开这个音频和标注文件:
在这里插入图片描述
其次,选择音频和标注文件,点击View&Edit进行标注。

最后,还要记得把你的标注文件,进行保存
在这里插入图片描述

每标一句,即使不算你进行标注的时间,恐怕打开,保存,也要消耗2-3秒吧。如果以这种方式进行上千,上万句的标注,这过程能让人崩溃。新版的Praat支持一次性打开多个文件,这也是一种手段,就是你可以同时打开大概100句吧,这样每标完一句,保存,关掉。再进行窗口的下一句。
​​​​
这里为大家提供一个辅助Praat进行标注的工具,是用C#写的。使用这个工具,设置好你的数据的目录之后,点击开始,可以自动读取文件使用Praat标注,并且自动保存,不需要通过频繁打开,保存,进行操作。这将会大大节省标注时间。

小提示:如果你有条件使用两个笔记本+显示器两个屏幕,一个窗口放这个工具,另外一个窗口是打开的Praat进行标注,你的效率将会达到极致。

工具介绍

在这里插入图片描述
Praat.exe 这个是通用的标注工具,你可以任意换成现在的最新版Praat(建议官网下载)。
sendpraat.exe 这个程序调用的一个接口程序,这也是Praat官方网站提供的。
Praat标注辅助工具.exe 本程序。

数据说明

所有数据来自http://ocw.mit.edu/index.htm

工具下载

http://download.youkuaiyun.com/detail/shaopengfei/8386563 如果需要积分,下载完成之后,评论一下,积分就会被返还。

工具同步上传github,不过需要自己下载一个Praat到这个目录里。
https://github.com/feelins/Praat_Scripts/tree/master/Praat_Tools

工具使用

标注
  1. 选择TextGrid目录以及Wav目录:默认是和工具同在一个目录下的TextGrid以及wav目录两类文件可以放在同一目录下目录中不能有中文和空格
    在这里插入图片描述

  2. 点击“开始标注”,文件的列表会显示在左下角的框内,同时显示TextGridWav的文件数量; 在这里插入图片描述

  3. 双击文件列表框内的文件名,就可以开始标注了;在这里插入图片描述

  4. 在标注的过程中,使用上一个下一个在列表中自动跳转,跳转的同时会自动保存上一个打开标注的文件,同时这个文件以及其标注时间会保存在工具所在的目录下的modify.log里;

  5. modify.log里保存了所有的文件列表,并且修改过的文件会产生一个时间标志。

  6. 再次打开这个软件,点击开始标注时,即会首先读取modify.log,定位到第一个没有标的文件上。

  7. 关闭这个软件,也会对刚刚打开的TextGrid进行保存。

查找

该工具也可以查找第一层的相关信息,具体使用如下:

1.在下面的框内输入需要搜索的文本,可以是一个,也可以是多个,多个之间需要用空格或者逗号隔开;
在这里插入图片描述
比如输入SIL,会在你的数据目录里搜索出SIL的所有位置,双击这些选项,将会根据显示的时间标记,直接定位到你标注的SIL的位置。
在这里插入图片描述
2.可以选择精确查找,这样只搜索相等的内容,默认是搜索相似的内容。
比如上例,如果精确查找SIL是搜索不出来的,你需要输入<SIL>,即要和标注文件里的内容完全相同。
3.结果显示在列表中,并且保存在findResult.log里。

4.双击这些结果也可以定位到这个内容所在的位置。

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

在这里插入图片描述

版权说明

1、版权归本公众号“极地语音工作室”,原名“语音处理小站”所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极地语音工作室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值