因为工作需要,做了一个简单的FunASR语音引擎训练材料标注工具

FunASR-Annotation-Tool

因为工作需要,做了一个简单的FunASR语音引擎训练材料标注工具。传送门

因为工作需要,做了一个简单的FunASR语音引擎训练材料标注工具。

paramformer训练为例,逻辑就是:

  1. 搞一个train_text.txt文件
  2. 打开train_text.txt文件
  3. 录音,保存wav到本地,和train_text.txt中的材料一一对应
  4. 生成parafomer训练指令需要的train_wav.scp文件

备注:

  1. 目前只实现了parafomer的,对我们目前的工作已经满足要求了,后续有其他要求再说(比如SenceVoice就还有事件、情绪)。这个也好做,就是切换菜单的时候,实现支持事件、情绪标注的功能即可
  2. 很多稳定性功能并没有太关注,若使用中出现问题,自行处理即可


基本操作流程:

  1. 利用任何一个LLM,生成train_text.txt。我这里有一个样例:
随机生成20条内容,要求如下: 
1、这些内容可以是中文也可以是英文 
2、每段内容的长度如果用正常语速阅读,不超过30秒。你生成的内容,每一条长度要分布均匀,有长有短 
3、需要为每段内容标注一个ID,假设内容用“C”表示,那么你给出的结果为:ID 空格 C。每一条换一行。 
4、ID要有顺序,比如从A0000开始,每一条增加一个数字 
5、特别注意,格式就是 "ID空格C",不要添加任何其他内容,严格按照此格式
6、不要做任何总结、归纳,只需要给出结果
  1. 保存LLM生成的内容到{working_dir}\train_text.txt中。working_dir你自己选
  2. 运行软件,“选择材料文件”或者用“文件->加载”出{working_dir}\train_text.txt
  3. 录音、保存
  4. “处理->生成jsonl素材”

最后,你就会在{working_dir}\train_text_dist\中得到你需要的内容

操作界面:

  • 基本界面

在这里插入图片描述

  • 菜单

在这里插入图片描述




  • 产生的结果[1]

在这里插入图片描述

  • 产生的结果[2]

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sb熙哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值