质检数据筛选:/home/homework/wangshenjian/daily_zhijian_collect
发送:192.168.240.104(test-09机器):disk2/wangshenjian/upload
/home/homework/bce-cli-0.8.3/bce bos cp 20190728.res bos://zyb-video/20190728.res
echo "http://zyb-video.bj.bcebos.com/20190728_0808_audio2words_train.res"
#!/bin/bash
data=yike_dx_20190717_9.82h_test
for wav_id in `ls ${data}/*`;do
#echo "${wav_id}"
/home/homework/bce-cli-0.8.3/bce bos cp ${wav_id} bos://zyb-video/${wav_id}
echo "http://zyb-video.bj.bcebos.com/${wav_id}" >>${data}.url
done
添加标点符号策略:/home/homework/asr/wangshenjian_test/audio2words/sample_full_post_processor.py
gst_kaldinnet2onlinedecoder_full_final_result_to_json
tri5:12.17:/home/asr/wangshenjian/kaldi-master/egs/baidu630_aishell_accent_lianmaiNoEng_update/s5、update的三个脚本
本文详细介绍了质检数据从筛选到上传至服务器的过程,包括使用特定脚本进行数据处理,以及通过bceboscp工具上传文件至指定路径,并生成相应URL。此外,还提到了音频转文字处理的后期标点策略及使用的Python脚本。

被折叠的 条评论
为什么被折叠?



