
语音处理
文章平均质量分 81
音视频处理相关问题解决和技术分享
AI 菌
算法工程师一枚,优快云博客专家;NLP、CV、语音算法跨界选手,欢迎一起交流学习!
展开
-
【常用音频处理】hpcp/mfcc/fbank特征提取总结
语音处理中常用的方法,包括音频加载、特征提取、归一化、音频融合等原创 2023-07-02 19:24:13 · 3400 阅读 · 2 评论 -
OpenAI-whisper语音识别模型
OpenAI语音识别模型原创 2023-05-19 18:11:47 · 5571 阅读 · 0 评论 -
【歌曲识别】CQTNet:利用卷积神经网络学习翻唱歌曲识别的表示方法
翻唱识别原创 2023-03-18 18:45:34 · 1683 阅读 · 0 评论 -
【语音唤醒】WEKWS:第一个小型的端到关键词发现工具包
端到端语音唤醒方案原创 2023-03-16 15:32:35 · 4407 阅读 · 0 评论 -
【语音唤醒】TC-ResNet:移动设备上实时关键词检测的时域卷积算法
语音唤醒端到端算法原创 2023-03-14 19:43:39 · 2692 阅读 · 13 评论 -
【音频分类与检测】PANNs:用于音频模式识别的大规模预训练音频神经网络
音频模式识别是机器学习领域的一个重要研究课题,它包括音频标注、声音场景分类、音乐分类、语音情感分类和声音事件检测等任务。近年来,神经网络已被应用于解决音频模式识别问题。然而,以前的系统是建立在特定数据集上的,数据集时长有限。最近,在计算机视觉和自然语言处理中,在大规模数据集上进行预训练的系统已经很好地推广到一些任务上了。然而,在大规模数据集上进行音频模式识别的预训练系统的研究还很有限。本文提出了在大规模音频数据集上训练的预训练音频神经网络(PANN)。原创 2023-01-15 22:02:52 · 10053 阅读 · 5 评论 -
【语音识别工具】asv-subtools 介绍与安装
语音识别工具asv-subtools原创 2022-11-15 21:14:57 · 2522 阅读 · 0 评论 -
【语音识别工具】kaldi下载与安装
语音识别工具Kaldi原创 2022-11-14 23:57:38 · 2668 阅读 · 0 评论