音频DF检测之RawGAT-ST代码部分(一)——数据集处理

最新推荐文章于 2025-04-07 13:51:20 发布

原创

最新推荐文章于 2025-04-07 13:51:20 发布 · 1.4k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#python

该博客主要介绍了ASVspoof2019挑战赛的数据集处理方法，包括读取协议文件、音频样本的预处理（如填充至固定长度）以及使用TorchDataset进行保存。核心代码集中在ASVDataset类的初始化方法中，通过torch.vision.transform对音频数据进行处理，并使用平行处理加快速度。此外，还详细解析了如何从协议文件中提取元数据并转换为音频样本和对应的标签。整个流程展示了深度学习模型在语音识别任务中的数据预处理步骤。

首先是数据集处理部分，对['speaker_id', 'file_name', 'path', 'sys_id', 'key']通过torch.save保存为npy文件。
cm_protocol可以是ASV2019路径下ASVspoof2019_LA_cm_protocols文件夹的ASVspoof2019.LA.cm.train.trn.txt文件。

最核心的部分在class ASVDataset(Dataset)的def __init__。

#cm_protocol可以是ASVspoof2019_LA_cm_protocols文件夹的ASVspoof2019.LA.cm.train.trn.txt文件
#返回ASVFile(speaker_id,file_name,path,sys_id,key)
files_meta = parse_protocols_file(cm_protocol)
#返回音频采样点data_x, 标签data_y, 第几个篡改方法sys_id
data = list(map(read_file, files_meta))
data_x, data_y, data_sysid = map(list, zip(*data))
#保存
torch.save((self.data_x, self.data_y, self.data_sysid, self.files_meta), self.cache_fname)

此外，加入了torch.vision.transform()以后，torch.save前加入一行：

if self.transform:
	self.data_x = Parallel(n_jobs=4, prefer='threads')(delayed(self.transform)(x) for x in self.data_x)

其中，transform使用：

transforms = transforms.Compose([
    lambda

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

nooobme

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

大模型后处理之提取Json结构数据的实战代码

herosunly的博客

12-20

10万+

本文主要介绍了大模型后处理之提取Json结构数据的实战代码，希望对使用大语言模型的同学们有所帮助。文章目录 1. 前言 2. 实战代码

11、LLaMA-Factory自定义数据集微调

Andy_shenzl的博客

09-06

1万+

针对实际的微调需求，使用专门针对业务垂直领域的私有数据进行大模型微调才是我们需要做的。因此，我们需要探讨如何在LLaMA-Factory项目及上述创建的微调流程中引入自定义数据集进行微调。alpaca和sharegpt。

1 条评论您还未登录，请先登录后发表或查看评论

RawGit 使用教程

gitblog_00316的博客

08-18

403

RawGit 是一个服务，它直接从 GitHub 提供原始文件，并带有正确的 Content-Type 头。RawGit 作为一个缓存代理，将请求转发到 GitHub，缓存响应，并以适当的 Content-Type 头将响应传递给浏览器。尽管 RawGit 目前处于 sunset 阶段，即将关闭，但它曾经是一个非常受欢迎的工具，用于从 GitHub 提供文件。 ## 项目快速启动 ### 安装...

毕设过程记录

weixin_43744613的博客

07-12

3506

本文的目标读者是需要做 “matlab信号处理相关”或 “语音安全相关” 或“机器学习相关” 的本科生。本文可用于课程大作业的借鉴，也可为即将做毕设或参加互联网比赛的同学做参考。

TL-SEJ 方法：有效对抗语音伪造攻击

声纹感知洞察芯声

07-31

1332

为了应对噪声和混响等更具挑战性的场景，本文探索了数据增强、语音增强和预训练模型等技术，提出了一种基于迁移学习的语音增强前端联合优化 (TL-SEJ) 方法。

【论文学习】《Replay attack detection with complementary high-resolution information using end-to-end DNN 》

求求你们别卷了

05-22

1804

《Replay attack detection with complementary high-resolution information using end-to-end DNN for the ASVspoof 2019 Challenge》论文学习文章目录《Replay attack detection with complementary high-resolution information using end-to-end DNN for the ASVspoof 2019 Challen

伪造语音检测数据集

qq_35576225的博客

05-21

4854

伪造语音检测数据集

目标检测之牛仔行头检测（上）—— 读取coco数据集并转换为yolo数据格式，以YOLOV5为baseline训练并提交结果

lzzzzzzm的博客

09-09

3991

Pytorch机器学习（八）——利用TORCHVISION.DATASETS和pycocotools读取coco数据集并可视化目录 Pytorch机器学习（八）——利用TORCHVISION.DATASETS和pycocotools读取coco数据集并可视化前言一、数据集格式二、利用pycocotools以及torchvision.datasets读取数据集 结果前言 coco数据集网上介绍比较多，这里就不介绍了，我这次用的是沐神举办的牛仔行头检测比赛提供的数据集。

数据集的重要性——常见公开数据集及如何获取和处理数据

04-01

2869

在人工智能（AI）和机器学习（ML）领域，数据集是模型训练的核心。一个高质量的数据集不仅能够提升模型的性能，还能直接决定算法的最终效果。本文将介绍数据集的重要性、常见的公开数据集来源，以及如何获取和处理这些数据。

python读取excel内容

qq_35576225的博客

11-28

349

import xlrd import xlwt def read_excel(): # 打开文件 workBook = xlrd.open_workbook('E:/迅雷下载/DS_10283_3336/LA/LA/ASVspoof2019_LA_cm_protocols/ASVspoof2019.LA.cm.dev.trl.xlsx'); # 1.获取sheet的名字 # 1.1 获取所有sheet的名字(list类型) allSheetNames = wor.

ASVspoof2019_keras.zip_人工智能/神经网络/深度学习_Python__人工智能/神经网络/深度学习_Python_

08-09

一个基于kera的resnet神经网络的baseline

二抽取代码MATLAB-ASV-anti-spoofing-with-Res2Net:论文的实施：具有Res2Net架构的重播和合成语音检测（

05-26

二摘代码MATLAB ASV-Res2欺骗与Res2Net 该存储库提供了本文的实施：（ICASSP 2021）。系统架构 ResNet块整体模型架构主要结果在ASVspoof2019 PA和LA数据集上的系统性能。（PA和LA的输入功能分别是Spec和LFCC。） SE-Res2Net50的ASVspoof2019 PA（左）和LA（右）的系统性能具有不同的声学功能。依存关系 Python和软件包此代码已在带有PyTorch 1.6.0的Python 3.7上进行了测试。其他软件包可以通过以下方式安装： pip install -r requirements.txt 卡尔迪这项工作使用Kaldi提取功能，您需要在运行我们的脚本之前进行安装。的MATLAB 这项工作中采用的LFCC功能是通过ASVspoof2019组织者专有的MALTAB代码提取的。 数据集 这项工作正在进行，可以通过下载。它由两个子集组成，即用于重放攻击的物理访问（PA）和用于合成语音攻击的逻辑访问（LA）。开始你的项目该存储库主要由两部分组成：（i）特征提取和（ii）系统训练和评估。特征

Speaker-Anti-Spoofing-Classifiers:扬声器防欺骗检测的基准和分类器

05-03

说话者反欺骗分类器该存储库使用pytorch 1.0+和python 3.6+中的神经网络提供了基本的说话人反欺骗系统。 Python要求是： pandas==0.25.3 tqdm==4.28.1 torch==1.3.1 matplotlib==3.1.1 numpy==1.17.4 fire==0.2.1 pytorch_ignite==0.2.1 h5py==2.10.0 six==1.13.0 adabound==0.0.5 ignite==1.1.0 librosa==0.7.1 metrics==0.3.3 pypeln==0.1.10 PyYAML==5.2 scikit_learn==0.22 此外，要下载数据，您将需要wget 。评估脚本直接取自ASVspoof2019挑战的基准，请参见 数据集 用于欺骗检测的最广泛使用的数据集（当前）是：涵盖逻辑和物理攻

音频数据集的加载

weixin_42474594的博客

05-08

2067

这几天在做一个课程设计，涉及到了需要读取指定文件夹下的音频文件进行相关的训练，一开始在数据集的读取和标签的加载这里花了一些时间，所以这里记录整理一下。 数据集描述这里使用的是asvspoof挑战赛的语音数据集，它是分为了bonfied和spoof两种，还有不同的欺骗类型。这里首先给出数据集的标签文件格式：可以看到第五列就是它对应的类型标签，当然如果你做的分类问题不是判断是欺骗语音还是真实语音，...

复现 ASVspoof 2021 baseline RawNet2

Haulyn5的博客

06-24

8505

RawNet2 是 ASVspoof 2021 的几种基线方法之一。记录复现过程。复现成功。在 21 LA eval 上得到 9.5%的 EER。官方 repo：2021/LA/Baseline-RawNet2 at main · asvspoof-challenge/2021 · GitHubASVspoof 2021 Baseline Systems.

语音欺骗检测研究与分析

fzq0625的博客

11-26

1285

摘　要：语音作为一种常用的生物特征，往往会被用于通过性安全认证。随之而来的就是ASV 系统安全问题，攻击者会试图通过伪装成另一个已注册说话人的声音来通过 ASV 系统的检测。随着 AI 的发展，使用语音合成和语音转换等手段后的欺骗攻击都可以呈现出其他特定说话人的高质量、可信的语音信号，从而对 ASV 构成威胁。与欺骗攻击相对应，语音欺骗检测是一种识别防御技术，国内外相关人员进行了最新的研究。基于此，介绍了最前沿挑战的欺骗检测技术，并对这些技术的局限性和未来进行分析。内容目录：1　语音欺骗攻击2　语音欺骗检测

PyTorch：train模式与eval模式的那些坑