SPIDRE数据集介绍,官网编号LDC94S15

SPIDRE(Speaker Identification and Retrieval)是 LDC 发布的电话语音说话人识别基准数据集,编号 LDC94S15,1994 年发布,源自 Switchboard‑I 子集,专为研究话机差异下的说话人识别 / 验证设计,含 45 名目标说话人、380 个单边通话段,是早期电话信道说话人研究的核心基准。以下从核心信息、数据与标注、设计特点、应用与获取等方面展开。


一、核心基础信息

项目详情
全称Speaker Identification and Retrieval (SPIDRE) Corpus
发布机构美国 LDC,1994 年发布,编号 LDC94S15,2 张 CD-ROM(约 1.2GB)
数据来源Switchboard‑I 电话对话语料库子集,含 5 分钟固定时长的座机通话,覆盖多种话机类型
核心规模45 名目标说话人,每人 4 段对话(2 段同话机 + 2 段不同话机);含 380 个单边通话段(目标 180 段 + 非目标 200 段),每段约 5 分钟
语音特性电话信道(混合话机),单声道,SPHERE 格式,适配文本无关说话人识别场景
获取方式LDC 授权获取,按 LDC 使用协议分发

二、数据内容与标注体系

  1. 核心数据结构
    • 目标说话人:45 人,每人含 4 段对话 ——2 段来自同一话机、2 段来自另外 2 种不同话机,每段与不同非目标配对。
    • 非目标说话人:含 180 段目标配对非目标 + 100 通额外通话的 200 段非目标,覆盖多样说话人分布。
    • 音频:固定 5 分钟 / 段,电话信道采集,含话机类型元数据,适配信道鲁棒性研究。
  2. 关键标注
    • 边界与说话人标注:精确标注单边语音边界、说话人 ID,区分同时说话段,支持自动定位目标语音。
    • 话机元数据:标注每段对应的话机类型,用于研究话机差异对识别性能的影响。
    • 转录与对齐:含对话文本转录与语音‑文本强制对齐文件,便于语音片段定位与特征提取。

NLP语料共享、LDC语料https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值