SPIDRE(Speaker Identification and Retrieval)是 LDC 发布的电话语音说话人识别基准数据集,编号 LDC94S15,1994 年发布,源自 Switchboard‑I 子集,专为研究话机差异下的说话人识别 / 验证设计,含 45 名目标说话人、380 个单边通话段,是早期电话信道说话人研究的核心基准。以下从核心信息、数据与标注、设计特点、应用与获取等方面展开。
一、核心基础信息
| 项目 | 详情 |
|---|---|
| 全称 | Speaker Identification and Retrieval (SPIDRE) Corpus |
| 发布机构 | 美国 LDC,1994 年发布,编号 LDC94S15,2 张 CD-ROM(约 1.2GB) |
| 数据来源 | Switchboard‑I 电话对话语料库子集,含 5 分钟固定时长的座机通话,覆盖多种话机类型 |
| 核心规模 | 45 名目标说话人,每人 4 段对话(2 段同话机 + 2 段不同话机);含 380 个单边通话段(目标 180 段 + 非目标 200 段),每段约 5 分钟 |
| 语音特性 | 电话信道(混合话机),单声道,SPHERE 格式,适配文本无关说话人识别场景 |
| 获取方式 | LDC 授权获取,按 LDC 使用协议分发 |
二、数据内容与标注体系
- 核心数据结构
- 目标说话人:45 人,每人含 4 段对话 ——2 段来自同一话机、2 段来自另外 2 种不同话机,每段与不同非目标配对。
- 非目标说话人:含 180 段目标配对非目标 + 100 通额外通话的 200 段非目标,覆盖多样说话人分布。
- 音频:固定 5 分钟 / 段,电话信道采集,含话机类型元数据,适配信道鲁棒性研究。
- 关键标注
- 边界与说话人标注:精确标注单边语音边界、说话人 ID,区分同时说话段,支持自动定位目标语音。
- 话机元数据:标注每段对应的话机类型,用于研究话机差异对识别性能的影响。
- 转录与对齐:含对话文本转录与语音‑文本强制对齐文件,便于语音片段定位与特征提取。
NLP语料共享、LDC语料
https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

被折叠的 条评论
为什么被折叠?



