SPIDRE数据集介绍，官网编号LDC94S15

原创已于 2025-12-26 11:08:54 修改 · 314 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #java #算法 #数据结构

于 2025-12-26 11:05:16 首次发布

SPIDRE（Speaker Identification and Retrieval）是 LDC 发布的电话语音说话人识别基准数据集，编号 LDC94S15，1994 年发布，源自 Switchboard‑I 子集，专为研究话机差异下的说话人识别 / 验证设计，含 45 名目标说话人、380 个单边通话段，是早期电话信道说话人研究的核心基准。以下从核心信息、数据与标注、设计特点、应用与获取等方面展开。

一、核心基础信息

项目	详情
全称	Speaker Identification and Retrieval (SPIDRE) Corpus
发布机构	美国 LDC，1994 年发布，编号 LDC94S15，2 张 CD-ROM（约 1.2GB）
数据来源	Switchboard‑I 电话对话语料库子集，含 5 分钟固定时长的座机通话，覆盖多种话机类型
核心规模	45 名目标说话人，每人 4 段对话（2 段同话机 + 2 段不同话机）；含 380 个单边通话段（目标 180 段 + 非目标 200 段），每段约 5 分钟
语音特性	电话信道（混合话机），单声道，SPHERE 格式，适配文本无关说话人识别场景
获取方式	LDC 授权获取，按 LDC 使用协议分发

二、数据内容与标注体系

核心数据结构
- 目标说话人：45 人，每人含 4 段对话 ——2 段来自同一话机、2 段来自另外 2 种不同话机，每段与不同非目标配对。
- 非目标说话人：含 180 段目标配对非目标 + 100 通额外通话的 200 段非目标，覆盖多样说话人分布。
- 音频：固定 5 分钟 / 段，电话信道采集，含话机类型元数据，适配信道鲁棒性研究。
关键标注
- 边界与说话人标注：精确标注单边语音边界、说话人 ID，区分同时说话段，支持自动定位目标语音。
- 话机元数据：标注每段对应的话机类型，用于研究话机差异对识别性能的影响。
- 转录与对齐：含对话文本转录与语音‑文本强制对齐文件，便于语音片段定位与特征提取。

NLP语料共享、LDC语料https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。