2008 NIST Speaker Recognition Evaluation Training Set Part 1数据集介绍,官网编号LDC2011S05
2008 NIST Speaker Recognition Evaluation Training Set Part 1(LDC2011S05)是 NIST SRE 2008 说话人识别评测的核心训练集第一部分,聚焦文本无关说话人确认 / 检测任务,覆盖多场景、多信道与多时长训练条件,是构建说话人模型的基础数据。
一、核心基本信息
项目 详情
官方全称 2008 NIST Speaker Recognition Evaluation Training Set Part 1
LDC 编号 LDC2011S05
发布机构 NIST(评测)、LDC(分发)
发布时间 2011 年
配套数据 SRE 2008 训练集 Part 2(LDC2011S07)、测试集(LDC2011S08)、评测方案
核心任务 文本无关说话人确认(Verification)、说话人检测(Detection)
数据来源 LDC Mixer 3、Mixer 4、Mixer 5 项目
总时长 约 1,200 小时
语言 美式英语(唯一语言)
说话人规模 约 3,200+ 说话人(男女均衡)
NLP语料共享、LDC语料https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg
