2006 NIST Spoken Term Detection Development Set数据集介绍,官网编号LDC2011S02
2006 NIST Spoken Term Detection Development Set(LDC2011S02)是 NIST 首届口语术语检测(STD,关键词检索)评测的官方开发集,专为系统开发、参数调优与预评测设计,与评测集LDC2011S03配套。
一、核心基本信息
项目 详情
官方全称 2006 NIST Spoken Term Detection Development Set
LDC 编号 LDC2011S02
发布机构 NIST(评测设计)、LDC(数据分发)
发布时间 2011 年
配套数据 2006 STD 评测集(LDC2011S03)、DryRun 预评测子集
核心任务 口语术语检测(Spoken Term Detection,STD):在语音中定位查询词 / 短语的时间戳
数据来源 NIST Rich Transcription(RT)系列评测语料
NLP语料共享、LDC语料https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg
