人工智能应用-机器听觉:13. 辨认 VS 确认
基于说话人向量,可以实现两种基本任务:(1)声纹确认(Verification):判断两个发音片段是否来自同一个人;(2)声纹辨认(Identification):在一组候选人中找出某段语音属于谁。
如图 所示,若待测语音的向量与“仁苗”的向量最相近,则在所有可能候选中最有可能是“仁苗”(声纹辨认)。如果假设待测者就是“仁苗”,只需比较两者向量的距离是否足够近(低于某阈值)即可完成身份确认(声纹确认)
声纹辨认与确认示意图
基于说话人向量,可以实现两种基本任务:(1)声纹确认(Verification):判断两个发音片段是否来自同一个人;(2)声纹辨认(Identification):在一组候选人中找出某段语音属于谁。
如图 所示,若待测语音的向量与“仁苗”的向量最相近,则在所有可能候选中最有可能是“仁苗”(声纹辨认)。如果假设待测者就是“仁苗”,只需比较两者向量的距离是否足够近(低于某阈值)即可完成身份确认(声纹确认)
声纹辨认与确认示意图