【困惑度 计算和可视化】
困惑度(Perplexity)是语言模型评估中一个非常核心的指标,本质上是衡量模型对一段文本“有多不确定”。
一、定义(从概率角度)
给定一个序列 ( w_1, w_2, …, w_N ),语言模型会给出条件概率:
P(w1,w2,...,wN)=∏i=1NP(wi∣w1,...,wi−1)P(w_1, w_2, ..., w_N) = \prod_{i=1}^{N} P(w_i \mid w_1, ..., w_{i-1})P(w
困惑度(Perplexity)是语言模型评估中一个非常核心的指标,本质上是衡量模型对一段文本“有多不确定”。
给定一个序列 ( w_1, w_2, …, w_N ),语言模型会给出条件概率:
P(w1,w2,...,wN)=∏i=1NP(wi∣w1,...,wi−1)P(w_1, w_2, ..., w_N) = \prod_{i=1}^{N} P(w_i \mid w_1, ..., w_{i-1})P(w