当前位置：首页 > news >正文

Focal Loss 是什么？有什么用？

news 2026/3/27 3:39:00

Posted on 2026-03-09 10:03 steve.z 阅读(0) 评论(0) 收藏举报

Focal Loss 的定义和用途

Focal Loss 是一种改进的损失函数，专门用于解决类别不平衡问题和区分难易样本的问题。它在目标检测、实例分割等任务中广泛应用。

标准交叉熵损失函数存在两个主要缺陷：

类别不平衡：当正样本和负样本数量差异很大时，多数类样本会主导损失函数，使模型偏向预测多数类。
无法区分难易样本：交叉熵损失对所有样本一视同仁，包括模型已经能够正确分类的"简单样本"，这些简单样本会淹没真正需要关注的"困难样本"（模型预测错误的样本）。

γ 是聚焦参数（focusing parameter），用于控制对困难样本的关注程度。

Focal Loss 的公式包含一个调制因子 (1 - p_t)^γ，其中 p_t 是模型对正确类别的预测概率：

γ 值	效果
γ = 0	Focal Loss 等价于标准交叉熵损失，没有任何聚焦效果
γ = 1	轻微的聚焦效果，对困难样本的强调较弱
γ = 2	中等聚焦效果，原论文推荐值，在实践中效果最好
γ > 2	强聚焦效果，简单样本被严重降权，模型更专注于困难样本

假设 γ = 2，对于两个预测概率分别为 0.9（简单样本）和 0.6（困难样本）的情况：

简单样本的损失被降低了 350 倍，使模型能够将更多注意力集中在困难样本上。

α 是类别权重参数，用于处理类别不平衡问题。

它为正类（前景）和负类（背景）分配不同的权重：

通常 α 的值在 0.25 或 0.5 之间，具体取决于类别的不平衡程度。

实际应用中，通常使用同时包含 α 和 γ 的平衡版本：

FL(p_t) = -α · (1 - p_t)^γ · log(p_t)

其中：