机器学习评价指标之转换化为二分类任务
转换化为二分类任务
另一种常见的处理方法是转化为二分类任务,分别有两种策略:一对多策略与一对一策略。
- 一对多策略(One-vs-Rest,OvR)
在 OvR 策略中,对每个类别会训练一个独立的二分类模型。每个模型被训练来区分一个特定的类别与其他所有类别的组合。
训练过程中,每个类别的模型将其正样本标记为正类,而其他所有类别的样本标记为负类。
在预测时,对于一个新样本,每个模型都会给出一个预测概率或类别标签。最终,样本被分配给具有最高预测概率的类别。
- 一对一策略(One-vs-One,OvO)
相比之下,OvO 策略更为复杂。在这种策略下,每两个不同的类别之间都训练一个独立的二分类模型。
例如,如果有 N 个类别,那么需要训练 N(N-1)/2 个模型。训练过程中,每个模型的目标是将两个特定的类别区分开。
在预测时,每个模型都对样本进行预测,得到 N(N-1)/2 个预测结果。最终,通过对所有模型的预测结果进行投票或者采取某种规则来决定样本所属的类别
- 两种策略的比较
OvR 策略的优势在于训练速度相对较快,因为每个模型只需处理一个类别。然而,它可能会受到类别不平衡问题的影响,因为每个模型的样本分布可能不同。
OvO 策略需要训练更多的模型,但它对于类别不平衡的情况更加稳健,因为每个模型只关注两个类别,样本分布相对平衡。
在预测速度上,OvR 策略需要计算所有模型的预测结果,而 OvO 策略只需要计算相关类别之间的模型预测结果。
