当前位置：首页 > news >正文

从医疗诊断到金融风控：混淆矩阵与F1分数在实际业务中到底怎么用？

news 2026/7/26 3:40:19

从医疗诊断到金融风控：混淆矩阵与F1分数在实际业务中到底怎么用？

在医疗诊断中，一个错误的阴性预测可能导致患者错过最佳治疗时机；而在金融风控中，一个错误的阳性预测可能让优质客户被拒之门外。这种业务场景的极端差异，正是机器学习模型评估指标选择的精髓所在——没有放之四海而皆准的"最佳指标"，只有与业务目标深度绑定的"最适指标"。

混淆矩阵作为模型预测结果的"显微镜"，通过TP（真阳性）、FP（假阳性）、FN（假阴性）、TN（真阴性）四个象限，将抽象的算法性能转化为可量化的业务影响。而F1分数作为精准率（Precision）与召回率（Recall）的调和平均数，则在"宁可错杀"与"宁可放过"的二元对立中寻找平衡点。本文将结合医疗、金融、电商等领域的真实决策场景，揭示如何根据业务成本矩阵动态调整模型阈值。

1. 混淆矩阵：业务风险的量化镜

1.1 四象限的业务解读

每个预测结果都对应着不同的业务代价：

TP（真阳性）：正确识别的欺诈交易/患病病例
FP（假阳性）：误判的正常交易/健康人群（Ⅰ类错误）
FN（假阴性）：漏网的欺诈交易/患病病例（Ⅱ类错误）
TN（真阴性）：正确放行的正常交易/健康人群

from sklearn.metrics import confusion_matrix # 医疗诊断场景（阈值=0.3） y_true = [1, 0, 1, 0, 1] y_pred = [1, 1, 0, 0, 1] print(confusion_matrix(y_true, y_pred)) # 输出：[[1 1] # TN=1, FP=1 # [1 2]] # FN=1, TP=2

1.2 行业特异的代价矩阵

不同行业对错误的容忍度截然不同：

行业	FP代价	FN代价	典型阈值策略
金融反欺诈	客户体验下降	资金损失	高精准率（低FP）
疾病筛查	过度医疗成本	生命健康风险	高召回率（低FN）
电商推荐	无效曝光	错过商机	平衡F1分数

提示：构建代价矩阵时，需财务、风控、医疗等多部门协同确定各象限的货币化成本

2. F1分数的动态平衡术

2.1 精准率与召回率的博弈

精准率= TP/(TP+FP)："抓对"的比例
"我们标记的欺诈交易中，有多少是真正的欺诈？"
召回率= TP/(TP+FN)："抓全"的比例
"所有真正的欺诈交易，我们抓住了多少？"

# 阈值调整对指标的影响示例 from sklearn.metrics import precision_recall_curve import matplotlib.pyplot as plt probs = [0.1, 0.4, 0.7, 0.6, 0.3] labels = [0, 1, 1, 0, 1] precisions, recalls, thresholds = precision_recall_curve(labels, probs) plt.plot(thresholds, precisions[:-1], label='Precision') plt.plot(thresholds, recalls[:-1], label='Recall') plt.axvline(x=0.5, color='r', linestyle='--') plt.legend()

2.2 场景化的F1优化

反欺诈系统：通过代价敏感学习加权

# 设置类别权重（FN成本是FP的10倍） model = LogisticRegression(class_weight={0:1, 1:10})

癌症筛查：采用渐进式验证流程
1. 初筛模型：极高召回率（容忍FP）
2. 复核模型：极高精准率（消除FP）

3. 阈值工程的实战策略

3.1 基于业务目标的阈值搜索

from sklearn.metrics import f1_score def find_optimal_threshold(y_true, probs, cost_fp=1, cost_fn=1): thresholds = np.linspace(0, 1, 100) best_score = -np.inf best_thresh = 0.5 for thresh in thresholds: y_pred = (probs >= thresh).astype(int) f1 = f1_score(y_true, y_pred) # 引入业务代价调整 cm = confusion_matrix(y_true, y_pred) adjusted_score = f1 - cost_fp*cm[0,1] - cost_fn*cm[1,0] if adjusted_score > best_score: best_score = adjusted_score best_thresh = thresh return best_thresh