1.IV值(信息价值):分箱后变量的预测能力
IV值计算过程:
1.计算每个分箱的WOE(证据权重)
2.WOE和分箱的样本占比计算IV



2.卡方值(Chi-Square):衡量分箱的“统计显著性”
卡方分箱(风控建模) 范围 取值范围:[0, +∞) 合并相邻分箱时,卡方值越小说明分布越相似,需迭代合并至阈值以下。
逻辑回归:保留高卡方,强业务特征
黑盒XGBoost,特征重要性大于卡方值
卡方检验判断 分箱后的目标变量
卡方值越大,分箱后变量和目标变量关联性越强

1.IV值(信息价值):分箱后变量的预测能力
IV值计算过程:
1.计算每个分箱的WOE(证据权重)
2.WOE和分箱的样本占比计算IV



2.卡方值(Chi-Square):衡量分箱的“统计显著性”
卡方分箱(风控建模) 范围 取值范围:[0, +∞) 合并相邻分箱时,卡方值越小说明分布越相似,需迭代合并至阈值以下。
逻辑回归:保留高卡方,强业务特征
黑盒XGBoost,特征重要性大于卡方值
卡方检验判断 分箱后的目标变量
卡方值越大,分箱后变量和目标变量关联性越强
